Vademecum SEO

Premessa: Questo vademecum non ha alcuna pretesa di affermarsi come guida su come posizionare bene il proprio sito su google ma è un articolo ispirato ad una pagina in lingua inglese probabilmente già noto ai più esperti . (www.vaughns-1-pagers.com/internet/google-ranking-factors.htm)
Ho pensato quindi di prendere spunto dai singoli temi, tradurre alcune parti e aggiungere e condividere delle considerazioni personali su degli aspetti che per molti possono sembrare banali, ma possono essere rilevanti per chi si affaccia da poco in questo universo.
In questo articolo si parlerà maggiormente dei fattori on-page ossia l’insieme di quei parametri che sono controllabili dal webmaster a scopo di migliorare il posizionamento. Proprio per questo motivi sono considerati in maniera sempre minore da Google, per limitare abusi che causano l’inquinamento delle Serp e perdita quindi di qualità.

1) Keyword nell’url e nel dominio: La parole più a sinistra hanno rilevanza maggiore.
L’influenza del nome a dominio è ridotta a causa degli abusi dei cybersquatter.
La verà utilità di usare delle keyword nel nome a dominio sta nel fatto che i link spontanei al nostro sito conterranno con molta probabilità le keyword di nostro interesse nell’anchor.

2) Keyword nel tag title: E’ abbastanza rilevante questo tag, ma non bisogna eccedere nella lunghezza.
Poche parole ma buone e correlate all’argomento reale trattato. Le parole più a sinistra hanno rilevanza maggiore.
Google usa questo tag come titolo nelle serp, quindi deve essere concepito in maniera appetibile principalmente per un eventuale utente e non al motore di ricerca.
I cambi frequenti e totali del tag title sono dannosi, è bene avere un tag title stabile nel tempo poichè conferma l’identità e il contenuto della pagina.
E’ buona norma inoltre differenziare il title per ogni pagina, indicando in due/tre parole ciò che la pagina mostra all’utente. E’ sconveniente indicare il nome del dominio nel title.
Piccole modifiche al title una tantum non comportano cali di posizione.
Molti affermano che il 50% dei fattori di posizionamento di un sito siano determinati da un buon tag title.

3) Keyword nel meta tag Description: Anche qui non bisogna eccedere nella lunghezza, Google utilizza questo tag come breve descrizione nelle serp.

4) Keyword nel meta tag “keyword”: Google ignora questo meta tag, anzi se si usano parole non corrispondenti al corpo della pagina è probabile che possa essere considerato spam. Altri motori minori leggono il meta tag “keyword”.
Sconsigliato da utilizzare se non si è certi di un corretto utilizzo.

5) Densità di parole chiavi nel corpo della pagina: Dopo recenti aggiornamenti agli algoritmi di Google la densità non ha più il peso di una volta, ma è comunque un fattore incisivo per tematizzare la pagina. E’ bene però comprendere che una eccessiva ripetizione della parola può insospettire i motori. Non c’è una soglia ben definita per rischiare penalizzazioni. Si consiglia di rileggere il testo e verificare se in italiano il discorso è fluido, lineare e non troppo ripetitivo nel concetto.

6) Uso del tag html H1,H2,H3: E’ utile per posizionare bene una keyword o una keyfrase, ma una pagina con molti tag Hx pare che venga classificata come spam se non sufficientemente linkata.
Leggere informazioni aggiuntive in post : http://www.giorgiotave.it/forum/laboratorio-seo/15828-far-indicizzare-una-pagina-finora-largamente-snobbata-da-google.html

7) Grassetto: Il tag [b] e [strong] sono trattati allo stesso modo dal motore di ricerca, la differenza sta nel fatto che [b] è il vecchio tag e [strong] è definito negli standard w3c.
L’influenza sulla indicizzazione di questo tag è talmente minima che è meglio grassettare ignorando l’ottimizzazione seo.

8) Adiacenza di keyword: due parole chiavi adiacenti sono ben assimilate nelle serp, ad esempio se fittiamo appartamenti a milano, è utile concentrarsi sulla scrittura del testo pensando ad un accostamento di questi termini, questo vale in qualunque area: nel body, nel title, etc.

9) Ordine delle keyword: la keyword “bed and breakfast” non avrà serp identiche a “breakfast and bed”, quindi è utile studiare quale sia l’ordine più consono.

10) Posizione delle keyword nella pagina: Più la keyword è in alto nella vostra pagina e più è visibile quindi maggiore sarà la sua rilevanza.
Per questo è preferibile realizzare pagine usando i css al posto delle tabelle, in modo da gestire la posizione del testo nel codice html indipendentemente dalla visualizzazione all’utente; Ciò nasce dal fatto che gli spider hanno fretta e non sempre leggono tutto il corpo della pagina, ma solo spezzoni, per cui ciò che c’è in alto viene letto prima e si presume che sia più rilevante.

11) Keyword nell’attributo ALT: utile per il posizionamento in google image.

12) Keyword nell’attributo title: Google nelle sue guidelines raccomanda l’utilizzo del tag title (Cito: Assicurati che i tag TITLE e ALT siano descrittivi e precisi), In ogni caso c’è un errore formale nelle guidelines: Propriamente Il tag title è quello in alto a tutto (< title >) mentre per attributo si intende ad esempio [a href="..." mce_href="..."   title="blabla"]
In ogni caso è stato effettuato un test in agosto del 2006 e pare che risulti essere ignorato.
Riferimento al test: http://www.giorgiotave.it/forum/laboratorio-seo/14512-test-indicizzazione-dellattributo-title-dei-link.html

13) Link interni: Una buona struttura interna ad albero in un sito aiuta moltissimo, le pagine interne devono essere raggiungibili con massimo due click di profondità, altrimenti tali pagine vengono considerate poco.
E’ molto utile creare una navigation bar in alto per permettere all’utente di tornare al livello livello precedente senza dover usare il tasto back.
E’ di alta utilità creare una mappa del sito navigabile, con struttura ad albero, utile sia per l’utente che per rendere meno profonde agli occhi del motore alcune sezioni del sito.

14) Sitemap: La Google sitemap, è un file XML letto da google da non confondere con la mappa del sito in html.
Creare una sitemap xml ha una indubbia utilità per aiutare l’attività di crawling dello spider nella navigazione del nostro sito.
La sitemap è consigliata ad esempio per i siti nati da poco, momento delicato in cui lo spider ha ancora una idea incerta della nostra struttura.
La Google sitemap non permette di pilotare lo spider a nostro piacimento, ma è una sorta di consiglio che noi forniamo allo spider.
Tale consiglio deve essere sempre attendibile e veritiero per avere buone chanche.
Bisogna evitare ad esempio di inserire nella sitemap pagine non presenti, o di indicare informazioni fuorvianti.
Se noi informiamo lo spider attraverso la sitemap che ad esempio la frequenza di aggiornamento di una pagina è giornaliera mentre la pagina non varia quasi mai l’interprete della sitemap quando si renderà conto della “bugia” scarterà il nostro consiglio alterando quindi l’attendibilità globale della sitemap.
La sitemap consente di impostare delle priorità a determinate pagine, è consigliabile ad esempio ridurre questo parametro per pagine prive di contenuti utili.
Per gestire la sitemap ed altri parametri utili ai webmaster, Google ha creato una apposita area chiamata: Strumenti per i webmaster.

15) Link esterni: Linkare risorse autorevoli ed “a tema” con il sito è indice di qualità, fa anche intendere che il sito non è un network chiuso (senza esagerare con la quantità).
Non bisogna eccedere nell’aggiunta di link per non disperdere l’informazione che intendiamo fornire. C’è il rischio di essere considerati una link farm o venditori di link.
Linkare siti considerati “cattivi” è molto penalizzante.
Bisogna verificare periodicamente che i link in uscita siano funzionanti, non bannati e che non siano zeppi di link (link farm)
Se date visibilità a siti di contenuto contrario alle policy di google la responsabilità ricade su di voi. Il cattivo vicinato (bad neighborhood) vi pone in una situazione penalizzante per il posizionamento.
Evitare di utilizzare anchor text troppo lunghi.
Evitare di cambiare spesso l’anchor o l’href, si rischia di essere scambiati per venditori di link e Google non ama coloro che influenzano in maniera indiscriminata il pagerank.
Evitare di usare più di 100 link esterni per pagina.

16) Dimensione della pagina: Evitare pagine di dimensioni superiori ai 100k, sia per comodità dell’utente che per gli spider.

17) Uso del trattino nell’url: Il trattino (hypens) Viene utilizzato come separatore di testo; Nel nome di dominio o nel resto dell’url consentono una separazione ottimale, ma bisogna essere cauti; Troppi trattini sono indice di spam (Esempio: a occhio quale delle due url è più probabile che sia visto come spam? 1-http://www.prodottimedici.com/viagra.htm 2- http://www.vendita-viagra-e-cialis.com/prodotti-farmaceutici-a-basso-costo/cheapest-viagra-cialis-sex.htm )
Nel percorso dell’url si possono usare come separatori di parola tutti i simboli (anche la virgola) ad esclusione di questi: & _ * + che a quanto pare non sono influenti nella query di ricerca. Provate ad esempio a cercare su google hotel-roma o hotel roma … la serp è identica, Usando invece l’underscore la query hotel_roma restituisce pochissimi risultati. per cui anche se può sembrare più gradevole sconsiglio l’utilizzo dell’undescore come separatore.

18) Lunghezza dell’url: Come già detto sopra, un url breve viene preferita dai motori e si evita di incappare in filtri antispam.
Google non le ignora, ma non ama di certo le url con troppi parametri: Un parametro specie se non numerico viene letto senza alcun problema.

19) URL Rewrite: E’ molto utile usare il rewrite dell’url per nascondere i parametri e rendere la pagina dinamica simile in tutto ad una pagina statica. Ad esempio i forum con migliaia di post spesso non vengono indicizzati completamente per i troppi parametri. l’url rewrite consente di indicizzare più pagine ed è risaputo che maggiori contenuti = miglior posizionamento.

20) Aggiornamenti frequenti: Google predilige i siti con contenuti sempre aggiornati e crescenti. La frequenza di crawling è proporzionale alla frequenza di aggiornamento della pagina da parte del webmaster, per non rischiare di perdere qualcosa.
Svantaggi: Se la pagina cambia completamente ad ogni passaggio a mio avviso non è tanto positivo, il motore può intuire che non è una risorsa attendibile, ed anche lato utente se non è possibile verificare a breve distanza il contenuto precedente si rischia di demotivare la navigazione nella pagina in oggetto.

21) Età del sito: Conta molto.
Attenzione: non bisogna confondere l’età del dominio con l’età del sito. Il primo è utile a conferire una certa autorevolezza, ma solo se vi è costanza nel mantenere il sito in ottima forma. Se un sito resta under construction per anni, quando lo apriamo non possiamo sperare di avere la stessa autorevolezza di un sito che è in linea realmente da anni. A mio avviso quindi è possibile che se esista un effetto sandbox questo possa sussistere anche in siti anziani di data, ma che hanno subito lunghi periodi di down.

22) Testo nascosto: Non è direttamente penalizzante, ma si rischia un ban in caso di segnalazioni.

23) Redirect in html e in javascript: vengono considerati come sistemi per nascondere delle doorway page: In alcuni casi il gioco vale la candela, ma si rischia con molta probabilità il ban del sito da cui parte il redirezionamento.
Il sito di destinazione in linea teorica non dovrebbe subire penalizzazioni se non è correlata in alcun modo alla pagina di origine, poichè ci potrebbe essere la remota possibilità che un competitor stia cercando di danneggiare la nostra immagine e cercare di incastrarci nei confronti del motore.
Il redirect in html si può utilizzare come alternativa client-side al redirect “301 Moved Permanently”, ma per farlo in maniera pulita la pagina origine di redirezione deve essere vuota, perchè evitare di dare l’impressione che nascondiate qualcosa all’utente (doorway page).

24) Doorway page: Anni fa le doorway page erano delle accozzaglie di pagine con migliaia di keyword ripetute non attinenti e lo scopo era quello avere
più visitatori e basta. Con il tempo ci si è evoluti, le doorway page classiche vengono facilmente riconosciute e bannate e necessitano di adattamenti
per fornire risultati. Se avete intenzione di usare questo strumento, è bene sapere che è da evitare assolutamente sul dominio che volete spingere.
Mettendolo su altri domini o spazi gratuiti il rischio è quello di perdere la doorway e non il dominio principale.
La tecnica è decisamente poco corretta dal punto di vista del motore, perchè inquina le serp, ma se usata senza esagerare e con keyword a tema del sito è un buon
sistema per posizionarsi.

25) Keyword stuffing: la ripetizione di una singola keyword è da evitare poichè facilmente riconoscibile.

26) Uso dei Frame: non consente una appropriata interpretazione della struttura del sito, sconsigliato ai fini del posizionamento.

27) Uso indiscriminato del tag rel=”nofollow”: A mio avviso il nofollow deve essere usato solo nelle aree in cui si rischia il comment spam.
Un sito ha l’onere morale di dare un giudizio a chi sta linkando, altrimenti se tutti usassero il nofollow, l’algoritmo del pagerank crollerebbe, quindi se un sito ha tutte le pagine nofollow secondo me non è del tutto positivo.

28) Contenuti duplicati: nelle linee guida di google è esplicitamente chiesto di evitare contenuti duplicati. E’ risaputo che google ha un brevetto per verificare se un testo o porzioni di quest’ultimo è duplicato.
Purtroppo non ha modo di comprendere per bene la fonte reale, quindi può capitare che un testo da voi scritto viene scavalcato da un sito più autorevole che ricopia la vostra informazione.

29) Scambi di link reciproci: da evitare soprattutto se provenienti di siti non a tema: Non si rischia il ban, ma i link in uscita perderanno valore.
Se il sito è appena nato il link reciproco anche se sembra più facile da ottenere non è ben visto, perchè si può dedurre che lo scambio è stato creato ai fini del posizionamento.
Nella fase iniziale di un sito è consigliabile registrarsi a molte directory free che passano pagerank e che non richiedono di ricambiare il link.

30) Acquisto di text link:
Un tempo la pubblicità su altri siti aveva lo scopo di renderci visibili all’utente, ora con la febbre del pagerank è nato il fenomeno dell’acquisto di link testuali puri.
Utile nel caso che non riusciate ad ottenere link spontanei ma bisogna avere alcune accortenze:
Se le pagine da cui venite linkati sono molto forti e il tema o la lingua è diversa dalla vostra vi è la possibilità che il tema del vostro sito agli occhi del vostro sito verta verso altre rotte,
andandovi a penalizzare indirettamente per le keyword che invece desiderate posizionare.
Quindi è sconsigliato comprare link esteri per un sito in lingua italiana.
Esistono molti siti in giro per l’acquisto di link (anche su ebay), ma è solo con una certa esperienza che si riesce a trovare il link adatto al prezzo giusto.
Molti webmaster appena arrivati sulla soglia del pagerank 5 vogliono subito monetizzare e vi propongono link a basso costo (circa 4-5 euro al mese)
su siti zeppi di link.
Vi sono due articoli molto interessanti che trattano più in dettaglio il tema degli inbound links:
http://www.kerouac3001.com/links-come-passaggio-dinformazione-6.htm
http://www.marketingroutes.com/2006/10/28/inbound-links-che-la-forza-sia-con-voi/
——————————————-

Non mi ritengo di certo un guru della materia per cui se ho commesso degli errori sono gradite correzioni e commenti al riguardo.
Grazie,
Giuseppe Liguori


liguori | seo napoli | seo roma | seo | liguori

Fare business con il web

Vorrei segnalare a colore che sono interessati al mondo del web marketing un evento virtuale live con la partecipazione di Leonardo Bellini esperto di marketing e tecnologie digitali, autore del libro “Fare business con il web“.
L’autore risponderà alle domande degli utenti attraverso il GT Forum di Giorgio Taverniti.
L’evento si terrà il giorno 11 Novembre 2006 dalle ore 15.00 e le tematiche trattate saranno:

  • - Cosa si intende per web analytics e come questa materia può cambiare radicalmente il modo di fare web marketing.
  • - Quali sono i fattori critici di successo per un progetto internet.
  • - Quali elementi vengono considerati prima di procedere.
  • - Cosa si aspetta il cliente dal sito/campagna di marketing/ppc e posizionamento proposta.
  • - In che misura internet fa parte del marketing mix di un’azienda.
  • - Esperienze e casi di studio.

Per altre informazioni visitate il post Live con Leonardo Bellini

Giuseppe Liguori


liguori | seo napoli | seo roma | seo | liguori

Navigare con gli occhi del Quality Rater.

Da un po’ di tempo Google ha istituito una nuova figura, il Quality Rater.
In pratica degli omini pagati navigano in giro per la rete da casa loro con determinati compiti tipo
assegnare rilevanza a determinati risultati di ricerca, scoprire lo spam, etc.

Alcune tecniche poco corrette utilizzate dai novelli SEO è quella di utilizzare del testo nascosto
per ingannare i motori di ricerca e nascondere l’informazione all’utente.
Questa tecnica è contraria alle guidelines di Google e se segnalata da qualcuno viene punita con il ban.

Tralasciando il fatto che in alcuni casi anche io mi comporto da novellino e tuttora utilizzo in qualche sito alcuni link nascosti (non in questo sito),
mi è nata l’esigenza di controllare se alcuni pagine web hanno delle componenti nascoste tramite css e vedere quindi il sito come apparirebbe ad un quality rater.
Però mi risulta scomodo andare ogni volta nelle opzioni di internet explorer e quindi ho creato uno scriptino in vbs da mettere in avvio veloce per disattivare e riattivare i css in automatico e soprattutto al volo, senza dover ricaricare il browser.

L’unico problema è che ho Norton Antivirus che mi chiede di autorizzare lo script vbs e l’unico modo per evitarlo e disattivare il blocco degli script. Si lo so cosa state pensando, uso Internet Explorer e Norton, ma l’abito non fa il monaco è sono poco propenso a cambiare le abitudini.

Se ho tempo rilascerò una versione compilata in vb.net (comprensiva di sorgenti) in modo da evitare il problema del blocco degli script e magari con la possibilità di installare un comodo pulsantino nella barra degli strumenti di Internet explorer. Un’altra feature interessante da implementare è la disattivazione al volo di Javascript per visitare le doorway pages senza essere redirezionati.

Nel file zip in allegato è compreso un file exe (compreso di sorgente in vb) che ho preso da un sito internet e che serve appunto per emulare un desktop refresh (quello che avviene premendo F5 sul desktop), tale file va messo nella stessa directory del vbs, successivamente create un link al file .vbs e mettetelo nei collegamenti di avvio veloce accanto al menù start o dove meglio preferite.

Ogni commento/suggerimento è ben accetto.

Scarica CssDisabler

Liguori Giuseppe


liguori | seo napoli | seo roma | seo | liguori

eliminare il dithering dalle gif salvate in vb.net

Di recente mi è capitato di dover scrivere un testo al volo su delle immagini di un mio sito a scopo di copyright.
Per le jpeg non ho avuto particolari problemi; caricavo l’immagine, convertivo in bitmap e ci lavoravo sopra di grafica e testo con il system.Drawing.Graphics.
Il problema si presenta però con le gif, il salvataggio le rovina in maniera disastrosa, applicando il dithering all’immagine. Leggendo qua e là ho compreso che era un problema di palette e che tramite le GDI+ si poteva ovviare al problema.

Ho quindi trovato un utile riferimento su msdn http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dnaspp/html/colorquant.asp

nella cui pagina vi è un progetto di esempio da scaricare in C#.

L’ho quindi adattato in vb.net, importando la dll ImageManipulation.dll nel mio progetto e usando il seguente codice DOPO aver effettuato tutte le manipolazioni grafiche sull’immagine, prima quindi di inviare l’outputstream all’utente.
In grassetto il codice utile al corretto adattamento dei colori.


Imports System
Imports System.Web
Imports System.Drawing.Imaging
Imports System.Drawing
Imports ImageManipulation

Dim g As System.Drawing.Image = System.Drawing.Image.FromFile(thepath, True)

Dim thisFormat = g.RawFormat
Dim hh As Integer = g.Height
Dim ww As Integer = g.Width

Dim imgOutput As New Bitmap(g, ww, hh)
Dim b As Graphics = Graphics.FromImage(imgOutput)

Dim blackbrush As New SolidBrush(Color.Black)

b.DrawString("testo da scrivere", New Font("arial", 7, FontStyle.Bold), blackbrush, New PointF(6, hh - 25))

If thisFormat.Equals(System.Drawing.Imaging.ImageFormat.Gif) Then

Response.ContentType = "image/gif"

'Questo è il codice aggiunto per eliminare il dithering dalle gif.
Dim quantizer As New OctreeQuantizer(255, 8 )
imgOutput = quantizer.Quantize(imgOutput)
'*********************************************

Else
Response.ContentType = "image/jpeg"
End If

imgOutput.Save(Response.OutputStream, thisFormat)
b.Dispose()
g.Dispose()
imgOutput.Dispose()

Il risultato è davvero ottimo, chissà perchè microsoft non ha pensato di implementare questa feature direttamente nel framework?

Giuseppe Liguori


liguori | seo napoli | seo roma | seo | liguori

I Link nei pdf passano pagerank?

Test di indicizzazione: I pdf passano pagerank?
Data inizio: 23/10/2006 19.30

Lo scopo del test è quello di verificare se i link nei pdf vengono seguiti dagli spider e se quindi di conseguenza passino anche pagerank.

Il pdf con il link è stato creato con Microsoft WORD e convertito con cute pdf.
Se la pagina linkata all’interno sarà indicizzata la prima parte del test avrà esito positivo.

Il passo successivo sarà attendere che il pdf raggiunga un sufficiente Pagerank e verificare se tale potere venga trasferito alla pagina.
Purtroppo per sapere questa informazione bisogna attendere il prossimo export del PR alla toolbar.

Ne approfitto per un ulteriore test: scrivo nel pdf anche un url inesistente senza usare il collegamento ipertestuale per verificare se lo spider passerà comunque a trovarla leggendola solamente. Credo di no, ma meglio verificare.

ATTENZIONE E’ IMPORTANTE NON VISITARE I LINK CONTENUTI NEL PDF PER EVITARE CHE LA TOOLBAR DI GOOGLE CON LA BARRETTA DEL PAGERANK ATTIVATA O ALTRE TOOLBAR POSSANO RENDERE L’URL VISIBILE E COMPROMETTERE QUINDI L’ESITO DEL TEST. E’ INOLTRE IMPORTANTE NON LINKARE L’INDIRIZZO IN ESSO CONTENUTO.

il pdf con i link e’ visionabile a questo indirizzo pdfpagerank Questo file può essere linkato il contenuto no.

Il pdf l’ho linkato in basso sulla home del mio blog ed in questo post, vi comunicherò quando lo spider passerà a trovare il pdf.

A presto,
Giuseppe


liguori | seo napoli | seo roma | seo | liguori

test di indicizzazione parola inesistente nell’anchor text di un link

Sarà banale come test, ma non l’avevo mai testato personalmente.
Volevo verificare quanti link fossero necessari per far indicizzare una pagina su un dominio esterno non linkata da nessuno con un anchor text che non era per nulla contenuto nella pagina di destinazione.
Cronostoria:

09/10/2006 ore 16.40 creata pagina Gedeopo su un dominio esterno con del testo improbabile, la parola Gedeopo non significa nulla, ma mi serviva un termine inesistente su Google per controllare quando la pagina veniva indicizzata.
Successivamente ho linkato su questo blog la pagina Gedeopo usando come anchor text un’altra parola inesistente su Google “fexomeno pip test”. Ho usato tre parole per verificare se la pagina gedeopo una volta indicizzata poteva essere trovata sul motore cercando anche solo fexomeno anzichè la parola intera.

12/10/2006 ore 01.05
La pagina è stata letta dallo spider.

21/10/2006
dopo 12 giorni dalla pubblicazione e dopo 9 giorni dal primo passaggio del crawler la pagina è stata inserita nell’indice di Google.
L’esito del test è quindi risultato positivo: Cercando attualmente su Google sia la parola fexomeno che fexomeno pip test compare la pagina Gedeopo che non contiene assolutamente la parola fexomeno.

Osservazioni: Ho fatto un goo.gle bombing in miniatura, è quindi sufficiente un singolo link per influenzare la ricerca di una pagina di destinazione appartenente ad un dominio esterno.

[UPDATE data 30/10/2006]

Il documento Gedeopo è stato indicizzato su Windows Live Search, ma l’anchor è stato ignorato, cercando fexomeno su Live non compare il documento Gedeopo, c’è da domandarsi se sia volutamente ignorato, oppure con una quantità più elevata di anchor viene assimilato.

Il prossimo test che dovrò fare sarà intitolato: I link nei pdf passano pagerank?


liguori | seo napoli | seo roma | seo | liguori

Progetto SpamReport

Negli ultimi periodi, cercando su Google spesso vi sarà capitato di imbattervi in siti un po’ particolari. I cosiddetti spam engine. Tali siti vengono creati appositamente con lo scopo di inquinare le ricerche e ottenere quindi visite per scopi non buoni, tipo diffusione di virus/malware, abuso di banner payperclick, raccolta di informazioni etc. niente di positivo per l’utenza dunque.

La brutta notizia è che Google non è in grado sempre di identificare tutte le tecniche scorrette utilizzate, che spaziano dal testo nascosto, alla copia di siti o addirittura alla creazione di migliaia di pagine finte contenenti i risultati di ricerche di altri motori.
La buona notizia è che Google ha sguinzagliato un Team molto preparato (composto dai personaggi chiamati quality rater) che gira per la rete e ripulisce i risultati delle ricerche (denominate più in avanti SERP).

Per semplificare il lavoro hanno quindi creato una pagina chiamata spamreport raggiungibile all’url http://www.google.com/contact/spamreport.html, dove chiunque con un buon senso civico può segnalare il cattivo comportamento di taluni siti. La segnalazione si può effettuare con un form in italiano tramite gli Strumenti per webmaster (Google Webmaster Tools) dopo opportuna registrazione.

Da alcuni test effettuati ho notato che alcune pagine di spam vengono rimosse nel giro di 48 ore, mentre altre restano lì per molto tempo. Presumbilmente se un sito viene segnalato da più persone come spam c’è maggiore probabilità che venga notato di più dal team di controllo.

Pensando a questa considerazione ho avuto una idea: Unire le forze per aumentare le segnalazioni.

Stavo pensando di creare una pagina dove gli utenti segnalano le ricerche inquinate da spam come già fa Google per creare un archivio delle Serp inquinate da spam.

La fase successiva è quella operativa, cioè i visitatori del sito visionano l’archivio dello spam e con un click possono inviare la segnalazione di quel sito a google con un form precompilato. Il vantaggio sta nel fatto che molti utenti con ip diversi segnalano lo stesso url a Google rendendolo quindi si spera più “quotato” come spam agli occhi del quality rater di turno e toglie il fastidio di dover aprire l’url di spamreport compilarlo e inviarlo.

L’altra fase è quella di controllo, cioè creare sempre con un automatismo, un elenco dei siti che siamo riusciti a far rimuovere dalle serp ed i tempi di reazione tra la prima segnalazione e la rimozione.

Sarebbe poi simpatico creare una hall of fame, una bella classifica degli utenti più attivi, giusto come premio di consolazione. Inoltre ho altri piccoli accorgimenti per rendere il tutto più appetibile ai webmaster, ad esempio, se uno spam engine ti sta scalando e tu ci fai un tot di segnalazioni, ti regaliamo in una apposita area un link al tuo sito come spinta per superarlo e come premio per l’aiuto fornito.

Io l’idea la rendo pubblica perchè credo che sia un servizio utile, se riesce a farlo prima di me ben venga, anzi più siti del genere esitono e più lo spam subirà una batosta. Io purtroppo non ho molto tempo per seguirla però se qualcuno è interessato a collaborare o se qualcuno ha dei commenti sull’idea per migliorarla o per dirmi schiettamente che è una “cazzata” si facesse avanti.

Giuseppe Liguori


liguori | seo napoli | seo roma | seo | liguori

googlebot non passa?

Spesso può capitare che Google decida improvvisamente di non aggiornare più nel suo indice una singola pagina del vostro sito.
Ciò può capitare ad esempio se per lungo tempo quella pagina non è stata più aggiornata.
I l motore penserà erroneamente che è una pagina che non cambia mai visti gli scarsi aggiornamenti.

Ciò è capitato di recente per un mio sito. Lo spider “googlebot”, non voleva proprio saperne di rileggere quella pagina, quindi di conseguenza non poteva nemmeno verificare che in realtà la pagina era stata modificata totalmente.
La cosa strana è che il sito in questione dispone di una sitemap.xml, che lo spider scarica quotidianamente per cui aveva tutte le capacità per rendersi conto dell’aggiornamento. Evidentemente non funziona sempre così, se noi indichiamo nella sitemap che un sito ha un aggiornamento settimanale e non rispettiamo la cosa, con tutta probabilità riterrà l’informazione da noi fornita poco attendibile e quindi ignorerà l’elemento.

Sono andato quindi per passi: ho linkato la pagina da altri miei siti (un blog su splinder e un altro mio sito), ma evidentemente non erano sufficientemente “forti” da convincere lo spider a ripassare.
Ho anche linkato la pagina nella homepage del sito in questione, ma senza sortire effetti, googlebot non passava più.

Successivamente ho fatto un esperimento, ho creato sul sito una nuova pagina chiamata con un nome simile (ad esempio se la vostra pagina si chiamava “il padrino” io la nuova l’ho chiamata film il padrino).
In questa nuova pagina vuota ho creato un reindirizzamento 301 Moved Permanently sulla pagina che il motore si rifiutava di indicizzare. Successivamente ho rifatto il submit di sitemap con la nuova page.

Analizzando i log dei giorni successivi ho notato che lo spider ha letto la nuova pagina creata e dopo un secondo esatto ha effettuato il passaggio sulla pagina incriminata.
Esempio:

2006-09-27 08:39:27 GET /index.php nome=Film_Il_Padrino 80 – 66.249.65.171 HTTP/1.1 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) – - 301 0 0 425 245 78

2006-09-27 08:39:28 GET /index.php nome=Il_Padrino – 80 – 66.249.65.171 HTTP/1.1 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) – - 200 0 0 5654 247 656

A questo punto era solo questione di tempo, ed infatti dopo circa una settimana la pagina che era bloccata da Agosto ora è correttamente indicizzata su Google.

Considerazioni: Resta da valutare se adesso Google passerà sulla pagina originale autonomamente o lo farà sempre saltando tramite il reindirizzamento 301. Per il momento attendo che lo spider apprenda correttamente questo passaggio e successivamente eliminerò la pagina fittizia dal mio sito. Non so quanto sia corretta questa procedura o se ho scoperto l’acqua calda, nè se sia pericolosa, però credo che fatta una tantum non crei eccessivi problemi.

Giuseppe Liguori


liguori | seo napoli | seo roma | seo | liguori

Elenco fornitori

Volevo segnalarvi una novità made in Ryhab, la società dove lavoro.
si chiama Elenco fornitori ed è un portale b2b (business to business), riservato a tutte le aziende di forniture o di servizi che intendano promuovere il proprio nome e alcuni prodotti gratuitamente. Elenco fornitori non è una classica directory di aziende dove pubblicare il link del proprio sito bensì strumento di lavoro e di interscambio tra diverse aziende.
Iscrivendosi gratuitamente è possibile:
- Creare il proprio profilo aziendale
- Inserire i propri prodotti sul portale
- Inserire eventuali richieste di prodotti/servizi
- Richiedere preventivi alle Aziende iscritte

Allo stato attuale non ci sono ancora molte aziende iscritte poichè è nato da poco, però contiamo molto su questo progetto. Senza aver volontariamente fatto lavoro da seo il sito è “misteriosamente” già ben posizionato per la inflazionata keyword “fornitori”, quindi riceve già molte visite.

Non costa nulla, iscrivetevi se avete una azienda e magari saremmo molto grati se faceste un po’ di passaparola. Grazie.

Giuseppe Liguori.


liguori | seo napoli | seo roma | seo | liguori

Truffe per l’acquisto dei domini.

Oramai si sa, su internet è possibile comprare di tutto, anche dei domini già registrati. Chi ha minime conoscenze da SEO, sa che è possibile trarre profitto da domini già posizionati e con un pagerank modesto per poterli riutilizzare per la rivendita di spazio link o per creare doorway. Indipendentemente dalla correttezza di tale pratica, questo fenomeno esiste.

Cercando di acquistare text link su ebay mi sono imbattuto anche io in inserzioni un po’ sospette. Annunci non italiani che proponevano la vendita di domini con Pagerank 6 a prezzi non troppo elevati. Ho pensato subito che poteva esserci la fregatura e ho fatto delle verifiche.

Le pagine di annunci sono ben realizzate con tanto di link a svariati tool per verificare il ranking del sito. Peccato che molti non sanno che dal 29 settembre Google ha effettuato uno dei periodici aggiornamenti del pagerank. In effetti l’indicatore verde che si vede sulla barretta di google non è per nulla affidabile poichè è una rappresentazione del pagerank aggiornato a due/tre mesi precedenti. Quindi molti domini sono saliti di grado, e molti ovviamente hanno anche perso. E’ il caso ad esempio di domini scaduti e poi ri-registrati. Google azzera il pagerank, ma la barretta verde segnala sempre per i due/tre mesi successivi il valore precedente.

Ho quindi verificato con appositi tool più avanzati come ad esempio questo: http://livepr.raketforskning.com/ che interroga 199 datacenter di google e permette quindi una rapida comparazione del valore del pagerank. Infatti in questi giorni interrogando molti domini con quel tool possiamo osservare che alcuni datacenter non sono ancora sincronizzati e rispondono con il valore precedente e altri con il valore aggiornato.

Tornando quindi agli annunci su ebay, probabilmente l’autore si è reso conto che i suoi domini non valevano più una cicca e ha deciso di sbarazzarsene, omettendo però questa importante informazione del pagerank sfalsato, per cui molti inserzionisti hanno rilanciato offerte da 70/80 euro per un dominio che a mio avviso vale al massimo 5,6 euro, giusto il costo del mantenimento al registrant.

Ho già segnalato la faccenda ad ebay via email un paio di giorni fa, ma non so se agiranno, visto che non è propriamente una truffa in stile classico, in effetti potrebbero considerarlo un incauto acquisto però resta che non è proprio corretto il comportamento di questi utenti.

Questo discorso ovviamente non vale solo per ebay, ma in generale per chi desidera acquistare un dominio “usato”.


liguori | seo napoli | seo roma | seo | liguori
« Pagina precedentePagina successiva »