Navigare con gli occhi del Quality Rater.

Da un po’ di tempo Google ha istituito una nuova figura, il Quality Rater.
In pratica degli omini pagati navigano in giro per la rete da casa loro con determinati compiti tipo
assegnare rilevanza a determinati risultati di ricerca, scoprire lo spam, etc.

Alcune tecniche poco corrette utilizzate dai novelli SEO è quella di utilizzare del testo nascosto
per ingannare i motori di ricerca e nascondere l’informazione all’utente.
Questa tecnica è contraria alle guidelines di Google e se segnalata da qualcuno viene punita con il ban.

Tralasciando il fatto che in alcuni casi anche io mi comporto da novellino e tuttora utilizzo in qualche sito alcuni link nascosti (non in questo sito),
mi è nata l’esigenza di controllare se alcuni pagine web hanno delle componenti nascoste tramite css e vedere quindi il sito come apparirebbe ad un quality rater.
Però mi risulta scomodo andare ogni volta nelle opzioni di internet explorer e quindi ho creato uno scriptino in vbs da mettere in avvio veloce per disattivare e riattivare i css in automatico e soprattutto al volo, senza dover ricaricare il browser.

L’unico problema è che ho Norton Antivirus che mi chiede di autorizzare lo script vbs e l’unico modo per evitarlo e disattivare il blocco degli script. Si lo so cosa state pensando, uso Internet Explorer e Norton, ma l’abito non fa il monaco è sono poco propenso a cambiare le abitudini.

Se ho tempo rilascerò una versione compilata in vb.net (comprensiva di sorgenti) in modo da evitare il problema del blocco degli script e magari con la possibilità di installare un comodo pulsantino nella barra degli strumenti di Internet explorer. Un’altra feature interessante da implementare è la disattivazione al volo di Javascript per visitare le doorway pages senza essere redirezionati.

Nel file zip in allegato è compreso un file exe (compreso di sorgente in vb) che ho preso da un sito internet e che serve appunto per emulare un desktop refresh (quello che avviene premendo F5 sul desktop), tale file va messo nella stessa directory del vbs, successivamente create un link al file .vbs e mettetelo nei collegamenti di avvio veloce accanto al menù start o dove meglio preferite.

Ogni commento/suggerimento è ben accetto.

Scarica CssDisabler

Liguori Giuseppe


liguori | seo napoli | seo roma | seo | liguori

eliminare il dithering dalle gif salvate in vb.net

Di recente mi è capitato di dover scrivere un testo al volo su delle immagini di un mio sito a scopo di copyright.
Per le jpeg non ho avuto particolari problemi; caricavo l’immagine, convertivo in bitmap e ci lavoravo sopra di grafica e testo con il system.Drawing.Graphics.
Il problema si presenta però con le gif, il salvataggio le rovina in maniera disastrosa, applicando il dithering all’immagine. Leggendo qua e là ho compreso che era un problema di palette e che tramite le GDI+ si poteva ovviare al problema.

Ho quindi trovato un utile riferimento su msdn http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dnaspp/html/colorquant.asp

nella cui pagina vi è un progetto di esempio da scaricare in C#.

L’ho quindi adattato in vb.net, importando la dll ImageManipulation.dll nel mio progetto e usando il seguente codice DOPO aver effettuato tutte le manipolazioni grafiche sull’immagine, prima quindi di inviare l’outputstream all’utente.
In grassetto il codice utile al corretto adattamento dei colori.


Imports System
Imports System.Web
Imports System.Drawing.Imaging
Imports System.Drawing
Imports ImageManipulation

Dim g As System.Drawing.Image = System.Drawing.Image.FromFile(thepath, True)

Dim thisFormat = g.RawFormat
Dim hh As Integer = g.Height
Dim ww As Integer = g.Width

Dim imgOutput As New Bitmap(g, ww, hh)
Dim b As Graphics = Graphics.FromImage(imgOutput)

Dim blackbrush As New SolidBrush(Color.Black)

b.DrawString("testo da scrivere", New Font("arial", 7, FontStyle.Bold), blackbrush, New PointF(6, hh - 25))

If thisFormat.Equals(System.Drawing.Imaging.ImageFormat.Gif) Then

Response.ContentType = "image/gif"

'Questo è il codice aggiunto per eliminare il dithering dalle gif.
Dim quantizer As New OctreeQuantizer(255, 8 )
imgOutput = quantizer.Quantize(imgOutput)
'*********************************************

Else
Response.ContentType = "image/jpeg"
End If

imgOutput.Save(Response.OutputStream, thisFormat)
b.Dispose()
g.Dispose()
imgOutput.Dispose()

Il risultato è davvero ottimo, chissà perchè microsoft non ha pensato di implementare questa feature direttamente nel framework?

Giuseppe Liguori


liguori | seo napoli | seo roma | seo | liguori

I Link nei pdf passano pagerank?

Test di indicizzazione: I pdf passano pagerank?
Data inizio: 23/10/2006 19.30

Lo scopo del test è quello di verificare se i link nei pdf vengono seguiti dagli spider e se quindi di conseguenza passino anche pagerank.

Il pdf con il link è stato creato con Microsoft WORD e convertito con cute pdf.
Se la pagina linkata all’interno sarà indicizzata la prima parte del test avrà esito positivo.

Il passo successivo sarà attendere che il pdf raggiunga un sufficiente Pagerank e verificare se tale potere venga trasferito alla pagina.
Purtroppo per sapere questa informazione bisogna attendere il prossimo export del PR alla toolbar.

Ne approfitto per un ulteriore test: scrivo nel pdf anche un url inesistente senza usare il collegamento ipertestuale per verificare se lo spider passerà comunque a trovarla leggendola solamente. Credo di no, ma meglio verificare.

ATTENZIONE E’ IMPORTANTE NON VISITARE I LINK CONTENUTI NEL PDF PER EVITARE CHE LA TOOLBAR DI GOOGLE CON LA BARRETTA DEL PAGERANK ATTIVATA O ALTRE TOOLBAR POSSANO RENDERE L’URL VISIBILE E COMPROMETTERE QUINDI L’ESITO DEL TEST. E’ INOLTRE IMPORTANTE NON LINKARE L’INDIRIZZO IN ESSO CONTENUTO.

il pdf con i link e’ visionabile a questo indirizzo pdfpagerank Questo file può essere linkato il contenuto no.

Il pdf l’ho linkato in basso sulla home del mio blog ed in questo post, vi comunicherò quando lo spider passerà a trovare il pdf.

A presto,
Giuseppe


liguori | seo napoli | seo roma | seo | liguori

test di indicizzazione parola inesistente nell’anchor text di un link

Sarà banale come test, ma non l’avevo mai testato personalmente.
Volevo verificare quanti link fossero necessari per far indicizzare una pagina su un dominio esterno non linkata da nessuno con un anchor text che non era per nulla contenuto nella pagina di destinazione.
Cronostoria:

09/10/2006 ore 16.40 creata pagina Gedeopo su un dominio esterno con del testo improbabile, la parola Gedeopo non significa nulla, ma mi serviva un termine inesistente su Google per controllare quando la pagina veniva indicizzata.
Successivamente ho linkato su questo blog la pagina Gedeopo usando come anchor text un’altra parola inesistente su Google “fexomeno pip test”. Ho usato tre parole per verificare se la pagina gedeopo una volta indicizzata poteva essere trovata sul motore cercando anche solo fexomeno anzichè la parola intera.

12/10/2006 ore 01.05
La pagina è stata letta dallo spider.

21/10/2006
dopo 12 giorni dalla pubblicazione e dopo 9 giorni dal primo passaggio del crawler la pagina è stata inserita nell’indice di Google.
L’esito del test è quindi risultato positivo: Cercando attualmente su Google sia la parola fexomeno che fexomeno pip test compare la pagina Gedeopo che non contiene assolutamente la parola fexomeno.

Osservazioni: Ho fatto un goo.gle bombing in miniatura, è quindi sufficiente un singolo link per influenzare la ricerca di una pagina di destinazione appartenente ad un dominio esterno.

[UPDATE data 30/10/2006]

Il documento Gedeopo è stato indicizzato su Windows Live Search, ma l’anchor è stato ignorato, cercando fexomeno su Live non compare il documento Gedeopo, c’è da domandarsi se sia volutamente ignorato, oppure con una quantità più elevata di anchor viene assimilato.

Il prossimo test che dovrò fare sarà intitolato: I link nei pdf passano pagerank?


liguori | seo napoli | seo roma | seo | liguori

Progetto SpamReport

Negli ultimi periodi, cercando su Google spesso vi sarà capitato di imbattervi in siti un po’ particolari. I cosiddetti spam engine. Tali siti vengono creati appositamente con lo scopo di inquinare le ricerche e ottenere quindi visite per scopi non buoni, tipo diffusione di virus/malware, abuso di banner payperclick, raccolta di informazioni etc. niente di positivo per l’utenza dunque.

La brutta notizia è che Google non è in grado sempre di identificare tutte le tecniche scorrette utilizzate, che spaziano dal testo nascosto, alla copia di siti o addirittura alla creazione di migliaia di pagine finte contenenti i risultati di ricerche di altri motori.
La buona notizia è che Google ha sguinzagliato un Team molto preparato (composto dai personaggi chiamati quality rater) che gira per la rete e ripulisce i risultati delle ricerche (denominate più in avanti SERP).

Per semplificare il lavoro hanno quindi creato una pagina chiamata spamreport raggiungibile all’url http://www.google.com/contact/spamreport.html, dove chiunque con un buon senso civico può segnalare il cattivo comportamento di taluni siti. La segnalazione si può effettuare con un form in italiano tramite gli Strumenti per webmaster (Google Webmaster Tools) dopo opportuna registrazione.

Da alcuni test effettuati ho notato che alcune pagine di spam vengono rimosse nel giro di 48 ore, mentre altre restano lì per molto tempo. Presumbilmente se un sito viene segnalato da più persone come spam c’è maggiore probabilità che venga notato di più dal team di controllo.

Pensando a questa considerazione ho avuto una idea: Unire le forze per aumentare le segnalazioni.

Stavo pensando di creare una pagina dove gli utenti segnalano le ricerche inquinate da spam come già fa Google per creare un archivio delle Serp inquinate da spam.

La fase successiva è quella operativa, cioè i visitatori del sito visionano l’archivio dello spam e con un click possono inviare la segnalazione di quel sito a google con un form precompilato. Il vantaggio sta nel fatto che molti utenti con ip diversi segnalano lo stesso url a Google rendendolo quindi si spera più “quotato” come spam agli occhi del quality rater di turno e toglie il fastidio di dover aprire l’url di spamreport compilarlo e inviarlo.

L’altra fase è quella di controllo, cioè creare sempre con un automatismo, un elenco dei siti che siamo riusciti a far rimuovere dalle serp ed i tempi di reazione tra la prima segnalazione e la rimozione.

Sarebbe poi simpatico creare una hall of fame, una bella classifica degli utenti più attivi, giusto come premio di consolazione. Inoltre ho altri piccoli accorgimenti per rendere il tutto più appetibile ai webmaster, ad esempio, se uno spam engine ti sta scalando e tu ci fai un tot di segnalazioni, ti regaliamo in una apposita area un link al tuo sito come spinta per superarlo e come premio per l’aiuto fornito.

Io l’idea la rendo pubblica perchè credo che sia un servizio utile, se riesce a farlo prima di me ben venga, anzi più siti del genere esitono e più lo spam subirà una batosta. Io purtroppo non ho molto tempo per seguirla però se qualcuno è interessato a collaborare o se qualcuno ha dei commenti sull’idea per migliorarla o per dirmi schiettamente che è una “cazzata” si facesse avanti.

Giuseppe Liguori


liguori | seo napoli | seo roma | seo | liguori

googlebot non passa?

Spesso può capitare che Google decida improvvisamente di non aggiornare più nel suo indice una singola pagina del vostro sito.
Ciò può capitare ad esempio se per lungo tempo quella pagina non è stata più aggiornata.
I l motore penserà erroneamente che è una pagina che non cambia mai visti gli scarsi aggiornamenti.

Ciò è capitato di recente per un mio sito. Lo spider “googlebot”, non voleva proprio saperne di rileggere quella pagina, quindi di conseguenza non poteva nemmeno verificare che in realtà la pagina era stata modificata totalmente.
La cosa strana è che il sito in questione dispone di una sitemap.xml, che lo spider scarica quotidianamente per cui aveva tutte le capacità per rendersi conto dell’aggiornamento. Evidentemente non funziona sempre così, se noi indichiamo nella sitemap che un sito ha un aggiornamento settimanale e non rispettiamo la cosa, con tutta probabilità riterrà l’informazione da noi fornita poco attendibile e quindi ignorerà l’elemento.

Sono andato quindi per passi: ho linkato la pagina da altri miei siti (un blog su splinder e un altro mio sito), ma evidentemente non erano sufficientemente “forti” da convincere lo spider a ripassare.
Ho anche linkato la pagina nella homepage del sito in questione, ma senza sortire effetti, googlebot non passava più.

Successivamente ho fatto un esperimento, ho creato sul sito una nuova pagina chiamata con un nome simile (ad esempio se la vostra pagina si chiamava “il padrino” io la nuova l’ho chiamata film il padrino).
In questa nuova pagina vuota ho creato un reindirizzamento 301 Moved Permanently sulla pagina che il motore si rifiutava di indicizzare. Successivamente ho rifatto il submit di sitemap con la nuova page.

Analizzando i log dei giorni successivi ho notato che lo spider ha letto la nuova pagina creata e dopo un secondo esatto ha effettuato il passaggio sulla pagina incriminata.
Esempio:

2006-09-27 08:39:27 GET /index.php nome=Film_Il_Padrino 80 – 66.249.65.171 HTTP/1.1 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) – - 301 0 0 425 245 78

2006-09-27 08:39:28 GET /index.php nome=Il_Padrino – 80 – 66.249.65.171 HTTP/1.1 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) – - 200 0 0 5654 247 656

A questo punto era solo questione di tempo, ed infatti dopo circa una settimana la pagina che era bloccata da Agosto ora è correttamente indicizzata su Google.

Considerazioni: Resta da valutare se adesso Google passerà sulla pagina originale autonomamente o lo farà sempre saltando tramite il reindirizzamento 301. Per il momento attendo che lo spider apprenda correttamente questo passaggio e successivamente eliminerò la pagina fittizia dal mio sito. Non so quanto sia corretta questa procedura o se ho scoperto l’acqua calda, nè se sia pericolosa, però credo che fatta una tantum non crei eccessivi problemi.

Giuseppe Liguori


liguori | seo napoli | seo roma | seo | liguori

Elenco fornitori

Volevo segnalarvi una novità made in Ryhab, la società dove lavoro.
si chiama Elenco fornitori ed è un portale b2b (business to business), riservato a tutte le aziende di forniture o di servizi che intendano promuovere il proprio nome e alcuni prodotti gratuitamente. Elenco fornitori non è una classica directory di aziende dove pubblicare il link del proprio sito bensì strumento di lavoro e di interscambio tra diverse aziende.
Iscrivendosi gratuitamente è possibile:
- Creare il proprio profilo aziendale
- Inserire i propri prodotti sul portale
- Inserire eventuali richieste di prodotti/servizi
- Richiedere preventivi alle Aziende iscritte

Allo stato attuale non ci sono ancora molte aziende iscritte poichè è nato da poco, però contiamo molto su questo progetto. Senza aver volontariamente fatto lavoro da seo il sito è “misteriosamente” già ben posizionato per la inflazionata keyword “fornitori”, quindi riceve già molte visite.

Non costa nulla, iscrivetevi se avete una azienda e magari saremmo molto grati se faceste un po’ di passaparola. Grazie.

Giuseppe Liguori.


liguori | seo napoli | seo roma | seo | liguori

Truffe per l’acquisto dei domini.

Oramai si sa, su internet è possibile comprare di tutto, anche dei domini già registrati. Chi ha minime conoscenze da SEO, sa che è possibile trarre profitto da domini già posizionati e con un pagerank modesto per poterli riutilizzare per la rivendita di spazio link o per creare doorway. Indipendentemente dalla correttezza di tale pratica, questo fenomeno esiste.

Cercando di acquistare text link su ebay mi sono imbattuto anche io in inserzioni un po’ sospette. Annunci non italiani che proponevano la vendita di domini con Pagerank 6 a prezzi non troppo elevati. Ho pensato subito che poteva esserci la fregatura e ho fatto delle verifiche.

Le pagine di annunci sono ben realizzate con tanto di link a svariati tool per verificare il ranking del sito. Peccato che molti non sanno che dal 29 settembre Google ha effettuato uno dei periodici aggiornamenti del pagerank. In effetti l’indicatore verde che si vede sulla barretta di google non è per nulla affidabile poichè è una rappresentazione del pagerank aggiornato a due/tre mesi precedenti. Quindi molti domini sono saliti di grado, e molti ovviamente hanno anche perso. E’ il caso ad esempio di domini scaduti e poi ri-registrati. Google azzera il pagerank, ma la barretta verde segnala sempre per i due/tre mesi successivi il valore precedente.

Ho quindi verificato con appositi tool più avanzati come ad esempio questo: http://livepr.raketforskning.com/ che interroga 199 datacenter di google e permette quindi una rapida comparazione del valore del pagerank. Infatti in questi giorni interrogando molti domini con quel tool possiamo osservare che alcuni datacenter non sono ancora sincronizzati e rispondono con il valore precedente e altri con il valore aggiornato.

Tornando quindi agli annunci su ebay, probabilmente l’autore si è reso conto che i suoi domini non valevano più una cicca e ha deciso di sbarazzarsene, omettendo però questa importante informazione del pagerank sfalsato, per cui molti inserzionisti hanno rilanciato offerte da 70/80 euro per un dominio che a mio avviso vale al massimo 5,6 euro, giusto il costo del mantenimento al registrant.

Ho già segnalato la faccenda ad ebay via email un paio di giorni fa, ma non so se agiranno, visto che non è propriamente una truffa in stile classico, in effetti potrebbero considerarlo un incauto acquisto però resta che non è proprio corretto il comportamento di questi utenti.

Questo discorso ovviamente non vale solo per ebay, ma in generale per chi desidera acquistare un dominio “usato”.


liguori | seo napoli | seo roma | seo | liguori

Mai fidarsi del gratis!

Un mesetto fa ho trovato un servizio americano che permetteva di rendere visibile il proprio nome sul servizio pubblicitario ADWords di Google (ma anche su quello di yahoo e di Microsoft), il tutto gratuitamente. Cercando quindi il proprio nome e cognome sarebbe apparso in cima a tutti i risultati. Ingenuamente mi sono registrato e ho creato un profilo personale, ed effettivamente tuttora cercando il mio nome e cognome è possibile vedere tale risultato. Il problema sta nel fatto che su questo sito NON esiste la cancellazione, per cui non posso rimuovere i miei dati personali, ma soprattutto non posso eliminare quella voce adwords che compare durante la ricerca su google. Ho cercato invano nel sito, nelle faq, ma pare che il delisting sia previsto per i clienti a pagamento, si ma a me quando mi avvertite che funziona così?

Allora ho tentato un escamotage, ho cambiato nome nel mio profilo sperando quindi di deviare quell’annuncio dal mio nome e cognome, ma i furbastri non cancellano il vecchio annuncio, ma ne aggiungono uno nuovo, forse pensando che se qualcuno ha immesso quei dati ci potrebbe essere qualcuno che cercando voi, trovi anche loro. Bella pensata se non per il fatto che così facendo usurpano il mio nome e cognome per i loro tornaconti.

Ho scritto quindi una email al servizio di supporto, ma ho ricevuto solo la risposta automatica che mi avvertiva che avrei ottenuto una risposta entro 48 ore. Nada.

Ho scritto nuovamente dopo qualche giorno, ho anche provato a scrivere un commento di protesta sul blog delle news che c’è sul sito, ma lo hanno censurato e risposte non ne ho ancora ottenute.

Non so cosa altro fare, ho pensato di cliccare un migliaio di volte per farli pagare, ma poi avrei rischiato l’effetto contrario, cioè che magari immaginavano che il mio nome fosse quotato.

Quindi credo che sia venuto il momento di dirvi il nome del servizio: Naymz

Il sito è www punto naymz punto com (lo scrivo così perchè non voglio regalare nemmeno un centesimo di eventuale pagerank ai suddetti signori).

La mia conclusione è quindi che sulla rete è meglio provare i servizi sotto mentite spoglie. Chi regala vuole sempre qualcosa in cambio, nel mio caso, come dei novelli “diavoli”, anzichè l’anima, hanno preso la mia identità.

Giuseppe Liguori

Postilla aggiunta in data 12 ottobre 2006:
(mi hanno finalmente risposto)

Hi Guiseppe,

We apologize for the length of time it took to respond to your request. We had an issue with our support e-mail system.

You can cancel your account by simply logging into your Naymz account and visiting your “account” page which you will find a link at the top of the page. Just click the button that says “Hide Profile”.

Sorry to see you go! Let us know if you have any problems canceling.

Thanks,

Naymz Support

In pratica mi hanno detto che hanno avuto problemi nel rispondermi e che c’è un modo per disattivare quell’annuncio non più richiesto…

Apposto!

 

(Aggiunta in data 22 marzo 2007, hanno rimesso l’annuncio adwords con il mio nome)


liguori | seo napoli | seo roma | seo | liguori

misteri della fede…

Che cosa curiosa, avevo creato questo blog con il mio nome con il tentativo di essere in vetta sulla ricerca del mio nome e cognome e ci sono riuscito, il problema è che non con questo dominio giuseppeliguori.it. Qualche giorno fa avevo creato per prova un blog su wordpress.com e ho scritto giusto un paio di post e messo un link su un sito che linka anche qui, ed il risultato e che su google quel nuovo blog mi ha scavalcato. Potenza del nome a dominio di wordpress, o forse c’è ancora qualcosa di penalizzante che google ricorda della vecchia pagina che avevo qui al posto del blog?


liguori | seo napoli | seo roma | seo | liguori
Pagina successiva »