Quick navigation
Ti trovi in: Homepage » Guide » Articoli » Motori di Ricerca
Articoli
Motori di Ricerca
Guida sintetica all'indicizzazione
L'indicizzazione sui motori di ricerca avviene in tre fasi:
- Crawling: scansione delle pagine web da parte degli spider (detti anche bot o crawler) dei motori i quali raccolgono informazioni sulle pagine e li salvano nel loro database.
- Indexing: le informazioni raccolte vengono catalogate per creare un'indice di ricerca
- Ranking: il suddetto indice viene analizzato, per realizzare una classifica ordinata; in pratica viene assegnato un "valore" (page rank) che indica la qualità delle pagine indicizzate: attraverso un procedimento molto complicato, il motore di ricerca stabilisce quali siti siano più attendibili e quali meno, ordinandoli anche in base all'attinenza dell'argomento.
Questo procedimento viene ripetuto periodicamente su tutte le pagine presenti sul web.
I fattori i che influenzano l'indicizzazione
Ottimizzare l'indicizzazione di un sito sui motori di ricerca è un procedimento molto complesso, non per niente ci sono persone che lo fanno di mestiere, e che si occupano esclusivamente di questo (si chiamano SEO, Search Engine Optimizator). L'indicizzazione non è una "scenza esatta", non c'è alcun modo per avere la garanzia di arrivare primi, poichè ci sono troppe variabili. Però, se si lavora come si deve, si può essere ragionevolmente sicuri di guadagnarsi una buona posizione. In sintesi, i fattori più importanti che influenzano l'indicizzazione sono:
- il sito deve essere "fatto bene": le pagine devono essere scritte in codice corretto e valido (sematicamente e sintatticamente), ciò significa non usare tabelle layout, inserire il testo alternativo per tutte le immagini, usare i CSS per gestire l'aspetto estetico ecc. ecc. tutto questo comporta che è necessario padroneggiare abbastanza bene l'HTML. Avere un codice pulito e leggero è fondamentale: i crawler che si occupano di scansionare le pagine per indicizzarle, infatti, leggono solo il codice, non vedono l'aspetto estetico. Per questo è importante tenere separato il contenuto (gestito tramite i tag html) e lo stile (gestito dal CSS, meglio se in un file esterno alla pagina), in modo che i crawler non si perdano nei meandri del codice, ma riescano a capirne facilmente il contenuto.
- i contenuti devono essere ben strutturati: usare titoli, sottotitoli, punti elenco, ecc. in modo appropriato. E' anche importante la keyword density, ovvero la frequenza con cui ripetete una parola chiave all'interno del testo del sito. Ad esempio se il vostro sito parla di Final Fantasy, se ripetete questa parola piuttosto spesso (diciamo 1 volta ogni 60 parole), il crawler si convincerà che il vostro sito è molto attinente con Final Fantasy. Attenzione a non esagerare però! La percentuale ottimale è il 10% - 15%, superarla potrebbe essere controproducente.
- realizzare file robots.txt e sitemap.xml, per segnalare ai crawler dei motori di ricerca quali pagine non indicizzare, quali sono quelle da controllare più spesso, ogni quanto vengono aggiornate, com'è strutturato il sito ecc. sono tutte informazioni che facilitano il lavoro del crawler.
- il Pagerank: è il metodo di classificazione delle pagine inventato da Google, che funziona contando il numero di links a un sito, cioè il cosiddetto "link popularity". Quindi è importante linkarsi a più siti possibili, mediante banner rotation, affiliazioni o scambi di link. I "link out-bound" (cioè i link che puntano a pagine esterne al sito) sono molto positivi perchè consentono di aumentare l'attinenza ad un tema, sia per il crawler, sia per il visitatore del nostro sito, che una volta letto il contenuto della nostra pagina potrà continuare il suo percorso in altri siti (magari i nostri affiliati) che trattano argomenti correlati. Attenzione però: il maggiore beneficio lo si trae inserendo in ogni pagina 5 o 6 link a siti esterni dal page rank NON basso e che trattano argomenti attinenti al nostro.
- aggiornare spesso le pagine: aggiungendo periodicamente nuovi contenuti, il crawler capirà che il sito non è un "vegetale", ma è in continua crescita, quindi avrà una migliore considerazione di esso.
Metatag
All'atto pratico, dopo aver realizzato il vostro sito prestando attenzione alle cose sopra elencate, dovreste inserire appositi meta tag, che servono a fornire informazioni aggiuntive (meta-informazioni). Questi tag vanno inseriti tra <head> e </head> (prima di eventuali javascript) , ed i più importanti sono
- metatag "description", per descrivere il vostro sito in modo sintetico ma significativo:
<meta name="description" content="Descrizione sintetica del sito">
Non inserire virgolette, n'è apici o <> nella descrizione. - metatag "keywords", contentente le parole chiave che le persone potrebbero usare per fare una ricerca su google relativamente all'argomento trattato dal vostro sito:
<meta name="keywords" content="elenco parole chiave " />
Inserire troppe parole può essere controproducente, quindi sceglietele con attenzione. Non è importante se le parole vengono separate da virgola oppure no. Può essere utile differenziare le parole chiave nelle varie pagine. Evitate termini generici, inserite le parole sia al signolare che al plurale, sia in italiano che in inglese, studiate frasi composte che siano significative per trovarvi. - metatag "Robots", istruisce i crawler dei motori di ricerca su come debbano scansionare la pagina
<meta name="robots" content="follow, index ">
Le opzioni del campo CONTENT possono essere: nofollow = non proseguire nell'indicizzazione; index = indicizza questa pagina; noindex = non indicizzare questa pagina; follow = prosegui ad indicizzare le altre pagine; all = indicizza tutte le pagine;
Riferimenti
Infine, è utile segnalare l'url del proprio sito sia su Google che Yahoo (però è necessario registrarsi) ai seguenti indirizzi:
Ricordatevi comunque che ci vuole del tempo, a volte può passare anche un mese prima di essere indicizzati.
Registrandovi su google a questo indirizzo potrete accedere ad alcuni servizi gratuiti, utili per tenere monitorata l'indicizzazione delle vostre pagine sul motore di ricerca e per ottimizzare il vostro sito. A questo link potete trovare l'area dedicata ai webmaster, con consigli e strumenti utili: www.google.it/webmasters. Infine, esistono servizi a pagamento come "google adwords" dove è possibile acquistare determinate parole e fare in modo che il sito venga visualizzato in prima linea nell'area "collegamenti sponsorizzati" quando quelle parole vengono cercate.
Infine, provate, provate, provate! Non pensate che una volta fatte queste cose, per un anno o due siete a posto. La cura di un sito sta anche nel tenere monitorate l'indicizzazione, controllando periodicamente la posizione sui motori di ricerca e modificando il sito e le parole chiave di conseguenza.
In questo articolo ho voluto spiegare solo le cose indispensabili riguardo all'indicizzazione sui motori di ricerca, perchè l'argomento è molto vasto e ci sono anche diverse tendenze e linee di pensiero al riguardo. Se siete interessati ad approfondire l'argomento potete trovare molte guide, articoli e FAQ su http://webmarketing.html.it.
Curiosità su Google
Google è nato nel 1996 come progetto di ricerca di due studenti, Larry page e Sergey Brin, nell'Università Stanford in California. Inventarono un nuovo modo di classificare i siti, il PageRank e fondarono Google Incorporated in un garage in Melo Park nel 1998. Ma ben presto la loro società divenne molto grossa e acquistarono il complesso di palazzi conosciuto come il Googleplex in Mountain View, California.
Il nome Google viene da "googol", che è il numero 1 seguito da un centinaio di zeri. Ora il verbo "to google" viene definito su alcuni vocabolari come "cercare in internet".
