cos'è crawlability

cos'è crawlability

Il posizionamento nei motori di ricerca richiede un sito Web con una SEO tecnica impeccabile. Fortunatamente, con il plugin Yoast SEO puoi gestire molto di tutto sul tuo sito WordPress.

Tuttavia, se vuoi davvero ottenere il massimo dal tuo sito Web e continuare a battere la concorrenza, alcune conoscenze di base della SEO tecnica sono un must. In questo post, ti spiegheremo uno dei concetti più importanti della SEO tecnica: la crawlability.

Cos’è il crawler?

Un motore di ricerca come Google è costituito da un crawler, un index e un algoritmo. Il crawler segue i collegamenti.

Quando il crawler di Google trova il tuo sito Web, lo legge e il suo contenuto viene salvato nell’index.

Un crawler segue i collegamenti sul web. Un crawler è anche chiamato un robot, un bot o spider. Va in giro per Internet 24/7.

Una volta arrivato su un sito Web, salva la versione HTML di una pagina in un gigantesco database, chiamato index.

Questo indice viene aggiornato ogni volta che il crawler arriva sul tuo sito Web e trova una versione nuova o rivista di esso. A seconda dell’importanza che Google da al tuo sito e dal numero di modifiche apportate al tuo sito Web, il crawler si presenta più o meno spesso.

Ulteriori informazioni: Nozioni di base sulla SEO: cosa fa Google »

Cos’è la crawlability?

La crawlability ha a che fare con le possibilità che Google ha di scansionare il tuo sito web. I crawler possono essere bloccati dal tuo sito.

Esistono alcuni modi per bloccare un crawler dal tuo sito Web. Se il tuo sito Web o una pagina del tuo sito Web è bloccata, stai dicendo al crawler di Google: “non venire qui”. Il tuo sito o la rispettiva pagina non compariranno nei risultati di ricerca nella maggior parte di questi casi.

Esistono alcune cose che potrebbero impedire a Google di eseguire la scansione (o l’indicizzazione) del tuo sito Web:

Se il tuo file robots.txt blocca il crawler, Google non arriverà al tuo sito Web o alla tua pagina web specifica.
Prima di eseguire la scansione del tuo sito Web, il crawler darà un’occhiata all’intestazione HTTP della tua pagina. Questa intestazione HTTP contiene un codice di stato. Se questo codice di stato indica che non esiste una pagina, Google non eseguirà la scansione del tuo sito Web. 

Se il meta tag robot su una pagina specifica impedisce al motore di ricerca di indicizzare quella pagina, Google eseguirà la scansione di quella pagina, ma non la aggiungerà al suo indice.
Questo diagramma di flusso potrebbe aiutarti a comprendere i processi che i robot seguono quando tentano di indicizzare una pagina:

Processo indicizzazione pagina

Torna alla guida SEO WordPress