Come indicizzare sito web su Google
Google non ha indicizzato il tuo sito web? Allora sei nessuno, se nessuno può trovarlo.
Un terribile Postulato, ma vero.
Non potrai infatti apparire nelle sue Serp (ovvero le classifiche di ricerca di Goole) per nessuna delle parole chiave di ricerca che gli utenti inseriscono su Google, non otterrai quindi traffico organico o biologico.
Zilch. Nada. Zero.
Dato che sei qui, immaginiamo che questa frase non ti suoni nuova. Quindi mettiamoci subito al lavoro per indicizzare il sito che abbiamo creato.
Questo articolo ti insegna come a capire e risolvere tre cose principali e distinte su come indicizzare siti su Google:
- Alcune delle tue pagine sono su Google, ma altre no.
- Google non ha indicizzato affatto il tuo sito internet.
- Appena pubblichi le tue pagine queste vengono indicizzate con tempi troppo lunghi .
Indice
- Che cos’è l’indicizzazione di un sito internet?
- Come indicizzare una pagina di un sito
- 1) Rimuovi possibili blocchi di scansione di robots.txt
- 2) Rimuovi i tag noindex non autorizzati
- 3) Includere la pagina nella mappa del sito
- 4) Rimuovi i tag canonici non autorizzati
- 5) Verifica che la pagina non sia orfana
- 6) Correggi i link interni nofollow
- 7) Aggiungi link interni “Importanti”.
- 8) Assicurati che la pagina sia indispensabile e ben costruita
- 9) Rimuovere le pagine di bassa qualità (per ottimizzare il “crawl budget”)
- 10) Costruisci backlink di alta qualità
- Indicizzazione ≠ Posizionamento
Che cosa vuol dire indicizzare un sito?
Indicizzare un sito significa iscriverlo alla ricerca di Google, così che esso possa essere trovato dagli utenti con specifiche richieste inserite in forma di parole chiave testuali o vocali
Scarica il kit per creare un Audit SEO
Che cos’è l’indicizzazione di un sito internet?
Google scopre nuove pagine Web eseguendo la scansione della rete internet 24/7 e quindi aggiunge le pagine che trova al proprio indice. L’algoritmo decide poi come posizionare i siti web sulle classifiche in base alle ricerche degli utenti.
Lo fanno utilizzando un web spider chiamato Googlebot.
Sei ancora Confuso? Definiamo alcuni termini importanti:
- Scansione o crawling: È il sistema con cui Google segue i collegamenti ipertestuali sul Web per scoprire nuovi contenuti.
- Indicizzazione: il processo di archiviazione di ogni pagina Web in un vasto database che si chiama Index.
- Web spider: un software progettato per eseguire il processo di scansione su larga scala.
- Googlebot: E’ robot detto anche web spider di Google che attraversa la rete alla ricerca di nuove pagine Html.
- Posizionamento: Questo è il lavoro che fa un professionista SEO(o tu) compie per ottimizzare il sito affinche sia visibile sui motori di ricerca.
Qual è lo strumento che serve per inserire un sito nell indice di Google?
Lo strumento che serve a una persona per inserire i siti web su Google si chiama Google Search Console e puoi trovarlo al seguente indirizzo:
https://search.google.com/search-console/about?hl=it
Se vuoi sapere di più su come funziona Google leggi le nostre guide: - Come funziona Google - Guida alla Search Console
In questo video ti spieghiamo come funziona Google:
Vedi il video: Come funziona il motore di ricerca Google
Quando cerchi qualcosa su Google, sosanzialmente fai una domanda a Google chiedendogli di restituirti un elenco di tutte le migliori pagine dal suo gigantesca database Index. Poiché spesso ci sono milioni di pagine che si adattano a ciò che cerchi, l’algoritmo di posizionamento di Google fa tutto il possibile per ordinare le pagine in modo da fornirti prima i risultati migliori e più pertinenti.
Quindi se volessimo fare un parallelo sportivo, l’indicizzazione è un po’ l’atto d’iscriversi a una gara; il posizionamento è invece allenarsi e poi vincere la stessa gara. Chiaro? :)
Quindi, non puoi vincere se prima non ti presenti alla gara .
Come verificare se sei visibile su Google
Vai su Google, e quindi inserisci questo comando: (sostituisci il nome del tuo sito web al posto di tuosito.com)
site:tuosito.com
887 Pagine Indicizzate, vedi li sopra? Questo numero mostra approssimativamente quante delle tue pagine Google ha inserito nel proprio Index e quindi le ha indicizzate .
Se vuoi controllare lo stato dell’indicizzazione di uno specifico URL(ovvero di una pagina), usa lo stesso comando inserendo l’url completo:
site:tuosito.com/nome-pagina
Se la pagina non è indicizzata, nessun risultato verrà visualizzato.
Se ti sei registrato a Google Search Console, puoi vedere il rapporto in Indicizzazione>”Pagine” per ottenere una visione più accurata dello stato dell’indicizzazione del tuo sito web. Basta andare su:
Google Search Console > Indicizzazione > Pagine.
Guarda il numero di pagine valide (con e senza avvisi).
Se questi due numeri totalizzano tutt’altro che zero, allora Google ha indicizzato almeno alcune delle pagine del tuo sito web. In caso contrario, allora hai un grave problema perché nessuna delle tue pagine web è indicizzata.
NOTA BENE: Non sei ancora registrato su Google Search Console? Iscriviti subito. È gratis. Chiunque gestisca un sito Web e si preoccupi di avere traffico da Google dovrebbe utilizzare Google Search Console. È troppo importante.
Puoi anche utilizzare Search Console per verificare se una pagina specifica è effettivamente indicizzata.
Per farlo, incolla l’URL nello strumento Controllo URL.
Se quella pagina è indicizzata, ti fornirà una schermata che dice: “L’URL si trova su Google”.
Se la pagina non è indicizzata, vedrai la scritta “L’URL non si trova su Google”.
Come indicizzare una pagina di un sito
Hai scoperto che il tuo sito web o pagina web non è indicizzato su Google? Prova questo:
- Vai alla console di ricerca di Google
- Vai sul motore di controllo URL
- Incolla l’URL che vuoi indicizzare su Google nella barra di ricerca del motore.
- Attendi che Google effettui il controllo dell’ l’URL
- Fai clic sul pulsante “Richiesta d’indicizzazione”.
Questo processo è una prassi ed è bene che la usi ogni volta che pubblichi un nuovo post o pagina. Stai a tutti gli effetti dicendo a Google che hai aggiunto un nuovo contenuto importante al tuo sito e sarebbe il caso per lui di scansionarlo.
Chiaramente la richiesta d’indicizzazione in se non impedisce a Google d’indicizzare meglio o peggio le vecchie pagine. In tal caso, segui l’elenco di operazioni riportato di seguito per diagnosticare e risolvere il problema.
Per indicizzare il sito su Google :
- Rimuovi i blocchi di scansione nel tuo file robots.txt
Controlla quindi che il file robot non stia bloccando delle pagine del sito web
- Rimuovi i tag noindex non autorizzati
Se alcune pagine sono bloccate dal tag Noindex su Search console, rimuovi questo comando
- Crea la sitemap del sito
Crea una mappa di tutti i tuoi url e sottoponila a Google usando la search Console
- Rimuovi i tag canonici non autorizzati
Se hai inserito Tag Canonical sbagliati o imperfetti rimuovili o correggili con Yoast
- Verifica le pagine orfane
Yoast ti fornisce uno strumento per individuare le pagine orfane e rimuoverle o correggerle
- Correggi i link nofollow interni
I link nofollow devono essere corretti col target dofollow
- Aggiungi collegamenti interni efficaci.
Collega tra loro gli argomenti importanti del tuo sito web in relazione agli argomenti utilizzando i link
- Assicurati che la pagina sia preziosa per gli utenti
Crea contenuti che siano utili ed efficaci per i tuoi utenti
- Rimuovi le pagine di bassa qualità
Rimuovi pagine doppie o scritte con approssimazione perche abbassano le tue potenzialità di posizionamento.
- Costruisci backlink di alta qualità
Quando inserisci un link fallo con pagine che abbiano qualità elevata e approfondimenti.
Se vuoi approfondire leggi il Nostro Articolo: Cos’è la Crawlability
1) Rimuovi possibili blocchi di scansione di robots.txt
Google non indicizza l’intero sito web? Potrebbe essere dovuto a un blocco di scansione in qualcosa chiamato file robots.txt.
Per verificare la presenza di questo problema, vai su tuodominio.com/robots.txt.
Cerca uno di questi due frammenti di codice:
1| User-agent: Googlebot
2| Disallow: /
1| User-agent: *
2| Disallow: /
Entrambi dicono a Googlebot che non è autorizzato a eseguire la scansione di nessuna pagina del tuo sito.
Per risolvere il problema, rimuovili. Semplice.
Un blocco di scansione in robots.txt potrebbe anche essere il colpevole nel caso Google non stia indicizzando una singola pagina web.
Per verificare se questo è il caso, incolla l’URL nello strumento di controllo URL in Google Search Console. Fai clic sul blocco “Pagine” per vedere maggiori dettagli, quindi cerca “Scansione consentita? No: bloccato dall’errore “robots.txt”.
Ciò indica che la pagina è bloccata in robots.txt.
In tal caso, ricontrolla il tuo file robots.txt per eventuali regole di “disallow” relative alla pagina o alla relativa sottosezione
Rimuovere dove necessario.
2) Rimuovi i tag noindex non autorizzati
Google non indicizzerà le pagine se dici loro di non farlo. Questo è utile per mantenere private alcune pagine web. Ci sono due modi per farlo:
Metodo 1: meta tag
Le pagine con uno di questi meta tag nella sezione non verranno indicizzate da Google:
1| <meta name=“robots” content=“noindex”>
1| <meta name=“googlebot” content=“noindex”>
Questo è un tag meta robots e indica ai motori di ricerca se possono o meno indicizzare la pagina.
NOTA BENE: La parte fondamentale è il valore “noindex”. Se lo vedi, la pagina è impostata su noindex.
Per trovare tutte le pagine con un meta tag noindex sul tuo sito, vai sulla Search Console e cerca nel tab Pagine, tutti gli url che sono contrassegnati con “Esclusa in base al tag “noindex””.
Fai clic per visualizzare tutte le pagine interessate. Rimuovi il meta tag noindex da tutte le pagine a cui non appartiene.
Metodo 2: X-Robots-Tag
I crawler rispettano anche l’intestazione della risposta HTTP X-Robots-Tag. Puoi implementarlo usando un linguaggio di scripting lato server come PHP, o nel tuo file .htaccess, o modificando la configurazione del tuo server.
Lo strumento d’ispezione degli URL in Search Console ti dice se a Google è impedito di eseguire la scansione di una pagina a causa di questa intestazione. Basta inserire il tuo URL ne motore, quindi cercare “Indicizzazione consentita? No: “noindex” rilevato nell’intestazione http “X-Robots-Tag””
3) Includere la pagina nella mappa del sito
Una mappa del sito indica a Google quali pagine del tuo sito sono importanti e quali no. Può anche fornire alcune indicazioni sulla frequenza con cui devono essere nuovamente sottoposti a scansione.
Google dovrebbe essere in grado di trovare pagine sul tuo sito Web indipendentemente dal fatto che siano nella tua mappa del sito, ma è comunque buona norma includerle. Dopotutto, non ha senso rendere difficile la vita a Google.
Per verificare se una pagina è presente nella tua Sitemap, utilizza lo strumento d’ispezione degli URL in Search Console. Se vedi l’errore “L’URL non è su Google” e “Mappa del sito: N/A”, allora questo non è nella tua mappa del sito o indicizzato.
Non usi Search Console? Vai all’URL della tua mappa del sito, in genere tuodominio.com/sitemap.xml, e cerca la pagina.
Se queste pagine dovrebbero essere nella tua mappa del sito, quindi aggiungile. Al termine, fai sapere a Google che hai aggiornato la tua mappa del sito eseguendo il ping di questo URL:
http://www.google.com/ping?sitemap=http://tuosito.com/sitemap_url.xml
Sostituisci l’ultima parte con l’URL della tua sitemap. Dovresti quindi vedere qualcosa del genere:
Ciò dovrebbe accelerare l’indicizzazione della pagina da parte di Google.
4) Rimuovi i tag canonici non autorizzati
Un tag canonical indica a Google qual è la versione preferita di una pagina. Assomiglia a questo:
<link rel="canonical” href="/pagina.html/">
La maggior parte delle pagine non ha tag canonico o quello che viene chiamato tag canonico autoreferenziale. Ciò indica a Google che la pagina stessa è la tua versione preferita e probabilmente l’unica. In altre parole, vuoi che questa pagina venga indicizzata.
Ma se la tua pagina ha un tag canonico canaglia, potrebbe indicare a Google una versione preferita di questa pagina che non esiste. In tal caso, la tua pagina non verrà indicizzata.
Per verificare la presenza di un tag canonico, utilizza lo strumento d’ispezione degli URL di Google. Vedrai un avviso “Pagina alternativa con tag canonico” se il canonico punta a un’altra pagina.
Se questo non dovrebbe essere presente e desideri indicizzare la pagina, rimuovi il tag canonical.
IMPORTANTE
I tag canonici non sono sempre cattivi. La maggior parte delle pagine con questi tag li avrà per un motivo. Se vedi che la tua pagina ha un set canonico, controlla la pagina canonica. Se questa è effettivamente la versione preferita della pagina e non è necessario indicizzare anche la pagina in questione, allora il tag canonical dovrebbe rimanere.
Questo cerca le pagine nella tua mappa del sito con tag canonici non autoreferenziali. Poiché quasi sicuramente desideri indicizzare le pagine nella tua mappa del sito, dovresti esaminare ulteriormente se questo filtro restituisce dei risultati.
È molto probabile che queste pagine abbiano un canonico canaglia o che non dovrebbero essere nella tua mappa del sito in primo luogo.
5) Verifica che la pagina non sia orfana
Le pagine orfane sono quelle senza collegamenti interni che puntano ad esse.
Poiché Google scopre nuovi contenuti eseguendo la scansione del Web, non è in grado di scoprire pagine orfane attraverso tale processo. Neanche i visitatori del sito web saranno in grado di trovarli.
Per verificare la presenza di pagine orfane, esegui la scansione del tuo sito con Site Audit di SEO come ad esempio SEO Zoom. Successivamente, controlla il rapporto Audit URL Link per gli errori “Pagina orfana (non ha link interni in entrata)”:
Questo tipo di audit mostra tutte le pagine indicizzabili e presenti nella tua mappa del sito, ma non hanno collegamenti interni che puntano ad esse.
IMPORTANTE
Questo processo funziona solo quando due cose sono vere:
- Tutte le pagine che vuoi indicizzare sono nelle tue sitemap
- Hai selezionato la casella per utilizzare le pagine nelle tue sitemap come punti di partenza per la scansione durante l’impostazione del progetto in Site Audit di Ahrefs.
Non sei sicuro che tutte le pagine che vuoi indicizzare siano nella tua sitemap? Prova questo:
Scarica un elenco completo delle pagine del tuo sito (tramite il tuo CMS)
Scansiona il tuo sito web (utilizzando uno strumento come Site Audit di SEO Zoom)
Incrocia i due elenchi di URL
Tutti gli URL non trovati durante la scansione sono pagine orfane.
Oppure In Yoast SEO Premium troverai il filtro per i contenuti orfani. Questo filtro ti consente di ottenere una rapida panoramica delle pagine del tuo sito Web che non hanno collegamenti ad esse. Ciò significa che sia i motori di ricerca che i visitatori non saranno in grado di trovare queste pagine.
Puoi correggere le pagine orfane in due modi:
Se la pagina non è importante, eliminala e rimuovila dalla mappa del sito.
Se la pagina è importante, incorporala nella struttura dei link interni del tuo sito web.
6) Correggi i link interni nofollow
I collegamenti nofollow sono collegamenti con un tag rel=“nofollow”. Impediscono il trasferimento del PageRank all’URL di destinazione. Google inoltre non esegue la scansione dei link nofollow.
Ecco cosa dice Google in merito:
In sostanza, l’utilizzo di nofollow ci fa eliminare i link target dal nostro grafico generale del web. Tuttavia, le pagine di destinazione potrebbero ancora apparire nel nostro indice se altri siti si collegano ad esse senza utilizzare nofollow o se gli URL vengono inviati a Google in una Sitemap.
In breve, dovresti assicurarti che tutti i collegamenti interni alle pagine indicizzabili siano seguiti da dofollow.
Rimuovi il tag nofollow da questi link interni, supponendo che tu voglia che Google indicizzi la pagina. In caso contrario, elimina la pagina o non indicizzarla.
7) Aggiungi link interni “Importanti”.
Google scopre nuovi contenuti eseguendo la scansione del tuo sito web. Se trascuri di collegare tra loro le pagine internamente, Google potrebbe non essere in grado di trovare le pagine non linkate ad altre.
Una semplice soluzione a questo problema consiste nell’aggiungere alcuni collegamenti interni alla pagina che vuoi indicizzare.
Puoi farlo da qualsiasi altra pagina web che Google può scansionare e indicizzare. Tuttavia, se vuoi che Google indicizzi la pagina il più velocemente possibile, ha senso farlo da una delle tue pagine più “potenti”.
Come mai? Perché è probabile che Google esegua nuovamente la scansione di tali pagine più velocemente delle pagine meno importanti.
SUGGERIMENTO
Incolla la pagina da cui hai aggiunto il link interno nello strumento di controllo degli URL di Google. Premi il pulsante “Richiedi indicizzazione” per far sapere a Google che qualcosa nella pagina è cambiato e che bisogna eseguire nuovamente la scansione il prima possibile. Ciò potrebbe accelerare il processo di scoperta del collegamento interno e, di conseguenza, la pagina che desideri indicizzare.
8) Assicurati che la pagina sia indispensabile e ben costruita
È improbabile che Google indicizzi pagine di bassa qualità perché non hanno alcun valore per i suoi utenti. Ecco cosa ha detto John Mueller di Google sull’indicizzazione nel 2018:
Non indicizziamo mai tutti gli URL conosciuti, è abbastanza normale. Mi concentrerei sul rendere il sito fantastico e stimolante, quindi le cose di solito funzionano meglio.
John Mueller – Google
In questa frase Muller implica che se vuoi che Google indicizzi il tuo sito web o la tua pagina web, questa deve essere “fantastica e stimolante”.
Se hai escluso problemi tecnici per la mancanza di indicizzazione, la colpa potrebbe essere la mancanza di valore. Per questo motivo, vale la pena rivedere la pagina con occhi nuovi e chiedersi: questa pagina è veramente preziosa per il mio utente?
Un utente troverebbe valore in questa pagina se ci cliccasse sopra dai risultati di ricerca?
Se la risposta è no a una di queste domande, allora devi migliorare i tuoi contenuti.
Puoi trovare più pagine potenzialmente di bassa qualità che non sono indicizzate utilizzando lo strumento Pagine di Search Console. Per farlo, vai su Pagine in Search Console e controlla le Pagine non indicizzate contrassegnate con: “Pagina scansionata, ma attualmente non indicizzata”.
Ciò restituirà un elenco di pagine cosiddette dai contenuti “sottili” che sono indicizzabili e che attualmente non ricevono traffico organico. In altre parole, c’è una buona possibilità che non siano o non saranno indicizzate.
Leggi anche la nostra guida a Google PageSpeed
9) Rimuovere le pagine di bassa qualità (per ottimizzare il “crawl budget”)
Avere troppe pagine di bassa qualità sul tuo sito web spreca il crawl budget.
Ecco cosa dice Google in merito:
Lo spreco di risorse del server su [pagine a basso valore aggiunto] eliminerà l’attività di scansione da pagine che hanno effettivamente valore, il che potrebbe causare un ritardo significativo nella scoperta di ottimi contenuti su un sito.
Pensa a questo elemento come a un insegnante che valuta i saggi, da sottoporre ai propri studenti, e uno dei quali è il tuo. Se ha solo dieci saggi da valutare, arriverà al tuo abbastanza velocemente.
Se invece ha cento saggi, ci vorrà un po’ di più.
Infine se ne avesse migliaia, il carico di lavoro è troppo alto e potrebbe non riuscire mai a valutare il tuo saggio.
Google afferma che “il crawl budget […] non è qualcosa di cui la maggior parte degli editori deve preoccuparsi” e che “se un sito ha meno di qualche migliaio di URL, la maggior parte delle volte verrà sottoposto a scansione in modo efficiente“.
Tuttavia, rimuovere pagine di bassa qualità dal tuo sito Web non è mai una brutta cosa. Non può che avere un effetto positivo sul crawl budget.
Puoi utilizzare il nostro modello di verifica dei contenuti per trovare pagine potenzialmente di bassa qualità e irrilevanti che possono essere eliminate.
10) Costruisci backlink di alta qualità
I backlink dicono a Google che una pagina web è importante. Dopotutto, se qualcuno si collega ad esso, allora deve avere un certo valore. Queste sono pagine che Google vuole indicizzare.
Per la massima trasparenza, Google non si limita a indicizzare le pagine web con i backlink. Ci sono un sacco (miliardi) di pagine indicizzate senza backlink. Tuttavia, poiché Google considera più importanti le pagine con link di alta qualità, è probabile che esegua la scansione e riscansione di tali pagine più velocemente di quelle senza back link. Ciò porta a un’indicizzazione più rapida.
Indicizzazione ≠ Posizionamento
Avere indicizzati il tuo sito web o la tua pagina web su Google non equivale a posizionamento o traffico.
Sono due cose diverse.
L’indicizzazione significa che Google è a conoscenza del tuo sito web. Ciò non significa che lo posizionerà per qualsiasi domanda pertinente e utile dei propri utenti.
È qui che entra in gioco la SEO: l’arte di ottimizzare le tue pagine web per posizionarle in base a query specifiche.
In breve, la SEO implica:
- Trovare ciò che i tuoi clienti stanno cercando;
- Creazione di contenuti attorno a tali argomenti;
- Ottimizzazione di quelle pagine per le parole chiave target;
- Costruire backlink;
- Ripubblicare regolarmente i contenuti per mantenerli “sempreverdi”.