Come indicizzare sito web su Google

come indicizzare sito web su Google

Google non ha indicizzato il tuo sito web? Allora sei nessuno, se nessuno può trovarlo.
Un terribile Postulato, ma vero.

Non potrai infatti apparire nelle sue Serp (ovvero le classifiche di ricerca di Goole) per nessuna delle parole chiave di ricerca che gli utenti inseriscono su Google, non otterrai quindi traffico organico o biologico.
Zilch. Nada. Zero.
Dato che sei qui, immaginiamo che questa frase non ti suoni nuova. Quindi mettiamoci subito al lavoro per indicizzare il sito che abbiamo creato.

Questo articolo ti insegna come a capire e risolvere tre cose principali e distinte su come indicizzare siti su Google:

  • Alcune delle tue pagine sono su Google, ma altre no.
  • Google non ha indicizzato affatto il tuo sito internet.
  • Appena pubblichi le tue pagine queste vengono indicizzate con tempi troppo lunghi .

Che cosa vuol dire indicizzare un sito?

Indicizzare un sito significa iscriverlo alla ricerca di Google, così che esso possa essere trovato dagli utenti con specifiche richieste inserite in forma di parole chiave testuali o vocali

 

guida seo audit scaricabile riassunto illustrazione

stabilire gli obiettiviScarica il kit per creare un Audit SEO 


    La guida verrà inviata come allegato all'email indicata. Assicurati di indicare un indirizzo valido!

     

     

    Che cos’è l’indicizzazione di un sito internet?

    Google scopre nuove pagine Web eseguendo la scansione della rete internet 24/7 e quindi aggiunge le pagine che trova al proprio indice. L’algoritmo decide poi come posizionare i siti web sulle classifiche in base alle ricerche degli utenti.
    Lo fanno utilizzando un web spider chiamato Googlebot.

    Sei ancora Confuso? Definiamo alcuni termini importanti:

    • Scansione o crawling: È il sistema con cui Google segue i collegamenti ipertestuali sul Web per scoprire nuovi contenuti.
    • Indicizzazione: il processo di archiviazione di ogni pagina Web in un vasto database che si chiama Index.
    • Web spider: un software progettato per eseguire il processo di scansione su larga scala.
    • Googlebot: E’ robot detto anche web spider di Google che attraversa la rete alla ricerca di nuove pagine Html.
    • Posizionamento: Questo è il lavoro che fa un professionista SEO(o tu) compie per ottimizzare il sito affinche sia visibile sui motori di ricerca.

    Qual è lo strumento che serve per inserire un sito nell indice di Google?

    Lo strumento che serve a una persona per inserire i siti web su Google si chiama Google Search Console e puoi trovarlo al seguente indirizzo:

    https://search.google.com/search-console/about?hl=it

    Se vuoi sapere di più su come funziona Google leggi le nostre guide:
    - Come funziona Google
    - Guida alla Search Console

    In questo video ti spieghiamo come funziona Google:

     

    Vedi il video: Come funziona il motore di ricerca Google

    Quando cerchi qualcosa su Google, sosanzialmente fai una domanda a Google chiedendogli di restituirti un elenco di tutte le migliori pagine dal suo gigantesca database Index. Poiché spesso ci sono milioni di pagine che si adattano a ciò che cerchi, l’algoritmo di posizionamento di Google fa tutto il possibile per ordinare le pagine in modo da fornirti prima i risultati migliori e più pertinenti.

    Quindi se volessimo fare un parallelo sportivo, l’indicizzazione è un po’ l’atto d’iscriversi a una gara; il posizionamento è invece allenarsi e poi vincere la stessa gara. Chiaro? :)

    Quindi, non puoi vincere se prima non ti presenti alla gara .

    Infografica dell’indicizzazione di una Pagina Web

    Come verificare se sei visibile su Google


    Vai su Google, e quindi inserisci questo comando: (sostituisci il nome del tuo sito web al posto di tuosito.com)

     site:tuosito.com
    ricerca delle pagine del tuo sito su google

    887 Pagine Indicizzate, vedi li sopra? Questo numero mostra approssimativamente quante delle tue pagine Google ha inserito nel proprio Index e quindi le ha indicizzate .

    Se vuoi controllare lo stato dell’indicizzazione di uno specifico URL(ovvero di una pagina), usa lo stesso comando inserendo l’url completo:

    site:tuosito.com/nome-pagina

    Se la pagina non è indicizzata, nessun risultato verrà visualizzato.

    pagina url tuo sito su google

    Se ti sei registrato a Google Search Console, puoi vedere il rapporto in Indicizzazione>”Pagine” per ottenere una visione più accurata dello stato dell’indicizzazione del tuo sito web. Basta andare su:

    Google Search Console > Indicizzazione > Pagine.

    pagine indicizzate Google search console
    Ecco le pagine del tuo sito web viste da Google Search Console

    Guarda il numero di pagine valide (con e senza avvisi).

    Se questi due numeri totalizzano tutt’altro che zero, allora Google ha indicizzato almeno alcune delle pagine del tuo sito web. In caso contrario, allora hai un grave problema perché nessuna delle tue pagine web è indicizzata.

    NOTA BENE: Non sei ancora registrato su Google Search Console? Iscriviti subito. È gratis. Chiunque gestisca un sito Web e si preoccupi di avere traffico da Google dovrebbe utilizzare Google Search Console. È troppo importante.
    Puoi anche utilizzare Search Console per verificare se una pagina specifica è effettivamente indicizzata.
    Per farlo, incolla l’URL nello strumento Controllo URL.

    Se quella pagina è indicizzata, ti fornirà una schermata che dice: “L’URL si trova su Google”.

    url indicizzato su google search console

    Se la pagina non è indicizzata, vedrai la scritta “L’URL non si trova su Google”.

    url non indicizzato su google search console

    Leggi la Guida Search Console per Principianti

    Come indicizzare una pagina di un sito

    Hai scoperto che il tuo sito web o pagina web non è indicizzato su Google? Prova questo:

    • Vai alla console di ricerca di Google
    • Vai sul motore di controllo URL
    • Incolla l’URL che vuoi indicizzare su Google nella barra di ricerca del motore.
    • Attendi che Google effettui il controllo dell’ l’URL
    • Fai clic sul pulsante “Richiesta d’indicizzazione”.


    Questo processo è una prassi ed è bene che la usi ogni volta che pubblichi un nuovo post o pagina. Stai a tutti gli effetti dicendo a Google che hai aggiunto un nuovo contenuto importante al tuo sito e sarebbe il caso per lui di scansionarlo.

    Chiaramente la richiesta d’indicizzazione in se non impedisce a Google d’indicizzare meglio o peggio le vecchie pagine. In tal caso, segui l’elenco di operazioni riportato di seguito per diagnosticare e risolvere il problema.

    https://www.youtube.com/watch?v=oy1hJXEGXlE
    Guarda questo video che spiega come Google indicizza il Sito web (La Crawlability)

    Per indicizzare il sito su Google :

    1. Rimuovi i blocchi di scansione nel tuo file robots.txt

      Controlla quindi che il file robot non stia bloccando delle pagine del sito web

    2. Rimuovi i tag noindex non autorizzati

      Se alcune pagine sono bloccate dal tag Noindex su Search console, rimuovi questo comando

    3. Crea la sitemap del sito

      Crea una mappa di tutti i tuoi url e sottoponila a Google usando la search Console

    4. Rimuovi i tag canonici non autorizzati

      Se hai inserito Tag Canonical sbagliati o imperfetti rimuovili o correggili con Yoast

    5. Verifica le pagine orfane

      Yoast ti fornisce uno strumento per individuare le pagine orfane e rimuoverle o correggerle

    6. Correggi i link nofollow interni

      I link nofollow devono essere corretti col target dofollow

    7. Aggiungi collegamenti interni efficaci.

      Collega tra loro gli argomenti importanti del tuo sito web in relazione agli argomenti utilizzando i link

    8. Assicurati che la pagina sia preziosa per gli utenti

      Crea contenuti che siano utili ed efficaci per i tuoi utenti

    9. Rimuovi le pagine di bassa qualità

      Rimuovi pagine doppie o scritte con approssimazione perche abbassano le tue potenzialità di posizionamento.

    10. Costruisci backlink di alta qualità

      Quando inserisci un link fallo con pagine che abbiano qualità elevata e approfondimenti.

    Se vuoi approfondire leggi il Nostro Articolo: Cos’è la Crawlability

    1) Rimuovi possibili blocchi di scansione di robots.txt


    Google non indicizza l’intero sito web? Potrebbe essere dovuto a un blocco di scansione in qualcosa chiamato file robots.txt.

    Per verificare la presenza di questo problema, vai su tuodominio.com/robots.txt.

    Cerca uno di questi due frammenti di codice:

    1| User-agent: Googlebot
    2| Disallow: /
    1| User-agent: *
    2| Disallow: /

    Entrambi dicono a Googlebot che non è autorizzato a eseguire la scansione di nessuna pagina del tuo sito.

    Per risolvere il problema, rimuovili. Semplice.

    Un blocco di scansione in robots.txt potrebbe anche essere il colpevole nel caso Google non stia indicizzando una singola pagina web.
    Per verificare se questo è il caso, incolla l’URL nello strumento di controllo URL in Google Search Console. Fai clic sul blocco “Pagine” per vedere maggiori dettagli, quindi cerca “Scansione consentita? No: bloccato dall’errore “robots.txt”.

    Ciò indica che la pagina è bloccata in robots.txt.

    robots.txt immagine del file

    In tal caso, ricontrolla il tuo file robots.txt per eventuali regole di “disallow” relative alla pagina o alla relativa sottosezione

    Rimuovere dove necessario.

    2) Rimuovi i tag noindex non autorizzati

    Google non indicizzerà le pagine se dici loro di non farlo. Questo è utile per mantenere private alcune pagine web. Ci sono due modi per farlo:

    Metodo 1: meta tag

    Le pagine con uno di questi meta tag nella sezione non verranno indicizzate da Google:

    1| <meta name=“robots” content=“noindex”>
    1| <meta name=“googlebot” content=“noindex”>
    

    Questo è un tag meta robots e indica ai motori di ricerca se possono o meno indicizzare la pagina.

    NOTA BENE: La parte fondamentale è il valore “noindex”. Se lo vedi, la pagina è impostata su noindex.
    Per trovare tutte le pagine con un meta tag noindex sul tuo sito, vai sulla Search Console e cerca nel tab Pagine, tutti gli url che sono contrassegnati con “Esclusa in base al tag “noindex””.

    pagina esclusa indicizzazione a causa del tag noindex

    Fai clic per visualizzare tutte le pagine interessate. Rimuovi il meta tag noindex da tutte le pagine a cui non appartiene.

    Metodo 2: X-Robots-Tag

    I crawler rispettano anche l’intestazione della risposta HTTP X-Robots-Tag. Puoi implementarlo usando un linguaggio di scripting lato server come PHP, o nel tuo file .htaccess, o modificando la configurazione del tuo server.

    Lo strumento d’ispezione degli URL in Search Console ti dice se a Google è impedito di eseguire la scansione di una pagina a causa di questa intestazione. Basta inserire il tuo URL ne motore, quindi cercare “Indicizzazione consentita? No: “noindex” rilevato nell’intestazione http “X-Robots-Tag””

    3) Includere la pagina nella mappa del sito


    Una mappa del sito indica a Google quali pagine del tuo sito sono importanti e quali no. Può anche fornire alcune indicazioni sulla frequenza con cui devono essere nuovamente sottoposti a scansione.

    Google dovrebbe essere in grado di trovare pagine sul tuo sito Web indipendentemente dal fatto che siano nella tua mappa del sito, ma è comunque buona norma includerle. Dopotutto, non ha senso rendere difficile la vita a Google.

    Per verificare se una pagina è presente nella tua Sitemap, utilizza lo strumento d’ispezione degli URL in Search Console. Se vedi l’errore “L’URL non è su Google” e “Mappa del sito: N/A”, allora questo non è nella tua mappa del sito o indicizzato.

    pagina esclusa indicizzazione a causa del tag noindex
    url non in sitemap su search console
    Url non in sitemap su search console

     

    Non usi Search Console? Vai all’URL della tua mappa del sito, in genere tuodominio.com/sitemap.xml, e cerca la pagina.
    Se queste pagine dovrebbero essere nella tua mappa del sito, quindi aggiungile. Al termine, fai sapere a Google che hai aggiornato la tua mappa del sito eseguendo il ping di questo URL:

    http://www.google.com/ping?sitemap=http://tuosito.com/sitemap_url.xml

    Sostituisci l’ultima parte con l’URL della tua sitemap. Dovresti quindi vedere qualcosa del genere:

    sitemap notifica ricezione google

    Ciò dovrebbe accelerare l’indicizzazione della pagina da parte di Google.

    4) Rimuovi i tag canonici non autorizzati


    Un tag canonical indica a Google qual è la versione preferita di una pagina. Assomiglia a questo:

    <link rel="canonical” href="/pagina.html/">

    La maggior parte delle pagine non ha tag canonico o quello che viene chiamato tag canonico autoreferenziale. Ciò indica a Google che la pagina stessa è la tua versione preferita e probabilmente l’unica. In altre parole, vuoi che questa pagina venga indicizzata.

    Ma se la tua pagina ha un tag canonico canaglia, potrebbe indicare a Google una versione preferita di questa pagina che non esiste. In tal caso, la tua pagina non verrà indicizzata.

    Per verificare la presenza di un tag canonico, utilizza lo strumento d’ispezione degli URL di Google. Vedrai un avviso “Pagina alternativa con tag canonico” se il canonico punta a un’altra pagina.

    pagina esclusa indicizzazione a causa del tag noindex

    Se questo non dovrebbe essere presente e desideri indicizzare la pagina, rimuovi il tag canonical.

    IMPORTANTE

    I tag canonici non sono sempre cattivi. La maggior parte delle pagine con questi tag li avrà per un motivo. Se vedi che la tua pagina ha un set canonico, controlla la pagina canonica. Se questa è effettivamente la versione preferita della pagina e non è necessario indicizzare anche la pagina in questione, allora il tag canonical dovrebbe rimanere.

     

    Questo cerca le pagine nella tua mappa del sito con tag canonici non autoreferenziali. Poiché quasi sicuramente desideri indicizzare le pagine nella tua mappa del sito, dovresti esaminare ulteriormente se questo filtro restituisce dei risultati.

    È molto probabile che queste pagine abbiano un canonico canaglia o che non dovrebbero essere nella tua mappa del sito in primo luogo.

    5) Verifica che la pagina non sia orfana

    Le pagine orfane sono quelle senza collegamenti interni che puntano ad esse.

    Poiché Google scopre nuovi contenuti eseguendo la scansione del Web, non è in grado di scoprire pagine orfane attraverso tale processo. Neanche i visitatori del sito web saranno in grado di trovarli.

    Per verificare la presenza di pagine orfane, esegui la scansione del tuo sito con Site Audit di SEO come ad esempio SEO Zoom. Successivamente, controlla il rapporto Audit URL Link per gli errori “Pagina orfana (non ha link interni in entrata)”:

    Questo tipo di audit mostra tutte le pagine indicizzabili e presenti nella tua mappa del sito, ma non hanno collegamenti interni che puntano ad esse.

    IMPORTANTE

    Questo processo funziona solo quando due cose sono vere:

    • Tutte le pagine che vuoi indicizzare sono nelle tue sitemap
    • Hai selezionato la casella per utilizzare le pagine nelle tue sitemap come punti di partenza per la scansione durante l’impostazione del progetto in Site Audit di Ahrefs.


    Non sei sicuro che tutte le pagine che vuoi indicizzare siano nella tua sitemap? Prova questo:

    Scarica un elenco completo delle pagine del tuo sito (tramite il tuo CMS)
    Scansiona il tuo sito web (utilizzando uno strumento come Site Audit di SEO Zoom)
    Incrocia i due elenchi di URL
    Tutti gli URL non trovati durante la scansione sono pagine orfane.

    Oppure In Yoast SEO Premium troverai il filtro per i contenuti orfani. Questo filtro ti consente di ottenere una rapida panoramica delle pagine del tuo sito Web che non hanno collegamenti ad esse. Ciò significa che sia i motori di ricerca che i visitatori non saranno in grado di trovare queste pagine.

    contenuti orfani Yoast

    Puoi correggere le pagine orfane in due modi:

    Se la pagina non è importante, eliminala e rimuovila dalla mappa del sito.
    Se la pagina è importante, incorporala nella struttura dei link interni del tuo sito web.

    I collegamenti nofollow sono collegamenti con un tag rel=“nofollow”. Impediscono il trasferimento del PageRank all’URL di destinazione. Google inoltre non esegue la scansione dei link nofollow.

    Ecco cosa dice Google in merito:

    In sostanza, l’utilizzo di nofollow ci fa eliminare i link target dal nostro grafico generale del web. Tuttavia, le pagine di destinazione potrebbero ancora apparire nel nostro indice se altri siti si collegano ad esse senza utilizzare nofollow o se gli URL vengono inviati a Google in una Sitemap.

    In breve, dovresti assicurarti che tutti i collegamenti interni alle pagine indicizzabili siano seguiti da dofollow.

    Rimuovi il tag nofollow da questi link interni, supponendo che tu voglia che Google indicizzi la pagina. In caso contrario, elimina la pagina o non indicizzarla.

    Google scopre nuovi contenuti eseguendo la scansione del tuo sito web. Se trascuri di collegare tra loro le pagine internamente, Google potrebbe non essere in grado di trovare le pagine non linkate ad altre.

    Una semplice soluzione a questo problema consiste nell’aggiungere alcuni collegamenti interni alla pagina che vuoi indicizzare.

    Puoi farlo da qualsiasi altra pagina web che Google può scansionare e indicizzare. Tuttavia, se vuoi che Google indicizzi la pagina il più velocemente possibile, ha senso farlo da una delle tue pagine più “potenti”.

    Come mai? Perché è probabile che Google esegua nuovamente la scansione di tali pagine più velocemente delle pagine meno importanti.

     

    SUGGERIMENTO

    Incolla la pagina da cui hai aggiunto il link interno nello strumento di controllo degli URL di Google. Premi il pulsante “Richiedi indicizzazione” per far sapere a Google che qualcosa nella pagina è cambiato e che bisogna eseguire nuovamente la scansione il prima possibile. Ciò potrebbe accelerare il processo di scoperta del collegamento interno e, di conseguenza, la pagina che desideri indicizzare.

    8) Assicurati che la pagina sia indispensabile e ben costruita

    È improbabile che Google indicizzi pagine di bassa qualità perché non hanno alcun valore per i suoi utenti. Ecco cosa ha detto John Mueller di Google sull’indicizzazione nel 2018:

    Non indicizziamo mai tutti gli URL conosciuti, è abbastanza normale. Mi concentrerei sul rendere il sito fantastico e stimolante, quindi le cose di solito funzionano meglio.

    John Mueller – Google

    In questa frase Muller implica che se vuoi che Google indicizzi il tuo sito web o la tua pagina web, questa deve essere “fantastica e stimolante”.

    Se hai escluso problemi tecnici per la mancanza di indicizzazione, la colpa potrebbe essere la mancanza di valore. Per questo motivo, vale la pena rivedere la pagina con occhi nuovi e chiedersi: questa pagina è veramente preziosa per il mio utente?

    Un utente troverebbe valore in questa pagina se ci cliccasse sopra dai risultati di ricerca?

    Se la risposta è no a una di queste domande, allora devi migliorare i tuoi contenuti.

    Puoi trovare più pagine potenzialmente di bassa qualità che non sono indicizzate utilizzando lo strumento Pagine di Search Console. Per farlo, vai su Pagine in Search Console e controlla le Pagine non indicizzate contrassegnate con: “Pagina scansionata, ma attualmente non indicizzata”.

    Ciò restituirà un elenco di pagine cosiddette dai contenuti “sottili” che sono indicizzabili e che attualmente non ricevono traffico organico. In altre parole, c’è una buona possibilità che non siano o non saranno indicizzate.

    Leggi anche la nostra guida a Google PageSpeed

    9) Rimuovere le pagine di bassa qualità (per ottimizzare il “crawl budget”)

    Avere troppe pagine di bassa qualità sul tuo sito web spreca il crawl budget.

    Ecco cosa dice Google in merito:

    Lo spreco di risorse del server su [pagine a basso valore aggiunto] eliminerà l’attività di scansione da pagine che hanno effettivamente valore, il che potrebbe causare un ritardo significativo nella scoperta di ottimi contenuti su un sito.

    Pensa a questo elemento come a un insegnante che valuta i saggi, da sottoporre ai propri studenti, e uno dei quali è il tuo. Se ha solo dieci saggi da valutare, arriverà al tuo abbastanza velocemente.

    Se invece ha cento saggi, ci vorrà un po’ di più.
    Infine se ne avesse migliaia, il carico di lavoro è troppo alto e potrebbe non riuscire mai a valutare il tuo saggio.

    Google afferma che “il crawl budget […] non è qualcosa di cui la maggior parte degli editori deve preoccuparsi” e che “se un sito ha meno di qualche migliaio di URL, la maggior parte delle volte verrà sottoposto a scansione in modo efficiente“.

    Tuttavia, rimuovere pagine di bassa qualità dal tuo sito Web non è mai una brutta cosa. Non può che avere un effetto positivo sul crawl budget.

    Puoi utilizzare il nostro modello di verifica dei contenuti per trovare pagine potenzialmente di bassa qualità e irrilevanti che possono essere eliminate.


    I backlink dicono a Google che una pagina web è importante. Dopotutto, se qualcuno si collega ad esso, allora deve avere un certo valore. Queste sono pagine che Google vuole indicizzare.

    Per la massima trasparenza, Google non si limita a indicizzare le pagine web con i backlink. Ci sono un sacco (miliardi) di pagine indicizzate senza backlink. Tuttavia, poiché Google considera più importanti le pagine con link di alta qualità, è probabile che esegua la scansione e riscansione di tali pagine più velocemente di quelle senza back link. Ciò porta a un’indicizzazione più rapida.

    Indicizzazione ≠ Posizionamento


    Avere indicizzati il tuo sito web o la tua pagina web su Google non equivale a posizionamento o traffico.

    Sono due cose diverse.

    L’indicizzazione significa che Google è a conoscenza del tuo sito web. Ciò non significa che lo posizionerà per qualsiasi domanda pertinente e utile dei propri utenti.

    È qui che entra in gioco la SEO: l’arte di ottimizzare le tue pagine web per posizionarle in base a query specifiche.

    In breve, la SEO implica:

    • Trovare ciò che i tuoi clienti stanno cercando;
    • Creazione di contenuti attorno a tali argomenti;
    • Ottimizzazione di quelle pagine per le parole chiave target;
    • Costruire backlink;
    • Ripubblicare regolarmente i contenuti per mantenerli “sempreverdi”.