Creazione contenuti

Problemi di indicizzazione su Google: come correggere gli errori5 min read

12 Aprile 2021

author:

Problemi di indicizzazione su Google: come correggere gli errori5 min read

Il tuo sito non compare sui motori di ricerca? Potrebbe c’entrare l’indicizzazione e non la mancanza di ranking. Questa è una differenza importante, che molti ancora confondono: un sito posizionato in modo errato è comunque indicizzato, quindi cercandolo sul motore di ricerca è possibile trovarlo.

Problemi di indicizzazione su Google: come individuare gli errori e correggerli

Come verificare di essere indicizzati sui motori di ricerca? Scalare le SERP di Google: una battaglia SEO! La prima cosa da fare è capire se c’è davvero un problema tecnico nell’indicizzazione del sito. Disabilita semplicemente SafeSearch e digita domainname.tld (ovviamente, cambia il tuo domainname.tld nel tuo dominio effettivo).Questo ti mostrerà tutte le pagine del tuo dominio che Google ha indicizzato. Se non trovi risultati, significa che il sito non è presente nell’indice. Il motore di ricerca potrebbe impiegare del tempo per indicizzare le pagine! Come consiglia l’assistenza di Google: attendi almeno una settimana dopo aver inviato una Sitemap o aver richiesto l’indicizzazione prima di presumere che ci sia un problema.

Se il problema non è il “fattore tempo” e sei sicuro di aver implementato tutte le best practice per aiutare il motore di ricerca a trovare le tue pagine, il secondo passaggio, potrebbe essere quello di approfondire il rapporto sulla copertura di Google Search Console, al fine di ottenere informazioni più precise sull’andamento del sito.

Capita spesso che quando crei un sito web con WordPress, non presti la massima attenzione a determinati aspetti. Accedi all’area di amministrazione di WordPress e vai su Impostazioni> Lettura., invia la home page a Search Console URL Inspection. Può contenere configurazioni in grado di reindirizzare il traffico ad altri domini, impostare la durata della cache, proteggere l’accesso a una cartella, impedire l’indicizzazione e molto altro ancora Modificare il file .htaccess è un’operazione molto delicata azione, che dovrebbe essere eseguita solo dopo diversi test in un ambiente di test in quanto, commettendo errori, potremmo arrivare a scatenare un loop infinito della nostra pagina.

Un altro passaggio che devi compiere per indicizzare correttamente il tuo sito web è controllare come è stato inserito il file di testo robots.txt, che è un file di testo codificato con caratteri UTF. La sintassi di base di un file robots.txt è abbastanza semplice: specifichi il nome di un robot e un’azione, il crawler viene identificato dall’agente utente, mentre le azioni (es. Disallow) possono essere specificate nel disallow. Tuttavia, un file robots.txt configurato in modo errato potrebbe anche avere una regola che impedisce a bot e spider di eseguire la scansione di una determinata pagina che desideri venga visualizzata nei risultati di ricerca.

Tutti sanno che a Google piacciono i contenuti, ma il contenuto deve essere unico. Sappiamo che questa condizione è molto rara, soprattutto nell’e-commerce (si pensi ad esempio a una pagina di elenco di prodotti ordinati per prezzo crescente, prezzo decrescente e ultimi arrivi). Se le pagine del tuo sito web utilizzano gli stessi blocchi di contenuto, Google identifica quelle pagine come fondamentalmente le stesse, il che può comportare l’indicizzazione di Google solo una delle pagine che visualizza il contenuto e di conseguenza, si consiglia di indicare al motore di ricerca quale delle pagine è quella rappresentativa, facendo attenzione che diventi “canonica”, rispetto alle altre, che verranno “canonizzate”. Le altre pagine, invece, non verranno indicizzate. Se gestiti in modo errato, i parametri potrebbero causare l’esclusione degli URL dai risultati di ricerca.

Quando un utente, o uno spider, visita una pagina di un sito web, il browser richiede informazioni al server, ovvero l’HTML di base e varie risorse esterne (comprese quelle che utilizzano Javascript). Quindi il browser combina tutte le informazioni acquisite per caricare la pagina web completa di tutte le sue funzionalità. Quando lo spider incontra pagine web con JavaScript, utilizza il proprio renderer per eseguirlo. Tuttavia, poiché ciò richiede molto tempo e risorse di calcolo, il rendering dei siti Web basati su JavaScript viene differito fino a quando Googlebot non avrà le risorse disponibili per elaborare tali contenuti. Ciò significa che il bot due ondate di indicizzazione tra i contenuti, ed è possibile che alcuni dettagli vadano persi.

L’impostazione JavaScript mal eseguita potrebbe causare una scansione errata del sito e quindi avere effetti negativi sull’indicizzazione e sul posizionamento del sito. Di seguito sono riportati alcuni dei casi più comuni in cui un sito può avere problemi di indicizzazione: HTML di base troppo diverso dall’HTML finale con JavaScript. Quando Google esegue per la prima volta la scansione del sito, non ne esegue nemmeno il rendering. Prova a disabilitare JavaScript dal tuo browser e naviga nel sito per verificare che venga visualizzato correttamente, quindi, confronta il codice HTML della pagina sottoposta a rendering (Google Mobile Friendly Test) con quello mostrato nel codice sorgente per evidenziare eventuali differenze.

Controlla se le azioni manuali siano state applicate al tuo sito. La conseguenza potrebbe essere una semplice diminuzione visibile del ranking, ma anche la totale rimozione del sito dai risultati di ricerca. Verificare inoltre che sul sito non siano stati segnalati problemi di sicurezza. Non si conoscono i tempi di risoluzione di questo problema: gli URL possono tornare ad indicizzarsi correttamente in un paio di giorni ma, per recuperare le posizioni perse, possono volerci mesi.

 

 

Contents 

Contents è una marketing tech company innovativa e altamente performante che ha sviluppato una piattaforma software proprietaria che analizza, produce e diffonde contenuti originali. Contents utilizza inoltre il sistema di Natural Language Generation, basato sull’Intelligenza Artificiale, che permette di creare, in pochi secondi, contenuti nativamente multilingue e personalizzati, senza alcun bisogno di intervento umano. I nostri servizi sono pensati per e-commerce, editors e web agency. Iscriviti gratis!

 

Leave a comment

Il tuo indirizzo email non sarà pubblicato.