Non sai come configurare ed ottimizzare il file robots.txt per il tuo sito Joomla? Ti spiego come fare.

Vi ricordate del nostro articolo sull'importanza del file Robots.txt?

Il file robots.txt è un file di testo utilizzato per impostare particolari restrizioni ai Bot (chiamati anche Spider, dei Motori di ricerca) per l’indicizzazione e l’analisi di un determinato sito web.

Il file contiene precise istruzioni che possono impedire a tutti o solo alcuni spider, il prelievo di alcune o tutte le pagine di un sito.

Considerato che il file consente di impostare precise istruzioni per i Motori di Ricerca (cosa indicizzare, e cosa “non” indicizzare”), potete facilmente comprenderne l'importanza e l'impatto SEO che può avere sul posizionamento di un determinato sito.

Vediamo in questo articolo, come impostare ed ottimizzare al meglio il file “Robots.txt” per un sito Joomla, in modo da favorire una buona visibilità sui Motori di Ricerca.

L'importanza del file Robots.txt per il Posizionamento

Come detto a inizio articolo, il file robots.txt ha un notevole impatto sulla SEO del vostro sito.

Grazie a questo file, avete la possibilità di dire chiaramente al motore di ricerca, cosa volete che venga indicizzato (e cosa volete che non venga indicizzato). Nel caso di Joomla, imposteremo il file in modo di escludere le cartelle di amministrazione e dei componenti, dall'indicizzazione sui motori.

Il file Robots.txt di Joomla 2.5

Ecco il file originale “robots.txt“, presente in Joomla 2.5:

# If the Joomla site is installed within a folder such as at
# e.g. www.example.com/joomla/ the robots.txt file MUST be
# moved to the site root at e.g. www.example.com/robots.txt
# AND the joomla folder name MUST be prefixed to the disallowed
# path, e.g. the Disallow rule for the /administrator/ folder
# MUST be changed to read Disallow: /joomla/administrator/
#
# For more information about the robots.txt standard, see:
# http://www.robotstxt.org/orig.html
#
# For syntax checking, see:
# http://www.sxw.org.uk/computing/robots/check.html

User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/

La prima parte del file (commentata con il simbolo cancelletto), mostra quali impostazioni adottare qualora Joomla venga installato in una cartella precisa, differente dalla root del dominio.

Nella seconda parte, troviamo le varie istruzioni per i Motori di Ricerca. La voce

User-agent: *

Indica a tutti gli spider dei Motori di ricerca, di bloccare l'indicizzazione delle seguenti cartelle:

Disallow: /administrator/
Disallow: /cache/
Disallow: ...
etc.

Come permettere a Google di indicizzare anche le immagini

Come potete vedere dal comando “Disallow: /images/“, di default, nel file robots.txt di Joomla 2.5, l'indicizzazione delle immagini è bloccata. Questo significa che le immagini non verranno indicizzate da Google e gli altri Motori di Ricerca, e non verranno incluse nella ricerca di immagini.

Per tutti coloro che vogliono modificare questa impostazione, e permettere a Google di indicizzare le immagini di Joomla, aggiungendo un ulteriore livello di visibilità sui motori di ricerca, basta rimuovere il sopra citato comando dal file robots.txt. Rimuovete quindi dal file:

Disallow: / images /

E dopo salvate il file modificato.

Aggiungere un riferimento alla Sitemap

Per chi dispone nel proprio sito Joomla di una Sitemap, mappa dei post molto utilie per l'indicizzazione ed il posizionamento sui Motori di Ricerca, è possibile includere la seguente riga nel robots.txt:

Sitemap: http://www.iltuosito.it/sitemap.xml

Ovviamente, modificate l'URL a seconda della posizione della vostra Sitemap.

Modificare il file Robots.txt

Volete apportare delle modifiche al vostro file robots.txt?

Non preoccupatevi, nulla di più facile. Ricordate che il robots.txt è un semplice file di testo, che può essere aperto e modificato con un qualsiasi editor di testo (Blocco Note e/o Wordpad per Windows, per esempio).

L'estensione del file è la classica “.txt” e deve rimanere tale, per funzionare correttamente. La posizione del file sarà nella root del vostro sito, ovvero nella cartella principale di dove sono situati i file del vostro sito.

Guida al file Robots.txt

Avete problemi con la configurazione del vostro file robots.txt? Ecco una guida per configurare il file robots.txt, con tutti i comandi e le istruzioni per i Motori di Ricerca. Buon posizionamento con Joomla, alla prossima!