Il concetto di sitemap non è nuovo. Vengono utilizzate degli albori del web, anche se allora erano destinate ai visitatori in carne e ossa e quindi erano normali pagine HTML. Il fatto che potessero aiutare anche l’indicizzazione da parte dei motori di ricerca era solo un beneficio secondario. Le sitemap HTML sono una collezione organizzata dei link delle sezioni principali di un sito, una sorta di sommario dei contenuti. Le sitemap in HTML sono tuttora il pane quotidiano di chiunque si occupi di SEO, visto che continuano ad essere le più diffuse.
Con il passare degli anni, i motori di ricerca hanno capito i vantaggi delle sitemap. Google iniziò a utilizzare questa idea nel 2005, con la creazione del proprio Google Sitemap Protocol. Poco dopo, Yahoo!, Microsoft, Ask e IBM salirono sul carro. Nel 2006 il Google Sitemaps Protocol fu ribattezzato XML Sitemap Protocol, per sottolineare la sua connotazione “universale”. Questi sforzi comuni sono ora sotto gli auspici di Sitemaps.org.
L’idea che sta dietro l’XML Sitemap Protocol è quella di aiutare i motori di ricerca a indicizzare più velocemente le pagine, fornendo, allo stesso tempo, una tecnologia utile per migliorare gli algoritmi degli spider per decidere come seguire il link che trovano durante il loro vagare per il web. Notate che l’uso di questo protocollo, oltre a essere obbligatorio, non garantisce nulla in termini di miglioramento posizionamento nelle pagine dei risultati. Vale anche il contrario: se un sito non utilizza il formato XML per le proprie sitemap, non verrà penalizzato dai motori di ricerca.
Le sitemap possono essere raggruppate in due grandi categorie: quelle destinate agli utenti in carne e ossa e quelle realizzate a uso e consumo dei motori di ricerca. Entrambe queste categorie sono importanti perché nel primo caso aiutano i visitatori a raggiungere velocemente le informazioni di cui hanno bisogno e nel secondo caso aiutano gli spider dei motori di ricerca a trovare i link all’interno del sito.
Non esiste una ricetta di Sitemap universale valida per ogni sito. Conoscere le opzioni a disposizioni è importante per poter fare le scelte più opportune in base alle proprie esigenze.
Le sitemap XML possono far riferimento solo a URL che puntano alla stessa directory in cui compare la sitemap, o a sue sottodirectory. Una sitemap all’indirizzo https://nomesito.it/sitemap.xml, per esempio può contenere solo URL che iniziano con https://nomesito.it/.
E’ possibile avere diverse sitemap su domini diversi, ma dovrete fornire le prove che siete i legittimi proprietari di tutti i di tutti i domini coinvolti. Supponiamo che dominiA.it ospiti una sitemap contenente URL di dominiB.it. L’URL della sitemap sarà https://dominioA.it/sitemapdominioB.xml. Il dominio B dovrà allora avere nel proprio robots.txt una diversa direttiva che indica ai motori di ricerca dove è collocata la sua sitemap.
Sebbene la sitemap XML possono avere nomi arbitrari, il nome raccomandato è sitemap.xml. Notate, tuttavia, che molti scelgono di utilizzare nomi diversi da quello raccomandato per evitare che spider malevoli possono ottenere facilmente tutti gli URL di un sito.
L’utilizzo delle sitemap XML presenta alcuni limiti. Per esempio una sitemap non può contenere più di 50.000 link. In questo caso sarà necessario suddividere la sitemap in più file e utilizzare un file indice che potrà contenere al massimo 1.000 sitemap XML. A conti fatti, ciò significa che un massimo di 50 milioni di URL .
La creazione delle sitemap XML automatica è facile da elaborare per siti con strutture di link ben progettate. Se siete ragionevolmente sicuri che un broswer in modalità solo testo possa raggiungere ogni pagina del vostro sito, potete scrivere uno script che in automatico generi la sitemap XML.
Per comunicare i motori di ricerca l’indirizzo delle vostre sitemap XML, è possibile utilizzare tre metodi. Alcuni motori di ricerca, per esempio Google, danno la possibilità di sottomettere la sitemap tramite i loro strumenti (Search Console Google), sempre se si ha un account per potervi accedere. Il secondo metodo consiste nell’utilizzare il comando ping in questo modo:
http://www.google.com/ping?sitemap=https://example.com/sitemap.xml , tramite il broswer.
Il terzo metodo è come già detto prima, di utilizzare la direttiva sitemap nel file robots.txt
La creazione di una sitemap in HTML è facile da creare per siti di piccole dimensioni. E’ possibile costruirle utilizzando un semplice edito di testo come Notepad. Per siti di grandi dimensioni, ha più senso utilizzare strumenti automatici in grado di raccogliere automaticamente i link. La sitemap HTML è uno strumento che i webmaster possono sfruttare a loro favore per poter migliorare la navigazionabilità di un sito web.
Lascia un commento