Cos’è?
Il sitemap.xml è quel file che ci permette di specificare le url del sito che desideriamo che vengano indicizzate da google (o yahoo, bing). La presenza o meno di un url specifico nel sitemap.xml non ci fornise la certezza matematica che venga indicizzato, ma di certo facilita il compito dei vari bot che girano ogni tanto sul website di considerare l’esistenza della pagina.
Limiti sitemap
Il file sitemap.xml non ha più di tanti segreti di sintassi e non è particolarmente difficile da gestire/generare o creare. Tuttavia esistono dei limiti massimi da tenere controllati, eccoli:
- 50.000 urls.
- 10MBytes di dimensione massima del file sitemap.xml.
Nel caso ci si avvicini pericolosamente ad uno di questi limiti, possiamo pensare di dividere il nostro sitemap in differenti files. A dire il vero però, dividere il sitemap in più files non è certo solo utile per evitare il raggiungimento dei limiti, esistono anche altri casi specifici dove risulta necessario farlo, eccone alcuni:
- raggiunti i limiti.
- dividere il sitemap in contenuti statici e dinamici.
- generazione automatica del sitemap.xml, quindi esigenza di dividere le parti generate automaticamente da quelle aggiunte manualmente.
- pulizia e gestione ordinata del sitemap.
- divisione del sitemap basata sulla longevità delle pagine.
Come dividere il file sitemap.xml in più files:
Per dividere il file sitemap.xml in più files è necessario quindi creare un sitemap.xml pensato come contenitore che includa diversi altri files. Nell’esempio riportato in seguito, dichiariamo ben 4 files differenti che includono differenti url, categorizzate per tipologia; ecco la sintassi corretta:
<sitemapindex> <sitemap> <loc>http://www.miosito.it/sitemap_nuovi_prodotti.xml</loc> </sitemap> <sitemap> <loc>http://www.miosito.it/sitemap_pagine_statiche.xml</loc> </sitemap> <sitemap> <loc>http://www.miosito.it/sitemap_prodotti.xml</loc> </sitemap> <sitemap> <loc>http://www.miosito.it/sitemap_categorie.xml</loc> </sitemap> </sitemapindex>
Fatto!