XML-sivustokartta on tiedosto, jonka sisältö on hakukoneiden ymmärtämässä muodossa. Sellainen sivustokartta sisältää ne yksittäiset URL-osoitteet, jotka kuuluvat tietylle sivustolle. Esimerkiksi Stafetti.fi-sivuston oma XML-sivustokartta sisältää nyt avoinna olevan sivun osoitteen*, sekä kaikki muut sivut, jotka halutaan ilmoittaa hakukoneille.

Kaikkein yksinkertaisin sivustokartta on pelkkä tekstitiedosto, jossa yhdellä rivillä on yhden sivun osoite. Tällaisen sivustokartan merkistökoodauksen on oltava UTF-8. Se ei saa sisältää muuta sisältöä URL-osoitteiden lisäksi; ei kommentteja, ei hymiöitä tai emojeja. Tekstimuotoisen sivustokartan tiedostopääte voi olla mikä tahansa, mukaan lukien .txt.

Tältä tekstimuotoinen sivustokartta näyttää

Tässä sivustokartassa on neljä URL-osoitetta. Kaikki osoitteet sisältävät osoitteen absoluuttisessa muodossa, eli kokonaan. Se tarkoittaa, ettei osoitteen alusta jätetä pois esimerkiksi https://-protokollaa.

https://stafetti.fi/
https://stafetti.fi/xml-sivustokartta-ja-seo
https://stafetti.fi/tekijanoikeuksista-kertova-teksti-on-turha
https://stafetti.fi/avainsanojen-metatagi-on-turha

Esimerkki XML-sivustokartasta

Tässä sivustokartassa on vain kolme URL-osoitetta. Kukin osoite sisältää varsinaisen osoitteen lisäksi ekstratietoja, kuten viimeisen muokkauspäivämäärän, arvellun muutostiheyden, sekä sivun tärkeyttä kuvaavan numeron väliltä 0–1.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://stafetti.fi/</loc>
<lastmod>2021-08-20</lastmod>
<changefreq>weekly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://stafetti.fi/xml-sivustokartta-ja-seo</loc>
<lastmod>2021-08-20</lastmod>
<changefreq>yearly</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>https://stafetti.fi/tekijanoikeuksista-kertova-teksti-on-turha</loc>
<lastmod>2021-08-19</lastmod>
<changefreq>yearly</changefreq>
<priority>0.4</priority>
</url>
<url>
<loc>https://stafetti.fi/avainsanojen-metatagi-on-turha</loc>
<lastmod>2021-08-18</lastmod>
<changefreq>monthly</changefreq>
<priority>0.7</priority>
</url>
</urlset>

Näyttääkö yllä oleva sotku monimutkaiselta? Onneksi useimmat julkaisujärjestelmät, kuten WordPress, Textpattern, Drupal, ja Joomla, tuottavat automaattisesti tuollaista XML-merkkausta joko omin avuin tai järjestelmään asennettavan lisäosan avulla.

Yläpuolen kaksi sivustokarttaesimerkkiä ovat toki sellaisia, ettei niitä tarvitse välttämättä tehdä — noin vaatimattoman kokoisen nettisivuston osoiterakenne käynnee hakukoneelle ilmi muutoinkin kun sen robotti käy tutkimassa nettisivun sisältöä.

Yksittäinen nettisivusto voi lähettää hakukoneille useita sivustokarttoja. Niin kannattaa tehdä erityisesti silloin jos sivustokartan tiedostokoko on 50 megatavua tai se sisältää 50 000 osoitetta.

Mikäli nettisivulla on sama sisältö usealla sivulla, on hakukoneen hankala ymmärtää kumpi niistä laitetaan hakutuloksiin, ja miten korkealle. Sen vuoksi tuplasisältöä sisältävät osoitteet on syytä jättää pois sekä sivustokartasta että varsinaiselta nettisivulta.

Sivustokartassa olevat osoitteet voivat olla sikin sokin. Järjestyksellä ei ole väliä. Googlen kannalta XML-sivustokartan changefreq- ja priority-tiedot ovat yhtä tyhjän kanssa — Google ei lue niitä. Sen sijaan Google lukee loc- ja lastmod-kenttien tiedot.

Miten sivustokartta ilmoitetaan Googlelle ja Bingille?

Googlelle:

  1. Sen voi ilmoittaa Googlelle Search Consolen kautta.
  2. Voi pingata osoitetta google.com/ping?sitemap=https://stafetti.fi/sivustokartta.xml, mutta esimerkin URL tulee korvata oman sivustokartan osoitteella.
  3. robots.txt-tiedostoon voi laittaa omalle rivilleen: Sitemap: https://stafetti.fi/sivustokartta.xml. Myös tässä esimerkki-URL:in tilalle tulee oman sivustokartan osoite.

Bingille:

  1. Sen voi ilmoittaa Bing Webmaster Toolsissa.
  2. Voi pingata osoitetta bing.com/ping?sitemap=https://stafetti.fi/sivustokartta.xml, mutta esimerkin URL tulee korvata oman sivustokartan osoitteella.
  3. Sama juttu kuin Googlen suhteen: robots.txt-tiedostoon voi laittaa omalle rivilleen: Sitemap: https://stafetti.fi/sivustokartta.xml. Myös tässä esimerkki-URL:in paikalle kuuluu oman sivustokartan osoite.

*) https://stafetti.fi/xml-sivustokartta-ja-seo


Sivu ilmestyi . Sen kirjoitti, kuten valtaosan muistakin Stafetti.fi-sivuston jutuista, nimimerkki .