Sitemap XML

XML Sitemap ist eine Datei, die alle Seiten innerhalb einer Webseitenstruktur auflistet und damit die Indizierung für Suchmaschinen erleichtern soll. Diese XML Datei kann von den grossen Suchservices Google, Microsoft und Yahoo gelesen werden.

Die meisten herkömlichen Webauftritte benötigen keine XML Sitemaps, da die Suchmaschinen-Crawler selbständig von der Startseite weg alle Links der Webseite verfolgen. Dies heisst: Suchmaschinen können kleinere Webseitenstrukturen selbständig indizieren.

Für größere Portale oder ständig aktualisierten Webseiten (Blogs) empfiehlt sich der Einsatz dieses Formates, da die Suchmaschinen-Crawler nur eine bestimmte Menge an Content pro Tag scannen können. Über bestimmte Parameter innerhalb der Datei ist es möglich die wichtigsten Seiten dem Crawler bekanntzugeben. Es gibt auch Webseiten eines Webauftrittes, die nicht unbedingt in einem Suchergebnis vorkommen sollen. (Eine „Danke-Seite“ nach dem Ausfüllen eines Formulare z. Bsp.)

Wie ist diese XML Datei aufgebaut?


<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.liechtenecker.at/</loc>
<lastmod>2008-04-14T05:19:52+00:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.liechtenecker.at/blogeintrag/social-networks-uk
<lastmod>2008-04-14T05:19:52+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.2</priority>
</url>
...
</urlset>

  • Die 1. Zeile beschreibt eine XML Datei mit dem Zeichensatz UTF-8. Eine XML-Sitemap muss in diesem Format vorliegen.
  • <urlset> und </urlset> – sind der Rahmen der eigentlichen Daten
  • <url> und </url> – umschliessen jeweils einen Seiteneintrag
  • <loc> und </loc> – Die echte URL der Seite
  • <lastmod> und </lastmod> – Das Datum der letzten Modifikation des Seiteninhaltes
  • <changefreq> und </changefreq> – Die Frequenz/Häufigkeit für die Änderung des Seiteninhaltes
  • <priority> und </priority> – Der Zahlenwert der Wichtigkeit/Priorität der Seite innerhalb der Struktur 0.0 unwichtig –> 1.0 wichtig

Diese Datei muss immer auf dem obersten Verzeichnis liegen, also dort wo sich auch die Startseite des Webauftrittes befindet. Es können für komplexere Fälle (z. Bsp.: Mehrsprachigkeit) mehrere solcher XML-Dateien angelegt werden, die widerrum innerhalb einer Sitemap-Indexdatei abgehandelt werden sollen.

Nachdem die Sitemap am Webspace abgelegt worden ist müssen die Suchmaschinen natürlich auch von deren Existenz erfahren. Das geschieht entweder über dementsprechende Webmaster Zentralen der Suchmaschinen in denen die URL der Sitemap-XML eingetragen wird, oder über die „Auto Discovery“-Methode. Dabei wird innerhalb einer robots.txt Datei folgendes eingetragen:
Sitemap: URL der Sitemap

Mehr Konform bietet ein passendes Plug-in auf WordPress, dass auf diesem Blog verwendet wird. Nach der Installation und Aktivierung wird bei jedem neuen Blogeintrag eine neue XML-Datei erstellt. Etwas Ähnliches gibt es auf für das CMS Drupal.

Weiterführende Links:

Über den Autor

Juergen

Meine Rolle bei Liechtenecker:
Coach, Trainer, Meditations- und Achtsamkeitslehrer
Wenn es weder IT noch Digitalisierung oder Meditation gäbe, wäre mein Beruf:
Yogimeister

Mein Herz schlägt für:
Meine Familie, mein tolles Team, alle Menschen

Du hast etwas zum Artikel zu sagen? Schreibe es nieder

Schreibe einen Kommentar

Kommentare