XML Sitemap ist eine Datei, die alle Seiten innerhalb einer Webseitenstruktur auflistet und damit die Indizierung für Suchmaschinen erleichtern soll. Diese XML Datei kann von den grossen Suchservices Google, Microsoft und Yahoo gelesen werden.
Die meisten herkömlichen Webauftritte benötigen keine XML Sitemaps, da die Suchmaschinen-Crawler selbständig von der Startseite weg alle Links der Webseite verfolgen. Dies heisst: Suchmaschinen können kleinere Webseitenstrukturen selbständig indizieren.
Für größere Portale oder ständig aktualisierten Webseiten (Blogs) empfiehlt sich der Einsatz dieses Formates, da die Suchmaschinen-Crawler nur eine bestimmte Menge an Content pro Tag scannen können. Über bestimmte Parameter innerhalb der Datei ist es möglich die wichtigsten Seiten dem Crawler bekanntzugeben. Es gibt auch Webseiten eines Webauftrittes, die nicht unbedingt in einem Suchergebnis vorkommen sollen. (Eine „Danke-Seite“ nach dem Ausfüllen eines Formulare z. Bsp.)
Wie ist diese XML Datei aufgebaut?
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.liechtenecker.at/</loc>
<lastmod>2008-04-14T05:19:52+00:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.liechtenecker.at/blogeintrag/social-networks-uk
<lastmod>2008-04-14T05:19:52+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.2</priority>
</url>
...
</urlset>
- Die 1. Zeile beschreibt eine XML Datei mit dem Zeichensatz UTF-8. Eine XML-Sitemap muss in diesem Format vorliegen.
- <urlset> und </urlset> – sind der Rahmen der eigentlichen Daten
- <url> und </url> – umschliessen jeweils einen Seiteneintrag
- <loc> und </loc> – Die echte URL der Seite
- <lastmod> und </lastmod> – Das Datum der letzten Modifikation des Seiteninhaltes
- <changefreq> und </changefreq> – Die Frequenz/Häufigkeit für die Änderung des Seiteninhaltes
- <priority> und </priority> – Der Zahlenwert der Wichtigkeit/Priorität der Seite innerhalb der Struktur 0.0 unwichtig –> 1.0 wichtig
Diese Datei muss immer auf dem obersten Verzeichnis liegen, also dort wo sich auch die Startseite des Webauftrittes befindet. Es können für komplexere Fälle (z. Bsp.: Mehrsprachigkeit) mehrere solcher XML-Dateien angelegt werden, die widerrum innerhalb einer Sitemap-Indexdatei abgehandelt werden sollen.
Nachdem die Sitemap am Webspace abgelegt worden ist müssen die Suchmaschinen natürlich auch von deren Existenz erfahren. Das geschieht entweder über dementsprechende Webmaster Zentralen der Suchmaschinen in denen die URL der Sitemap-XML eingetragen wird, oder über die „Auto Discovery“-Methode. Dabei wird innerhalb einer robots.txt Datei folgendes eingetragen:
Sitemap: URL der Sitemap
Mehr Konform bietet ein passendes Plug-in auf WordPress, dass auf diesem Blog verwendet wird. Nach der Installation und Aktivierung wird bei jedem neuen Blogeintrag eine neue XML-Datei erstellt. Etwas Ähnliches gibt es auf für das CMS Drupal.
Weiterführende Links:
- http://www.xml-sitemaps.com/ – Sitemap Generator über ein Webformular
- Google Webmaster Tools – Sitemap eintragen und erklärt bei Google
- Yahoo Siteexplorer – Sitemap eintragen bei Yahoo
- WebmasterLive – Sitemap eintragen bei Microsoft
Du willst mit jemanden über das Thema plaudern?
Einen kostenlosen Termin mit CEO Susanne vereinbaren!UX Snacks Vol.09
That’s a wrap on UX Snacks 2024. Am 7. November hat die vierte und letzte Ausgabe in diesem Jahr stattgefunden und wir nehmen mit diesem Recap ganz viel positive UX-Energie mit ins neue Jahr. Und keine Angst: Schon bald verkünden wir die Daten für 2025.
Jetzt lesenFolge #62 mit Susanne Liechtenecker
In Folge 62 besinnt sich Susanne auf die Anfänge dieses Podcasts und begrüßt keinen Gast, sondern erzählt über das Buch "Jäger, Hirten, Kritiker" von Richard David Precht und warum es sie inspiriert hat.
Jetzt anhören