Sitemap XML

16. April 2008, von Jürgen

XML Sitemap ist eine Datei, die alle Seiten innerhalb einer Webseitenstruktur auflistet und damit die Indizierung für Suchmaschinen erleichtern soll. Diese XML Datei kann von den grossen Suchservices Google, Microsoft und Yahoo gelesen werden.

Die meisten herkömlichen Webauftritte benötigen keine XML Sitemaps, da die Suchmaschinen-Crawler selbständig von der Startseite weg alle Links der Webseite verfolgen. Dies heisst: Suchmaschinen können kleinere Webseitenstrukturen selbständig indizieren.

Für größere Portale oder ständig aktualisierten Webseiten (Blogs) empfiehlt sich der Einsatz dieses Formates, da die Suchmaschinen-Crawler nur eine bestimmte Menge an Content pro Tag scannen können. Über bestimmte Parameter innerhalb der Datei ist es möglich die wichtigsten Seiten dem Crawler bekanntzugeben. Es gibt auch Webseiten eines Webauftrittes, die nicht unbedingt in einem Suchergebnis vorkommen sollen. (Eine „Danke-Seite“ nach dem Ausfüllen eines Formulare z. Bsp.)

Wie ist diese XML Datei aufgebaut?


<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.liechtenecker.at/</loc>
<lastmod>2008-04-14T05:19:52+00:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.liechtenecker.at/blogeintrag/social-networks-uk
<lastmod>2008-04-14T05:19:52+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.2</priority>
</url>
...
</urlset>

  • Die 1. Zeile beschreibt eine XML Datei mit dem Zeichensatz UTF-8. Eine XML-Sitemap muss in diesem Format vorliegen.
  • <urlset> und </urlset> – sind der Rahmen der eigentlichen Daten
  • <url> und </url> – umschliessen jeweils einen Seiteneintrag
  • <loc> und </loc> – Die echte URL der Seite
  • <lastmod> und </lastmod> – Das Datum der letzten Modifikation des Seiteninhaltes
  • <changefreq> und </changefreq> – Die Frequenz/Häufigkeit für die Änderung des Seiteninhaltes
  • <priority> und </priority> – Der Zahlenwert der Wichtigkeit/Priorität der Seite innerhalb der Struktur 0.0 unwichtig –> 1.0 wichtig

Diese Datei muss immer auf dem obersten Verzeichnis liegen, also dort wo sich auch die Startseite des Webauftrittes befindet. Es können für komplexere Fälle (z. Bsp.: Mehrsprachigkeit) mehrere solcher XML-Dateien angelegt werden, die widerrum innerhalb einer Sitemap-Indexdatei abgehandelt werden sollen.

Nachdem die Sitemap am Webspace abgelegt worden ist müssen die Suchmaschinen natürlich auch von deren Existenz erfahren. Das geschieht entweder über dementsprechende Webmaster Zentralen der Suchmaschinen in denen die URL der Sitemap-XML eingetragen wird, oder über die „Auto Discovery“-Methode. Dabei wird innerhalb einer robots.txt Datei folgendes eingetragen:
Sitemap: URL der Sitemap

Mehr Konform bietet ein passendes Plug-in auf WordPress, dass auf diesem Blog verwendet wird. Nach der Installation und Aktivierung wird bei jedem neuen Blogeintrag eine neue XML-Datei erstellt. Etwas Ähnliches gibt es auf für das CMS Drupal.

Weiterführende Links:

Jürgen

Meine Rolle bei Liechtenecker: - Wenn es weder IT noch Digitalisierung gäbe, wäre mein Beruf: - Mein Herz schlägt für: -
3 Kommentare.
Kommentar verfassen
Name
Mail
Web
Captcha
Erfolgreich!
Fehler!
Meetup #10
Inspiration – Blogbeitrag

Meetup #10 – eine Chronologie

4. Dezember 2019, von Lukas

Letzte Woche fand unser inzwischen zehntes Meetup statt. Hier gibt es nun eine kleine Zusammenfassung für all diejenigen, die nicht dabei sein konnten.

Jetzt lesen
Leseliste mit Dieter Rappold
Inspiration – Podcasts

Folge #55 mit Dieter Rappold

6. Dezember 2019

In Folge 55 hat Dieter Rappold, Gründer und Geschäftsführer der Speedinvest Pirates, das Journal von Rene Redzepi, Sternekoch im weltberühmten Noma, und Unternehmer, mitgebracht.

Jetzt anhören
Close