Liechtenecker: Blog Feuershow

Brennende Themen & Aktuelles
aus der Online Welt.

Blogeintrag

Sitemap XML

XML Sitemap ist eine Datei, die alle Seiten innerhalb einer Webseitenstruktur auflistet und damit die Indizierung für Suchmaschinen erleichtern soll. Diese XML Datei kann von den grossen Suchservices Google, Microsoft und Yahoo gelesen werden.

Die meisten herkömlichen Webauftritte benötigen keine XML Sitemaps, da die Suchmaschinen-Crawler selbständig von der Startseite weg alle Links der Webseite verfolgen. Dies heisst: Suchmaschinen können kleinere Webseitenstrukturen selbständig indizieren.

Für größere Portale oder ständig aktualisierten Webseiten (Blogs) empfiehlt sich der Einsatz dieses Formates, da die Suchmaschinen-Crawler nur eine bestimmte Menge an Content pro Tag scannen können. Über bestimmte Parameter innerhalb der Datei ist es möglich die wichtigsten Seiten dem Crawler bekanntzugeben. Es gibt auch Webseiten eines Webauftrittes, die nicht unbedingt in einem Suchergebnis vorkommen sollen. (Eine “Danke-Seite” nach dem Ausfüllen eines Formulare z. Bsp.)

Wie ist diese XML Datei aufgebaut?


<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.liechtenecker.at/</loc>
<lastmod>2008-04-14T05:19:52+00:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.liechtenecker.at/blogeintrag/social-networks-uk
<lastmod>2008-04-14T05:19:52+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.2</priority>
</url>
...
</urlset>

  • Die 1. Zeile beschreibt eine XML Datei mit dem Zeichensatz UTF-8. Eine XML-Sitemap muss in diesem Format vorliegen.
  • <urlset> und </urlset> – sind der Rahmen der eigentlichen Daten
  • <url> und </url> – umschliessen jeweils einen Seiteneintrag
  • <loc> und </loc> – Die echte URL der Seite
  • <lastmod> und </lastmod> – Das Datum der letzten Modifikation des Seiteninhaltes
  • <changefreq> und </changefreq> – Die Frequenz/Häufigkeit für die Änderung des Seiteninhaltes
  • <priority> und </priority> – Der Zahlenwert der Wichtigkeit/Priorität der Seite innerhalb der Struktur 0.0 unwichtig –> 1.0 wichtig

Diese Datei muss immer auf dem obersten Verzeichnis liegen, also dort wo sich auch die Startseite des Webauftrittes befindet. Es können für komplexere Fälle (z. Bsp.: Mehrsprachigkeit) mehrere solcher XML-Dateien angelegt werden, die widerrum innerhalb einer Sitemap-Indexdatei abgehandelt werden sollen.

Nachdem die Sitemap am Webspace abgelegt worden ist müssen die Suchmaschinen natürlich auch von deren Existenz erfahren. Das geschieht entweder über dementsprechende Webmaster Zentralen der Suchmaschinen in denen die URL der Sitemap-XML eingetragen wird, oder über die “Auto Discovery”-Methode. Dabei wird innerhalb einer robots.txt Datei folgendes eingetragen:
Sitemap: URL der Sitemap

Mehr Konform bietet ein passendes Plug-in auf WordPress, dass auf diesem Blog verwendet wird. Nach der Installation und Aktivierung wird bei jedem neuen Blogeintrag eine neue XML-Datei erstellt. Etwas Ähnliches gibt es auf für das CMS Drupal.

Weiterführende Links:

jetzt Mitreden

Yahoo & mobile

Yahoo ist auf dem mobilem Sektor auch nicht untätig. Auf der CEBIT wurde eine Handyapplikation unter dem Namen onePlace vorgestellt. Die mobile Software soll als Bookmark-Manager dienen, damit der Handy-User seine Links besser innerhalb einer Folderstruktur organisieren kann. Der Launch ist für das 2. Quartal 2008 geplant. Demoversion Diese Applikation ist teil einer weitreichenden Handystrategie [...]

weiter

Suchmaschinen Marktanteile

Eine der größten und einflußreichsten Internet Marktforschungsinstitute (Comscore) hat die Suchmaschinennutzung in USA (Jänner 2008) veröffentlicht: Google hat eine Reichweite von 58,5 % Yahoo am 2. Platz mit 22,2% Microsoft hat lediglich 9.8% Marktanteil Yahoo hat gegenüber Dezember 2007 wieder 0.7 % Anteile verloren, also Google holt auch in US auf. Dennoch sieht es in [...]

weiter