An der nächsten Datenkreuzung links – Die Google Sitemap

Wenn möglich, bitte wenden! Dieser freundlichen Aufforderung kommt man am Steuer gerne nach, bevor man irgendwo landet, wo Fuchs und Hase sich gute Nacht sagen. Was die Datenautobahn angeht, sind die Suchmaschinen, vor allem Google, euer Navigator. Das Kartenmaterial dazu stellt Ihr selbst bereit, am besten in Form einer Google Sitemap.

Schließlich wollt Ihr ja, dass potentielle Kunden bei Euch landen und nicht die nächste Abfahrt am Datenautobahnkreuz Konkurrenzstadt nehmen. Am besten lasst ihr Euch also vom bunt bebuchstabten Einwinker diktieren, wie Ihr die Sitemap einreicht. Anhand regelmäßiger Aktualisierungen weiß Google genau, was es bei Euch zu holen gibt und bringt die User zu Euch, die danach suchen.

Ich brauche keine Karte, oder doch? Was ist eine Google Sitemap?

Eine Sitemap ist ein Verzeichnis von Webseiten. In der Regel bilden diese gemeinsam einen Webauftritt. Auf vielen Homepages findet man Sitemaps als eigene Unterseite. Oftmals bilden diese die Seitenstruktur in einer hierarchischen Baumstruktur ab. Sie helfen dem Besucher, sich auf der Homepage zurechtzufinden.

Auch von der Google Sitemap profitiert letztendlich der User. Der Suchmaschine wird das Erfassen der Struktur einer Homepage durch eine Sitemap erleichtert. Der Aufwand wird im Idealfall mit besseren Ergebnissen im Suchmaschinenranking belohnt. Auch wenn er nicht direkt auf sie zugreift, hilft sie indirekt dem Suchenden bei seiner Netzrecherche weiter.

Wie schalte ich das Navi an? Das Erstellen der Karte zu Ihrem Haus.

Eine Google Sitemap wird entweder manuell oder mit einem Software-Tool erstellt. und anschließend bei der Google Search Console (ehemals Webmaster-Tools) hochgeladen. Alternativ kann auch eine Zeile innerhalb der robots.txt dafür sorgen, den Verweis auf die Sitemap zu liefern.

Die Obergrenze für eine Sitemap liegt bei 50MB und 50.000 URLs. Ist die Seite größer, empfiehlt es sich, die Angaben auf mehrere Sitemaps zu verteilen. Optional ist die Verwendung einer Sitemap-Indexdatei, die dann auf eine Liste aus Sitemaps verweist.

Welche Formate sind zulässig?

Die Karte Eurer Homepage fliegt bei starkem Wind niemandem davon. Dennoch muss sie bestimmte Kriterien erfüllen. Google akzeptiert mehrere Formate zur Einreichung einer Sitemap: XML, RSS und Text. Im Folgenden erläutern wir kurz, was Ihr bei den einzelnen Formaten beachten solltet.

XML:

Google unterstützt das Standard-Sitemap-Protokoll. Eine simple XML-Sitemap mit einem einzelnen URL-Pfad sieht demzufolge so aus:

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>https://www.terramedia.de/webdesign-und-content</loc>
</url>
</urlset>

Das XML-Format bietet auch die Möglichkeit, schwierig lesbare Elemente wie Bilder und Videos einzubinden. Google unterstützt entsprechende URL-Erweiterungen:

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1″ xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″>
<url>
<loc>https://www.terramedia.de/neues-terramedia-office-und-neue-webseite/</loc>
<image:image>
<image:loc>https://www.terramedia.de/wp-content/uploads/2017/04/terramedia-koeln-neue-webseite.jpg</image:loc>
<image:caption>Bild von unserem neuen Büro</image:caption>
</image:image>
<video:video>
<video:content_loc>
https://www.ihrebeispielurl.de/terramedia-rundgang.flv
</video:content_loc>
<video:player_loc allow_embed=”yes” autoplay=”ap=1″>
https://www.terramedia.de/videoplayer.swf?video=terramedia-rundgang
</video:player_loc>
<video:thumbnail_loc>
https://www.ihrebeispielurl.de/thumbs/video-rundgang-th.jpg
</video:thumbnail_loc>
<video:title>Rundgang durchs Büro</video:title>
<video:description>
Ein kleiner 360°-Rundgang durch unser neues Büro
</video:description>
</video:video>
</url>
</urlset>

RSS, mRSS und Atom 1.0

Ist ein RSS-Feed der Version 2.0 oder ein Atom 1.0-Feed Bestandteil Eures Blogs, so könnt Ihr dessen URL als Sitemap einreichen. Über einen mRSS-Feed (media RSS) könnt Ihr zusätzlich Informationen zu Videoinhalten bereitstellen. Viele Blogsoftware-Tools sind in der Lage, einen Feed zu erstellen. Er enthält allerdings lediglich Informationen zu aktuellen URLs.

Text:

Enthält Eure Homepage nur Webseiten-URLs, so könnt Ihr diese Google in Form einer einfachen Textdatei bereitstellen. Diese sieht wie folgt aus:

http://www.ihrebeispielurl.de/datei1.html
http://www.ihrebeispielurl.de/datei2.html

Wichtig ist dabei, dass die Datei im UTF-8-Format kodiert wird und dass die Datei tatsächlich nichts anderes als eine Auflistung der URLs enthält. Der Name der Datei ist beliebig, solange er die Erweiterung .txt aufweist. Demnach wäre ein gültiger Name z.B. „sitemap.txt“.

Was muss ich beachten?

Bei allen Pfadangaben sollte es sich um konsistente, vollständig qualifizierte URLs handeln. Das bedeutet, dass auf keinen Fall das www fehlt und die Ziele auch nicht mit z. B. /unterseite abgekürzt werden. Doppeltes Crawling vermeidet Ihr, indem Ihr keine Sitzungs-IDs aus URLs einfügt.

Als Codierung verwendet Ihr UTF-8 und achtet darauf, bei den URLs entsprechende Escape-Codes zu verwenden. Damit ist gemeint, dass ihr folgende Zeichen ersetzt:

Kaufmännisches Und-Zeichen & wird ersetzt durch: &amp;
Einfaches Anführungszeichen  wird ersetzt duch: &apos;
Doppeltes Anführungszeichen  wird ersetzt durch: &quot;
Größer als > wird ersetzt durch &gt;
Kleiner als < wird ersetzt durch &lt;

Zudem darf eine Sitemap ausschließlich ASCII-Zeichen enthalten. Erweiterte ASCII-Zeichen und bestimmte Sonderzeichen oder Steuercodes wie z. B. * oder {} sind nicht erlaubt.

Ein Beispiel – aus der Angabe

https://www.terramedia.de/übungen.html&admin=1

macht Ihr

https://www.terramedia.de/ %C3%BCbungen.html&amp;admin=1

Upload bei der Google Search Console

Der Upload der Google Sitemap bei der Google Search Console ist der Verlinkung innerhalb der robots.txt vorzuziehen, auch wenn diese nicht zwangsläufig schlecht ist. Der Vorteil liegt in der Erkennung von Problemen in der Indexierung. Wenn etwas nicht korrekt eingelesen werden kann, erfahrt Ihr es schnell und könnt das Problem zeitig beheben.

Wie komme ich zur Google Search Console?

Die Search Console findet Ihr unter:

https://www.google.com/webmasters/tools

Dort meldet Ihr Euch mit Eurem Google-Account an. Anschließend wählt ihr die Website aus, für die Ihr die Sitemap einreichen wollt.

Als Unterpunkt von Optimierung im Menü links findet Ihr den Punkt „Sitemaps“. Hier klickt Ihr auf den roten Button mit der Aufschrift „Sitemap hinzufügen / Testen“. Im Dialog, der sich nun öffnet, tragt Ihr den Pfad zu Eurer Sitemap ein und klickt auf den blauen Button „Sitemap einreichen“.

Damit ist der Einreichungsvorgang abgeschlossen. Die Sitemap wird beim Hochladen zugleich auch geprüft. Ihr findet etwaige Fehler direkt in der Übersicht. Mögliche Fehler können z. B. die noch ausstehende Verarbeitung (crawling) sein oder ein inkorrekter Pfad.

Unter dem Reiter „Sitemaps“ findet Ihr zur zukünftigen Prüfung die Anzahl der eingereichten und indexierten URLs sowie das Datum, wann die Sitemap zum letzten Mal aktualisiert wurde.

Verlinken innerhalb der robots.txt

Wollt Ihr mit einem Eintrag in Eurer robots.txt auf eine Sitemap verweisen, sollte dieser wie folgt aussehen:

Sitemap: http://ihrebeispielurl.de/meine-sitemap.xml

Es ist so einfach, wie es aussieht. Beim der Zeile handelt es sich lediglich um eine Angabe des Pfades, unter dem die Sitemap zu finden ist.

Ihr verfahrt Euch immer noch? Kein Problem mit terramedia!

Bei ist das Einreichen einer Sitemap bei Google ein Basis-Bestandteil jedes Angebots zur Erstellung eines Website-Relaunchs. Bei bestehenden Seiten helfen wir Euch gerne bei der Erstellung und beraten Euch, wie Ihr die Struktur Eurer Homepage am sinnvollsten in einer Sitemap abbildet. Wir freuen uns darauf, Euch kennenzulernen!