Meta-Tags

Der Meta-Tag dient dazu, Informationen über das Dokument in der HTML-Seite einzubetten, die von anderen HTML-Elementen wie <TITLE> nicht abgedeckt sind. Häufig wird der Meta-Tag auch von WYSIWYG-HTML-Editoren gebraucht, um im Quelltext Infos über die Applikation, die sie produziert hat, sowie Copyrights abzulegen. Seinen grössten Nutzen bringt der Meta-Tag aber im Zusammenhang mit Suchmaschinen, indem er eine Seitenbeschreibung und Schlüsselwörter beinhaltet, die dann indexiert werden können.

Grundlagen

Der Meta-Tag muss immer im Head-Abschnitt des Source-Code stehen, im Body des Dokuments hat er keine Wirkung. Der Inhalt der Meta-Tags wird auch nicht angezeigt, wenn eine Seite im Browser angezeigt wird.

Grundsätzlich kennt <META> zwei Hauptattribute: HTTP-EQUIV und NAME. Ersteres wird benutzt, um einer Position im HTTP-Header neue Werte zuzuordnen. Oft auf diese Weise ersetzte Einträge sind beispielsweise Expires, Refresh oder Reply-to.

Das andere Attribut, NAME, braucht man, um benutzerdefinierte Meta-Informationen zu erstellen, die von einem speziell dafür angefertigten Programm (zum Beispiel dem sogenannten Robot einer Suchmaschine) gelesen werden können.

Meta-Tags kommen ausschliesslich paarweise vor, bestehen also immer aus einem Namen bzw. HTTP-Equivalent und dem zugehörigen Wert - ist nur einer der beiden Teile angegeben, entfaltet der Tag keine Wirkung oder generiert sogar eine Fehlermeldung. Der Wert wird durch das Attribut CONTENT definiert und kann meist einen beliebigen Inhalt haben. Nur ausnahmsweise verlangt ein Hauptattribut einen ganz bestimmten Wert, um zu funktionieren.

Der Meta-Tag sieht im Source-Code also immer wie in folgendem Schema aus:

Für HTTP-EQUIV und NAME können beliebige Attribute verwendet werden. HTTP-EQUIV bezieht sich auf einen Eintrag im HTTP-Header, wie er vom Server dem Dokument angefügt und verschickt wird.

Gesamthaft muss noch darauf hingewiesen werden, dass Meta-Tags nicht für Informationen gebraucht werden sollten, die auch auf andere Weise, etwa mit eigenen HTML-Tags, definiert werden können. So sollte beispielsweise darauf verzichtet werden, einen Meta-Tag nach dem Schema <META NAME="title"...> zu erfinden - dafür gibt es in HTML den <TITLE>-Tag.

Auto-Reload

Mit dem bereits erwähnten Unterattribut Refresh, das von Netscape als proprietärer Tag mit der Navigator-Version 3.0 eingeführt wurde, kann eine Seite nach einer bestimmten Zeit erneut geladen oder eine ganz andere Seite aufgerufen werden. Im Code sieht das so aus:

Wert enthält die Anzahl Sekunden, die der Browser abwartet, bis er zur neuen Seite springt. Die URL ist optional - sie kann eine andere Seite enthalten, auf die Ursprungsseite weisen oder aber ganz fehlen. In letzterem Fall wird die aktuelle Seite erneut geladen.

Diesen Tag enthalten beispielsweise Startseiten, welche nach der angegebenen Wartezeit auf die eigentliche Homepage weitergeleitet werden. Damit lassen sich aber auch ganze Diashows erstellen. Eine weitere Nutzung: Von einer alten Seite, auf die von vielen externen Seiten verwiesen wird, kann automatisch die neue Seite aufgerufen werden.

Ablaufdatum

Mit einem Meta-Tag kann der Browser gezwungen werden, eine Seite direkt vom Server anstelle des Cache-Ordners zu laden. Das ist zum Beispiel sinnvoll, wenn eine Seite häufig erneuert wird, wie das bei Nachrichtenseiten oft der Fall ist. Dem User ist in solchen Fällen daran gelegen, dass er immer die aktuellste Version auf den Bildschirm bekommt, ohne unter Umständen mehrmals reloaden zu müssen.

Um dieses Ziel zu erreichen, muss dem Dokument ein Verfallsdatum gegeben werden, an dem der Browser erkennt, dass die Gültigkeit des Inhalts abgelaufen ist und die Seite wieder vom Server abgerufen werden muss.

Die im Beispiel angegebene Seite wird also am 11. September 2001 um 02:15 Uhr ablaufen und muss danach zwingend wieder vom Server geladen werden.

Soll eine Seite bei jedem neuen Ladevorgang ein anderes Verfalldatum erhalten, muss dies serverseitig mit einem Script programmiert werden.

Falls die Seite gar nie in den Cache geschrieben werden soll, gibt es ebenfalls einen Tag:

Das Attribut pragma, das in diesem Beispiel verwendet wird, kontrolliert im HTTP-Standard 1.0 das Caching von Dokumenten. Es funktioniert nur mit dem Wert no-cache .

Seiteninfos

Mit den Meta-Tags können fast beliebige Informationen in die Seiten eingefügt werden. Leider können nur die wenigsten Browser etwas damit anfangen und auch nur einige Suchmaschinen indexieren diese Tags. Es gibt aber keinen Grund, diese Informationen nicht zu benutzen, da die Meta-Tags schliesslich keinen Schaden anrichten.

Häufig wird diese Variante von Meta-Tags von HTML-Editoren benutzt, um wenigstens im Source-Code anzuzeigen, wer die Seite generiert hat. Aber auch HTML-Autoren aus Fleisch und Blut nutzen diese Möglichkeit ab und zu, um Name, Copyrighthinweise und dergleichen in die Seite einzubetten. Ein Beispiel:

Der Meta-Tag kann auch dazu gebraucht werden, den Inhaltstyp des Dokuments zusammen mit dem benutzten Zeichensatz zu spezifizieren. Damit wird der Browser dazu gebracht, den entsprechenden Zeichensatz zu laden, bevor er die Seite anzeigt. Sinnvoll ist dies beispielsweise bei Zeichensätzen mit vielen Sonderzeichen, wie sie in der deutschen, französischen oder in nordischen Sprachen vorkommen. Wenn Sie Seiten in griechischer, arabischer oder in fernöstlichen Sprachen anfertigen, ist das die einzige Möglichkeit, den Browser zur richtigen Anzeige der Zeichen zu bringen - ob der Anwender damit etwas anfangen kann, steht allerdings auf einem anderen Blatt.

Dabei muss aber beachtet werden, dass die meisten Browser nur eine Auswahl von internationalen Zeichensätzen unterstützen.

Eine weitere sinnvolle Einsatzmöglichkeit für Meta-Tags ist die Klassifizierung des Seiteninhalts. Das passiert mit dem Attribut rating, das die Werte general (für jedermann), mature (für reife Persönlichkeiten), restricted (nur für ein eingeschränktes Publikum) oder 14 years (ab 14 Jahren) haben kann.

Leider werden diese Angaben bisher kaum von einer Browser- oder Serversoftware unterstützt, und die verschiedenen Anbieter für Babysitter-Software benutzen je eigene Ansätze.

Mehr Hits mit Schlüsselwörtern

Eine der wichtigsten Funktionen der Meta-Tags ist es, für die automatischen Suchmaschinen Schlüsselwörter und Seitenbeschreibungen bereitzuhalten, die diese dann indexieren können. Damit hat es ein Web-Site-Betreiber eigentlich in der Hand, in den Suchmaschinen mit den wirklich wichtigen Inhalten seiner Site vertreten zu sein und es nicht der Maschine zu überlassen, zufällig aus dem Zusammenhang gerissene Wörter zu speichern.

Normalerweise funktioniert das folgendermassen: Suchmaschinen wie AltaVista haben ein automatisches Index-System. Bei einer Seitenanmeldung wird die URL eingegeben, worauf ein sogenannter Spider oder Robot die Seite besucht und meist einfach die ersten paar Zeilen des Dokuments indexiert. Das führt zu ziemlich eigenartigen Ergebnissen bei der späteren Recherche. Sind dagegen im Header des Dokuments einige Meta-Tags sauber integriert, wird der Robot diese indexieren. Damit hat man die Kontrolle darüber, in welchen Kategorien und unter welchen Suchbegriffen die Seite bei einer Recherche erscheint. Ausserdem besteht über das Description -Attribut auch die Möglichkeit, genau zu bestimmen, was als Kurzbeschreibung in der Antwort der Suchmaschinen auftaucht.

Bisher wurde für diese Art der Indexierung leider kein Standard definiert, so dass jeder Suchmaschinen-Betreiber einen anderen Weg eingeschlagen hat. Längst nicht alle Suchmaschinen unterstützen diese Indexierung, und diejenigen, die es tun, tun es auf höchst unterschiedliche Weise. Als Webmaster ist man daher gezwungen, von jeder interessanten Engine die entsprechenden Informationen anzufordern und für jede Variante eigene Meta-Tags in den Source-Code zu implementieren.

Es muss auch davor gewarnt werden, sich aufgrund der Implementation von Meta-Tags allzu grosse Hoffnungen zu machen: Meta-Tags sind nur ein Teil der Information, die einige Suchmaschinen für ihre Datenbanken sammeln. Andere wesentliche Bestandteile der Datenbanken sind der Titel und der Text-Inhalt der Seite, der manchmal sogar mit dem Inhalt der Meta-Tags verglichen wird. Neuerdings werden für die Relevanz eines Suchergebnisses sogar die Häufigkeit gewertet, mit der eine URL in der Suchmaschine aufgerufen wird, oder wie viele Links auf andere Seiten auf eine bestimmte Site verweisen. Die Meta-Tags sind damit "nur" ein unterstützendes Mittel.

Die für die Indexierung durch Suchmaschinen gebräuchlichsten Attribute des Meta-Tags sind AUTHOR, DESCRIPTION und KEYWORDS . Das sieht dann etwa so aus:

Einige Maschinen nutzen für den Index alle drei Angaben, andere nur die Beschreibung und die Schlüsselworte. Letztere müssen durch Leerzeichen getrennt werden, damit die Maschine die einzelnen Wörter erkennt. Allerdings werden meist auch Kommas als Leerzeichen interpretiert.

Weil einige Suchmaschinen nur eine beschränkte Anzahl von Zeichen akzeptieren, sollte man sich bei der Beschreibung auf etwa 150 und bei den Schlüsselwörtern auf höchstens 750 Zeichen beschränken.

Mit dem robot-Tag lassen sich denjenigen Suchmaschinen, die ihn unterstützen (z.B. AltaVista, HotBot, Infoseek), sogar noch Anweisungen geben, was sie auf der Seite genau tun sollen. Damit lässt sich definieren, ob eine Site komplett indexiert oder ob bestimmte Seiten ausgenommen werden sollen. Man kann auch bestimmen, ob den Links in die Tiefe der Site gefolgt werden soll.

In diesem Beispiel werden die Robots angewiesen, die Seite zu indexieren, aber den Links nicht zu folgen. Das robots-Attribut akzeptiert nur die folgenden sechs Werte: all, none, index, noindex, follow, nofollow. Follow, index und ihre Gegenstücke erklären sich selber. All und none fassen die anderen Möglichkeiten zusammen: All=index, follow, none=noindex, nofollow . Diese Werte können nach Belieben kombiniert werden, so dass beispielsweise eine Homepage, auf der zwar Links zu den einzelnen Seiten, aber sonst keine Inhalte sind, nicht indexiert wird, der Robot aber angewiesen wird, den Links zu folgen:

Es macht natürlich keinen Sinn, die Werte widersprüchlich anzuwenden. Anweisungen wie diese sollen Sie also vermeiden:

Beachten Sie, dass Sie die Robots nicht speziell anweisen können, wie tief sie den Links auf Ihrer Seite folgen sollen. Je nachdem, wie diese programmiert sind, tun sie das bis zu einer bestimmten Suchtiefe (z.B. folgt AltaVista bis zu drei Links tief) automatisch.

Normalerweise ziehen die Robots nach einer gewissen Zeitspanne, die zwischen einer Woche und über einem Monat liegt, wieder los, um ihre Angaben zu überprüfen und ihre Datenbank damit aktuell zu halten. Bei Seiten, die häufig geändert und aufdatiert werden, ist dies oft zu lang. Mit einem Meta-Tag wird das abgekürzt:

Findet ein Robot diesen Tag im Source-Code, merkt er sich die angegebene Anzahl Tage und besucht die Site nach deren Ablauf erneut. Damit wird sichergestellt, dass die Anwender, welche diese Site in einer Suchmaschine finden, immer die neuesten Inhaltsangaben erhalten. Leider wird auch dieses Attribut längst nicht von allen Suchmaschinen unterstützt.

Die wichtigsten Meta-Attribute

Attribut

Typ

Bedeutung

abstract

NAME

Synonym von Description

author

NAME

Name des Autors

content-language

HTTP-EQUIV

Sprache des Inhalts

content-type

HTTP-EQUIV

Typ und Zeichensatz des Inhalts

copyright

NAME

Copyrightangaben

description

NAME

Zusammenfassung der Seite

expires

HTTP-EQUIV

Verfalldatum einer Seite

keywords

NAME

Schlüsselwörter der Seite

pragma

HTTP-EQUIV

Verhindert das Cachen einer Seite

publication_date

HTTP-EQUIV

Datum der ersten Publikation

rating

NAME

Angaben zum Jugendschutz

refresh

HTTP-EQUIV

Laden derselben oder einer anderen Seite

reply-to

HTTP-EQUIV

Adresse für System-Mails

revisit-after

NAME

Anweisung für neuen Besuch des Robot

robots

NAME

Auflistung der Robots, die Ihre Seite indexieren sollen

Links zum Meta-Tag

Auf der Linkseite befinden sich einige interessante Einträge zu diesem Thema.