01.04.05Das lang-Attribut

Viel Websites nutzen ein ganz wichtiges Attribut für (X)HTML leider nicht. Oberflächlich betrachtet spielt es für die Erscheinung einer Website keine Rolle - oder wird nicht auf den ersten Blick sichtbar - doch unter der Oberfläche finden sich eine Reihe von Gründen für den Einsatz dieses Attributs zur Angabe der Sprache einer Website bzw. bestimmter Bereiche. Warum für bestimmte Bereiche ein Sprachwechsel sehr wichtig sein kann, werde ich hierbei auch zeigen.

Was wird gesprochen

Das lang-Attribut bestimmt die Sprache eines Elements. Meistens findet man diese Angabe im <head>-Bereich einer Website und gilt damit für alle beinhalteteten Elemente, sprich für die ganze Website. Ein Beispiel für eine deutschsprachige Seite sieht so aus:

<html lang="de">

Der Standardwert für dieses Attribut ist unknown, also unbekannt. Was vermuten lässt, dass ein Auslassen der Sprachangabe eine Reihe von Nachteilen mit sich bringt.

Einfluss des lang-Attributs

Das Attribut erfüllt eine Reihe von Funktionen, um die optimale Verarbeitung einer Website zu gewährleisten. Das sind teilweise Dinge, an die man beim ersten Nachdenken nicht denkt, die aber ganz einleuchtend sind:

  • Unterstützung von Suchmaschinen
  • Unterstützung von Sprachsynthezizern, so z.B. Screenreader
  • Einsatz richtiger Anführungszeichen durch den Browser

Anhand der ersten beiden Funktionen lässt sich verdeutlichen, warum die Angabe der Sprache so wichtig ist. Das lang-Attribut gibt den Inhalten mehr Bedeutung und ist somit ein semantisch unverzichtbarer Baustein für sinnhafte Websites.

Suchmaschinenunterstützung

Jeder kennt das. Man googlet nach einem Begriff, Thema oder was auch immer und wählt dabei die Option "Suche Seiten auf Deutsch". Um es Google oder anderen Suchdiensten zu ermöglichen, relevante Seiten zu finden, muss den Suchmaschinenrobots mittgeteilt worden sein, in welcher Sprache ein Web-Dokument verfasst wurde. Natürlich erhält man auch Suchergebnisse, wenn das lang-Attribut ausgelassen wurde, weil bekanntlich auch andere Dinge beim Auffinden einer Website eine Rolle spielen. Nur wird eine solche Seite u.U. erst viel später in den Tiefen der Suchergebnislisten auftauchen, als das der Fall sein könnte. Auch das zeigt wieder, wie enorm wichtig die Qualität einer Website, auch unter der Haube ist.

Screenreaderunterstützung

Ein viel wichtigerer Aspekt, an den man vor allen Suchmaschinenüberlegungen denken sollte, ist die Verarbeitung der Inhalte einer Website durch Screenreader und anderer unterstützender Software, die es Sehbehinderten Menschen ermöglicht, das Web zu erkunden. Nehmen wir an, ein Mensch, der sich mit Hilfe eines Screenreaders durch das Internet wühlt, besucht meist deutsche Seiten, die ihm in den meisten Fällen auch bekannt sind. Zum Beispiel sein Mail-Provider und andere. Die Standardspracheinstellung der Software steht auf deutsch. So hat er zuerst keine Probleme, auch dann nicht, wenn keine Sprache angegeben wurde. Komplikationen treten erst dann auf, wenn ein (nicht angekündigter) Sprachwechsel erfolgt. Man muss sich nur vorstellen, dass ein Zitat über mehrere Sätze direkt aus dem Englischen übernommen wurde. Wie man sich denken kann, würde das nicht so toll klingen und würde ein Verständnis eventuell sogar unmöglich machen. Abhilfe schafft auch hier wiederum das lang-Attribut. Wie in der Spezifikation steht, legt dieses Attribut die Sprache der Werte und vor allem des Inhalts eines Elements fest. Im <html>-Element eingesetzt, gilt es für die gesamte Seite. Es kann aber genauso für die meisten anderen Elemente eingesetzt werden. Bei einem längeren Zitat würde man hierfür das <blockquote>-Element verwenden. Im Markup ausgezeichnet würde das so aussehen:

<blockquote lang="en"><p>The english content</p></blockquote>

So teilt man dem User-Agent mit, dass es sich beim folgenden Abschnitt um ein Zitat in englischer Sprache handelt. Entsprechend bekommt der Besucher diese Passage vorgelesen. Entscheidend ist ab hier nur noch, ob er Englisch spricht oder nicht, was aber wiederum nichts mit dem Markup einer Website zu tun hat.

Grauzonen und Problembereiche

Das sind die Bereiche, in denen man z.B. Englisch verwendet, sich dessen aber nicht bewusst ist. Was zumindest in unserer deutsche Sprache ganz normal ist. Es gibt bei uns eben eine Fülle an Anglizismen, die wir ganz unbewusst verwenden, für die es zum Teil vielleicht auch gar kein deutsches Äquivalent (mehr) gibt.

Wobei wir auch schon beim Problembereich der Auszeichnung von Sprachwechseln wären. Man müsste so im Extremfall in jedem zweiten, dritten Satz das lang-Attribut einsetzen, was folgerichtig einen nicht vertretbaren Aufwand zur Folge hätte. Ich denke, bei ein oder zwei Wörtern, die mitten im Satz auftauchen, kann man darauf verzichten. Aus dem Kontext liese sich dann erahnen, dass mit "Izze" das englische "Ice" gemeint ist. Ist man sich nicht ganz sicher, kann man beispielsweise ein <span>-Element mit zugehörigem lang-Attribut verwenden. Übrigens ein eigentlich sinnvoller Einsatzzweck für das oft verschmähte span. Danach gilt wieder die globale, im <html>-Element festgelegte, Sprache für die Website.

Beim Frühjahrsputz meiner Website bin ich auf das Thema gekommen. In Zukunft werde ich es so handhaben, dass ich Sprachwechsel für Zitatblöcke und ausgewählte andere Dinge im Markup auszeichne.

Mehr Stoff zum Thema

Bookmarks

Diese Icons verzweigen auf soziale Netzwerke bei denen Nutzer neue Inhalte finden und mit anderen teilen können.
  • del.icio.us
  • DotNetKicks
  • Furl
  • MisterWong
  • NewsVine
  • Spurl
  • Technorati

3 Antworten

  1. Minz Meyer am Apr 6, 2005 | Reply

    Hallo Björn,

    schöne Zusammenfassung über ein, wie Du sagst viel zu selten benutztes Feature.

    Noch erwähnenswert wären vielleicht 2 Dinge. Wird das lang attribut benutzt, kann man dieses auch im Mozilla/Firefox unter den Eigenschaften im Kontextmenü sehen.

    Das xml:lang attribut wird m.E. von noch keinem Browser (grafisch, textlich oder Sprachausgabe) unterstützt. Für mich ein weiteres klares Votum gegen XHTML 1.1, welches nur noch dieses Attribut zur Spachauszeichnung erlaubt.

    Ach ja, und wenn man sich über die viele zusätzliche Arbeit ärgert sollte man doch mal überlegen, ob man nicht vielleicht doch zu viele fremdsprachliche Begriffe in seinen Texten hat, wäre ja auch im Sinne dee Barrierefreiheit ;)
    (zugegebenermaßen recht schwer wenn man über Informationstechnologien schreibt)

    Schöne Grüße

Mitreden? Dann schreibe einen Kommentar!

* = Pfichtfelder

Markup Webdesign Blog

Markup ist das Blog von Björn Seibert. Mehr
Impressum | Kontakt

Feed abonnieren