Informationen
Breugel, Turmbau zu Babel

Sprache und Aussprache

[Materialsammlung]

Der Turmbau zu Babel steht für die Sprachverwirrung, die leider auch im Web Design durch mangelhafte Technik entstehen kann. Das Gemälde in diesem Artikel stammt von Pieter Bruegel dem Älteren. Ich habe es von Wikipedia ausgeliehen.

Bedeutung der Kennzeichnung der natürlichen Sprache

Die Festlegung der natürlichen Sprache (Deutsch, Englisch, …) ist für Menschen, die mit einem Screen Reader arbeiten höchst wichtig. Fehlt die Sprachauszeichnung oder ist sie fehlerhaft, versucht die Sprachausgabe etwa, einen deutschen Text mit der englischen Sprachausgabe vorzulesen. Das ist fatal unverständlich, wie alle verstehen werden, die eine Unterhaltung mit einem starken fremdsprachigen Akzent erlebt haben. Mit einer falschen Sprachausgabe klingt es nur noch viel schlimmer.

Die Blindenschrift unterscheidet sich je nach Sprache etwa in der Darstellung von Umlauten, Zeichen mit Akzent oder in Angeboten zur verkürzten Darstellung. So gibt es in der Deutschen und Englischen Vollschrift jeweils ein einzelnes Zeichen, das gleich für ch steht. Allerdings unterscheiden sich die beiden Kontraktionszeichen. Damit der Screen Reader weiß, welches Kontraktionszeichen er verwenden soll, muss im die menschliche Sprache des Ausdrucks technisch verfügbar gemacht werden.

Auch beim Einsatz von Spracheingabe dürften entsprechende Kennzeichnungen von Relevanz sein. Die Spracherkennung ist treffsicher, wenn die Algorithmen nicht erst noch die jeweilige Sprache erraten müssen.

Nebenbei verbessert die korrekte Angabe der natürlichen Sprache den Einsatz von Übersetzungsprogrammen.

Browser können durch entsprechende Angaben Zeichen der festgelegten Sprache korrekt anzeigen. Eine zusätzliche Markierung im Code kann dadurch entfallen.

Sprachausgaben (Speech Synthesizer)

Technische Realisierung von synthetischer Sprache

Eine Sprachausgabe liest nicht Buchstaben für Buchstaben, sondern verfügt über eine Datenbank mit Phonemen, aus denen Wörter der jeweiligen Sprache zusammengesetzt sind. Zudem verfügen Sprachausgaben über Algorithmen, die festlegen, wie Wörter in Phoneme aufzuteilen sind, damit die Aussprache möglichst korrekt erfolgt.

In der Regel ist es für das Hörverständnis erforderlich, dass ein Text von einer Sprachausgabe der jeweiligen Sprache des Textes wiedergegeben wird. Das Hörerlebnis entspricht ansonsten einem Gespräch mit einem fürchterlich unverständlichen Akzent.

Fremdsprachige Ausdrücke, die sich in einer Sprache eingebürgert haben, werden von Sprachausgaben mit Ausspracheregeln für deren Zeichenfolge versehen. So kann etwa die Zeichenfolge Homepage als Ausspracheregel die Zeichenkette Hohnpäidsch erhalten, um zwar über keine akzentfreie, aber immerhin verständliche Aussprache zu verfügen.

Grenzen von synthetischer Sprache

Eine synthetische Sprache interpretiert Zeichen oder Zeichenketten. Sind diese in der Aussprache mehrdeutig, wird es für eine Sprachausgabe unmöglich oder zumindest schwierig, diese richtig zu interpretieren.

Die Zeichenfolge Orange wird als Farbe etwa als Oransch ausgesprochen und als Frucht mit Oransche. Im Englischen werden die Ausdrücke live als Verb oder Substantiv und read in verschiedenen Zeitformen unterschiedlich ausgesprochen. Vielfach führen Probleme der mehrdeutigen Strings zu Aussprachemängeln.

Die konkrete Bedeutung muss dann beim Hören aus dem Kontext erschlossen werden. Keine geringe kognitive Herausforderung und in jedem Fall eine Störung. Leider müssen wir in gewissem Maß aber bei der Verwendung einer Sprachausgabe damit leben.

Screen Reader und Sprachausgaben

Ein Screen Reader verfügt über Funktionalitäten zur Steuerung von Sprachausgaben. In ihm lässt sich etwa die Standardsprache für Erläuterungen zur Benutzeroberfläche festlegen. Der Screen Reader verfügt darüber hinaus über Mechanismen, die etwa beim Wechsel der natürlichen Sprache innerhalb eines Textes zum Einsatz kommen, um entsprechend auch eine passende Sprachausgabe anzusteuern.

Persönliche Aussprachewörterbücher

Moderne Screen Reader verfügen über Ausnahmewörterbücher für die Aussprache, also Funktionalitäten, die fehlerhafte Aussprache von Ausdrücken korrigieren können. Diese Korrekturen können jedoch nur jeweils für den eignen Bedarf konfiguriert werden.

Ausspracheregeln mittels Screen Reader sollten lediglich bei persönlich häufig vorkommenden Familiennamen oder Ortsnamen erforderlich sein. Der Rest sollte von der Sprachausgabe verständlich verfügbar gemacht werden oder in Einzelfällen auch von Webtechnologien.

In JAWS können Ausspracheregeln im Wörterbuchmanager festgelegt werden, der im Menü Hilfsprogramme zu finden ist.

Auch Personen, die auf Sprachausgabe angewiesen sind, haben ihren Beitrag zu leisten: Sie sollten technische Mechanismen zur Verbesserung der Aussprache erlernen und anwenden. .

Sprache der Webseite

Bedeutung der Sprachkennzeichnung für einen Webauftritt

Die technische Kennzeichnung der natürlichen Sprache einer Webseite gibt für assistierende Technologien an, welche Sprachausgabe die Inhalte wiedergeben sollte. Diese kann ja von der Sprache abweichen, in der ein Screen Reader gewöhnlicher Weise Texte oder eigene Menüs und die Hilfe wiedergibt.

Auch Übersetzungstools müssen wissen, aus welcher Sprache sie übersetzen sollten. Die Webseite muss diese technisch korrekt angeben und der Browser entnimmt aus dem Benutzereinstellungen die Zielsprache.

Eine technische Kennzeichnung der natürlichen Sprache wird bereits in einer 1999 veröffentlichten WCAG 1.0 Richtlinie verlangt. In den aktuellen WCAG 2.1 Richtlinien wird eine solche Kennzeichnung als Muss eingestuft:

Technik zur Kennzeichnung der Sprache einer Webseite

In HTML5 lässt sich der Code zur Sprachkennzeichnung einfach und übersichtlich im Header festlegen:

<html lang="de">

Der Wert de für das Attribut lang steht dabei für deutsch. Für allfällig verfügbare landesspezifische Akzente könnte etwa für Österreich auch de-at verwendet werden.

In älteren HTML-Versionen erfolgt die Festlegung der Sprache gemeinsam mit anderen Anweisungen im HTML-Kopfbereich. Das kann noch unübersichtlich folgendermaßen aussehen:

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="de" lang="de">

Screen Reader Konfiguration der Sprache von Webseiten

Da auf vielen Webseiten die Angabe aus einem englischsprachigen Template einfach übernommen wurde, neigen manche bei der Nutzung von Screen Readrern dazu, fremdsprachige Kennzeichnungen in der Konfiguration des Screen Readers generell abzuschalten. Dadurch werden fremdsprachige Seiten generell unbrauchbar, was in Kauf genommen wird, wenn lediglich Webauftritte in der eigenen Muttersprache besucht werden.

Fremdsprachliche Seitenbereiche

Bedeutung von fremdsprachlichen Seitenbereichen

Screen Reader können fremdsprachige Ausdrücke oder Abschritte mit einer entsprechenden Sprachausgabe wiedergeben, wenn diese Elemente technisch gekennzeichnet sind. Befinden sich innerhalb einer Webseite Textabschnitte, die von der Standardsprache abweichen, sollten diese daher im jeweiligen HTML-Element mit dem lang-Attribut entsprechend verständlich gemacht werden:

Dieses Thema wurde in den WCAG als Kriterium unter dem Prinzip Verständlichkeit eingereiht. Aus meiner eigenen oft leidvollen Erfahrung kann ich sagen, dass es auch unter das Prinzip Wahrnehmbarkeit gepasst hätte. Allerdings gibt es umständliche Verfahren, die Ausdrücke etwa durch Buchstabieren wahrnehmbar zu machen.

Sensibilisierung für Sprachkennzeichnungen

Wenn Sie über einen Screen Reader verfügen, können Sie das Verhalten in folgendem Beispiel testen:

  1. Ohne Sprachkennzeichnung: The truth is rarely pure and never simple. (Oscar Wilde)
  2. Mit Sprachkennzeichnung: The truth is rarely pure and never simple. (Oscar Wilde)
  3. Übersetzung mit Sprachkennzeichnung des Autorennamens: Die Wahrheit ist selten rein und niemals einfach. (Oscar Wilde)

Ausnahmen für Sprachkennzeichnungen

Keine Sprachkennzeichnungen scheinen erforderlich, wenn sich die Aussprache durch die fremdsprachige und deutschsprachige Sprachausgabe lediglich in Akzent und Betonung unterscheiden. Als Beispiele fallen mir dazu der Ausdruck Accessibility oder mein Nachname Berndorfer zumindest für viele europäische Sprachen ein.

Im Erfolgskriterium 3.1.2 werden folgende Ausdrücke von der Verpflichtung zur Kennzeichnung fremdsprachiger Ausdrücke explizit ausgenommen:

Eigennamen

Zur Erfüllung des Erfolgskriteriums 3.1.2 (Sprache von Teilen) ist es nicht erforderlich, die Ursprungssprache von Eigennamen oder Ortsnamen technisch zu kennzeichnen. Es ist jedoch erlaubt oder anzuraten, zur besseren auditiven Verständlichkeit eine solche Kennzeichnnung vorzunehmen.

Wenn man sich an die unkorrekte Aussprache von Eigennamen oder Ortsnamen durch die Sprachausgabe gewöhnt, kann dies unangenehme oder sogar peinliche Situationen auslösen. Ich habe daher eine Diskussion zur Ausnahmeregelung im Erfolgskriterium angeregt:

Fachausdrücke

Auf Fachausdrücke kann und sollte in bestimmten Kontexten nicht verzichtet werden. Deren Verwendung und Aussprache hat sich in der eigenen Sprache aber oft so eingebürgert, dass auf eine Kennzeichnung der ursprünglichen Sprache verzichtet werden kann.

Als Beispiele werden vom W3C angeführt:

Wörter mit unbestimmter Sprache

Was sind Ausdrücke unbestimmter Sprache? Die WCAG liefert keine Erläuterungen. Aber stellen wir uns etwa lautmalerische Ausdrücke, wie Peng oder das Gedicht schtzngrmm von Ernst Jandl vor, in dem Gefechtsgeräusche lyrisch in Lautsprache umgesetzt werden.

Wörter oder Phrasen, die Teil der Landessprache des unmittelbar umgebenden Textes geworden sind

In den W3C Erläuterungen zum Erfolgskriterium 3.1.2 werden anhand des französischen Lehnworts Rendezvous folgende Kriterien zum Verzicht auf eine Kennzeichnung als fremdsprachig angeführt:

  1. Der Ausdruck wurde in den eigenen Wortschatz übernommen.
  2. Der Ausdruck erscheint in den Wörterbüchern der eigenen Sprache.
  3. Der Ausdruck wird von der eigenen Sprachausgabe schon korrekt ausgesprochen.

Ich würde mich lediglich auf den letzten Punkt konzentrieren, da dieser die tatsächliche Aussprache und deren Verständlichkeit betrifft. Zum Test sollte zumindest ein sehr gebräuchlicher Screen Reader (JAWS, NVDA, Voice Over) mit der Standard-Sprachausgabe verwendet werden.

Der Ausdruck Rendezvous benötigt nach diesem Verfahren übrigens im Gegensatz zum Ausdruck Voice Over eine Kennzeichnung als fremdsprachig.

Diskussion der Sprachkennzeichnung von Namen

Ambivalenz der Sprachänderung

Der Wechsel zwischen Sprachausgaben wird gelegentlich als störend empfunden und sollte daher auf ein minimal erforderliches Ausmaß beschränkt bleiben. Fremdsprachige Ausdrücke, die auch durch eine deutschsprachige Sprachausgabe verständlich vorgelesen werden, benötigen keine technische Sprachkennzeichnung.

Zudem verfügt der Wortschatz deutschsprachiger Sprachausgaben natürlich bereits über englischsprachige Ausdrücke. Meiner Erfahrung nach können etwa folgende Ausdrücke ohne explizite Kennzeichnung der natürlichen Sprache verwendet werden:

Accessibility, Content, Feature, Management, Reader, Screen, Tutorials, Word, …

Diese Beispielsammlung kann natürlich gerne erweitert und korrigiert werden.

TITLE-Attribut für Übersetzung oder Erläuterung

Wer ergänzende Informationen im TITLE-Attribut eines Elements verpackt, muss sich bewusst sein, dass diese Informationen für Menschen, die alleine mit der Tastatur arbeiten, nicht zugänglich sind. Es sollten wesentliche Informationen daher immer im Text selbst verfügbar sein.

Weil es für andere Zielgruppen trotzdem hilfreich sein kann, einem fremdsprachigen Ausdruck im Titel des <span>-Bereichs eine Übersetzung oder im Fall des Namens einer Einrichtung dessen Bedeutung zur Beschreibung anzubieten, sei das Verfahren hier kurz beschrieben. Der Code für eine einfache Übersetzung im Titel sieht folgendermaßen aus:

<span lang="en" title="Fahrrad">bicycle</span>

Kein Titelattribut benötigen natürlich fremdsprachige Ausdrücke, die in den deutschsprachigen Wortschatz aufgenommen sind, wie Homepage oder Coaching. Auch der Firmenname Facebook dürfte keiner Erklärung im Titelattribut bedürfen. Allerdings hängen diese Entscheidungen von der Zielgruppe und deren Wortschatz ab.

Breadcrumbs oder Sitemap hingegen dürften überwiegend als Fachausdrücke anzusehen sein. Sitemap kann dabei wohl etwa mit title="Seitenübersicht" übersetzt werden, wohingegen die wörtliche Übersetzung von Breadcrumbs (Brotkrümmel) im Web Design wenig hilfreich ist. Statt dessen wird wohl eine Erläuterung title="Sie sind hier" zweckmäßig sein.

WCAG 2.1 AAA

Aussprachefehler durch Sprachausgaben

Bedeutung der Aussprachefehler

Wenn ein Text auch in der korrekten Sprache gekennzeichnet ist, kann es trotzdem zu einer fehlerhaften Aussprache kommen. Auch die Betonung kann in Einzelfällen zu Missverständnissen führen.

Technische Maßnahmen sind in vielen Fällen hilfreich, um Missverständnissen vorzubeugen oder schlichtweg, um die Useability-Verfahren zu verbessern.

Technische und redaktionelle Verantwortung für die Aussprache

Die Behandlung von Ausspracheproblemen wird im Erfolgskriterium 3.1.6 (Aussprache) in der Konformitätsstufe AAA (Triple A) eingestuft.

Zu den Aufgaben des Barrierefreien Web Design gehört es zunächst nicht, sich um die Aussprache zu kümmern, solange die natürliche Sprache korrekt für die Seite und für fremdsprachige Teile mit dem lang-Attribut gekennzeichnet sind.

Tatsächlich sollten Aussprachemängel innerhalb einer menschlichen Sprache von Sprachausgaben selbst behoben werden. Und wenn sich die Bedeutung trotz Aussprachemängel aus dem unmittelbaren Kontext erschließt, werden auch keine Maßnahmen verlangt.

Technische Überlegungen in Zusammenarbeit mit redaktionell Verantwortlichen sind jedoch erforderlich, wenn sich auf einer Seite fremdsprachige Bereiche befinden, für die keine Sprachausgabe verfügbar ist oder die entsprechende Sprachausgabe vermutlich nicht installiert ist. Erfahrungsgemäß sind dies vor allem Sprachen mit einem für den Webauftritt selten benötigten Zeichencode, etwa griechisch, arabisch oder aus ostasiatischen Regionen.

Eine Herausforderung kann es werden, wenn einzelne Zeichen einer Sprache mit deutlichen Ausspracheunterschieden behaftet sein können und die Aussprache zu Bedeutungsunterschieden führt. Dies kann etwa im Japanischen auftreten. Da ich diese Sprache nicht beherrsche, rate ich im Bedarfsfall auf die ersten hinweise aus den [W3C] Erläuterungen zum Erfolgskriterium 3.1.6 zu achten.

Techniken zur Verdeutlichung der Aussprache

Audiodatei zur Aussprache

Ein Link führt zu einer kleinen Audiodatei mit der korrekten Aussprache. Wenn sich der Link unmittelbar hinter dem problematischen Ausdruck befindet, kann wie auf Wikipedia ein Icon für den Play-Schalter stehen. Das Icon benötigt einen Alternativtext, etwa Aussprache.

Vorbeugemaßnahmen für Aussprachefehler

Bindestriche

Ein - wird als Bindestich vorgelesen und nicht als bis, wenn es etwa um einen Zeitintervall geht. Es ist daher fein, wenn der Text nicht 14-17 Uhr lautet sondern 14 bis 17 Uhr.

Aussprache von Eigennamen

Eigennamen benötigen gemäß Erfolgskriterium 3.1.2 (Sprache von Teilen) zwar nicht einmal eine Kennzeichnung der natürlichen Sprache. Es kann trotzdem in bestimmten Situationen erforderlich sein, deren korrekte Aussprache zu kennen.

Im deutschen Sprachraum gibt es eine Runde Million Eigennamen bei einem Wortschatz von etwa 50.000 Ausdrücken. Namen für Orte, Berge und andere Flurnamen sind da noch gar nicht mitgezählt. Dass jeder einzelne dieser Eigennamen von einer Sprachausgabe korrekt wiedergegeben wird, ist nicht zu erwarten.

Eine korrekte Aussprache auf Webseiten dient also nicht nur gelegentlich zur Verbesserung des Verständnisses, sondern auch zu Hörgewohnheiten und damit zu einer korrekteren Aussprache in der Alltäglichen Kommunikation.

Und nicht nur bei der Verwendung einer Sprachausgabe kann die korrekte Aussprache hilfreich sein:

Ich finde es fein, wenn bei Eigennamen mit ungewöhnlicher Aussprache etwa auf einer Kontaktseite eine Audiodatei mit der korrekten Aussprache zur Verfügung steht. Muss ich in der Einrichtung anrufen, kann ich den Namen korrekt aussprechen, wenn ich mich mit der Person verbinden lasse. Stoße ich bei einer Webrecherche etwa auf den Namen Várkerület für einen Stadtteil von Budapest, so benötige ich die korrekte Aussprache, um den Namen bei einem Referat verwenden zu können.

Technische Darstellung von Mechanismen zum Sprachwechsel

Mehrsprachige Webauftritte benötigen einen Mechanismus zum Wechsel der Sprache. Üblicherweise wird dieser im Kopfbereich dargestellt.

Befindet sich die anderssprachige Seite auf einer anderen Webseite, sollte der Mechanismus zum Wechsel als Link realisiert werden. Wird hingegen lediglich Inhalt auf der aktuellen Seite geändert, dürfte in der Regel ein Button zur Änderung der Sprache adäquat sein.

Wenn das jeweilige Steuerelement auch schon mit einem fremdsprachigen Ausdruck beschriftet ist (English, Italiano, …), dann empfiehlt sich, für jede einzelne Sprachauswahl einen Link bzw. Button zu verwenden. Mir ist jedenfalls kein Mechanismus bekannt, der einzelnen Elementen innerhalb einer Dropdown- oder Optionsgruppe technisch eine Sprache von Teilen zuordnen lässt. (Erfolgskriterium 3.1.2 Sprache von Teilen)