Die Schweiz hat vier Landessprachen. Das ist kein folkloristisches Detail, sondern eine rechtliche und geschäftliche Realität, die jedes KI-System berücksichtigen muss, das in der Schweiz nützlich sein will. Ein KI-Werkzeug, das nur Deutsch versteht, ist für eine Kanzlei in der Romandie unbrauchbar. Ein System, das nur Englisch kann, verfehlt die Schweizer Rechtsterminologie in allen Landessprachen.
Trotzdem behandeln die meisten KI-Anbieter Mehrsprachigkeit als nachrangiges Feature. Ein deutsches Interface mit einer maschinellen Übersetzung darunter. Oder ein englisches System, das “auch Deutsch kann”. Das reicht für die Schweiz nicht aus.
Die Schweizer Sprachlandschaft in Zahlen
Die Verteilung der Landessprachen in der Schweiz ist nicht gleichmässig. Rund 63 Prozent der Bevölkerung sprechen Deutsch als Hauptsprache, 23 Prozent Französisch, 8 Prozent Italienisch und knapp 1 Prozent Rätoromanisch. Englisch ist keine Landessprache, wird aber in vielen Unternehmen, besonders in internationalen Kontexten, als Arbeitssprache genutzt.
Für Unternehmen, die in der gesamten Schweiz tätig sind, bedeutet das: Ihre Kunden, Mandanten und Geschäftspartner kommunizieren in mindestens drei Sprachen. Verträge werden in der Sprache des jeweiligen Kantons verfasst. Regulatorische Dokumente existieren in allen Amtssprachen. Gerichtsentscheide werden in der Verfahrenssprache publiziert.
Warum Übersetzung nicht ausreicht
Der naheliegende Ansatz, ein einsprachiges KI-System mit einer Übersetzungsschicht zu versehen, scheitert in der Praxis an drei fundamentalen Problemen.
Fachterminologie ist nicht direkt übersetzbar
Juristische, finanzielle und technische Fachbegriffe haben in jeder Sprache eigene Bedeutungsnuancen. Das deutsche “Vertragserfüllung” ist nicht identisch mit dem französischen “exécution du contrat”, obwohl beide Begriffe denselben Sachverhalt beschreiben. Die feinen Unterschiede in der Verwendung, im juristischen Kontext und in der Konnotation gehen bei einer automatischen Übersetzung verloren.
Im Schweizer Recht ist dieses Problem besonders akut, weil alle drei Sprachfassungen eines Bundesgesetzes gleichwertig sind. Es gibt keine “Originalfassung” und keine “Übersetzung”. Wenn ein KI-System eine Gesetzesrecherche durchführt, muss es alle drei Fassungen als eigenständige, autoritätive Quellen behandeln, nicht als Übersetzungen voneinander.
Kontextverlust bei der Übersetzung
Ein Benutzer, der eine Frage auf Französisch stellt, erwartet eine Antwort, die den französischsprachigen Rechtskontext berücksichtigt. Wenn das System die Frage intern ins Deutsche übersetzt, deutsche Quellen durchsucht und die Antwort zurück ins Französische übersetzt, geht der Kontext verloren. Die Antwort referenziert möglicherweise die deutsche Fassung eines Gesetzes, obwohl der Benutzer die französische braucht. Oder sie verwendet Begriffe, die in der Deutschschweizer Praxis üblich sind, aber in der Romandie anders verwendet werden.
Qualitätsverlust durch doppelte Verarbeitung
Jeder Übersetzungsschritt führt Fehler ein. Wenn ein System die Eingabe übersetzt, dann verarbeitet, dann die Ausgabe zurückübersetzt, akkumulieren sich diese Fehler. Das Ergebnis ist eine Antwort, die technisch korrekt sein mag, aber sprachlich unnatürlich wirkt und fachlich unpräzise ist.
Die technische Herausforderung: Cross-Lingual Retrieval
Für KI-Systeme, die auf Retrieval-Augmented Generation (RAG) basieren, stellt Mehrsprachigkeit eine besondere technische Herausforderung dar. RAG-Systeme funktionieren, indem sie zunächst relevante Dokumente aus einer Datenbank abrufen und dann auf Basis dieser Dokumente eine Antwort generieren. Die Qualität der Antwort hängt direkt davon ab, wie gut das Retrieval funktioniert.
Das Embedding-Problem
Die meisten Retrieval-Systeme wandeln Texte in numerische Vektoren (Embeddings) um und suchen nach ähnlichen Vektoren. Einsprachige Embedding-Modelle platzieren “Vertrag” und “Contract” in völlig verschiedenen Regionen des Vektorraums, obwohl sie dasselbe bedeuten. Cross-linguale Embedding-Modelle versuchen, bedeutungsgleiche Begriffe in verschiedenen Sprachen nahe beieinander zu platzieren. Die Qualität dieser Modelle hat sich in den letzten Jahren stark verbessert, aber sie sind noch nicht perfekt, besonders bei Fachsprache.
Die Indexierungsfrage
Wie organisiert man eine Datenbank, die Dokumente in mehreren Sprachen enthält? Es gibt verschiedene Ansätze, jeder mit Vor- und Nachteilen.
Separate Indizes pro Sprache. Jede Sprache hat ihren eigenen Suchindex. Das funktioniert gut innerhalb einer Sprache, versagt aber bei sprachübergreifenden Anfragen. Wenn ein Benutzer auf Deutsch nach einem Thema sucht, zu dem die relevanteste Quelle auf Französisch existiert, findet das System sie nicht.
Ein gemeinsamer multilingualer Index. Alle Sprachen werden in einem einzigen Index zusammengefasst, unter Verwendung multilingualer Embeddings. Das ermöglicht sprachübergreifende Suche, kann aber die Präzision innerhalb einer Sprache reduzieren, weil das Modell Kompromisse zwischen den Sprachen eingehen muss.
Hybride Ansätze. Eine Kombination aus sprachspezifischen und sprachübergreifenden Indizes, die je nach Anfrage unterschiedlich gewichtet werden. Das ist der aufwendigste, aber auch der leistungsfähigste Ansatz.
Die Generierungsfrage
Selbst wenn das Retrieval perfekt funktioniert, muss das KI-System die Antwort in der richtigen Sprache und im richtigen Stil generieren. Moderne Sprachmodelle sind grundsätzlich mehrsprachig, aber ihre Leistung variiert erheblich zwischen Sprachen. Die meisten Modelle wurden überwiegend mit englischen Daten trainiert und sind in Englisch am stärksten. Deutsch, Französisch und Italienisch werden mit unterschiedlicher Qualität unterstützt.
Für Schweizer Anwendungen kommt hinzu, dass Schweizer Hochdeutsch sich vom bundesdeutschen Deutsch unterscheidet (kein Eszett, eigene Begriffe wie “parkieren” statt “parken”), Schweizer Französisch eigene Merkmale hat und Schweizer Italienisch teilweise von Standarditalienisch abweicht.
Was ein wirklich mehrsprachiges System leisten muss
Basierend auf den beschriebenen Herausforderungen lassen sich konkrete Anforderungen definieren, die ein KI-System für die Schweiz erfüllen muss.
Native Sprachunterstützung. Das System muss jede Landessprache nativ verarbeiten, nicht über eine Übersetzungsschicht. Eine Frage auf Französisch wird auf Französisch verarbeitet, mit französischsprachigen Quellen beantwortet und in natürlichem Französisch ausgegeben.
Cross-linguale Suche. Das System muss relevante Quellen unabhängig von deren Sprache finden. Wenn die beste Antwort auf eine deutsche Frage in einem französischen Gerichtsentscheid liegt, muss das System diesen finden und dem Benutzer zugänglich machen.
Sprachkonsistenz. Die Antwort muss durchgehend in der Sprache des Benutzers verfasst sein. Quellenangaben dürfen in der Originalsprache zitiert werden, aber die Erläuterungen müssen in der Benutzersprache erfolgen.
Terminologische Präzision. Fachbegriffe müssen in jeder Sprache korrekt verwendet werden. Nicht die nächstbeste Übersetzung, sondern der in der jeweiligen Fachsprache etablierte Begriff.
Schweizer Sprachvarianten. Das System muss Schweizer Hochdeutsch verstehen und produzieren. “ss” statt “ß”, Schweizer Terminologie, Schweizer Konventionen.
Die Datengrundlage
Mehrsprachige KI für die Schweiz erfordert auch eine mehrsprachige Datengrundlage. Für die Rechtsrecherche bedeutet das: Bundesgesetze in allen drei Amtssprachen, kantonale Gesetze in der jeweiligen Kantonssprache, Bundesgerichtsentscheide in der Verfahrenssprache, kantonale Gerichtsentscheide in der lokalen Sprache.
Die Enclava-Plattform von Mont Virtua umfasst 27'795 Gesetze und über 1,1 Millionen Gerichtsentscheide in allen Amtssprachen. Die Datenbank wird kontinuierlich aktualisiert und deckt Bund und Kantone ab. Das Retrieval-System wurde spezifisch für mehrsprachige Schweizer Anforderungen entwickelt, mit hybriden Suchindizes, die sowohl sprachspezifische Präzision als auch sprachübergreifende Vollständigkeit bieten.
Warum das für Unternehmen wichtig ist
Mehrsprachigkeit ist für Schweizer Unternehmen kein Nice-to-have. Sie ist eine Geschäftsanforderung. Eine Anwaltskanzlei in Zürich, die einen Fall in Genf betreut, braucht französischsprachige Quellen. Ein Finanzdienstleister mit Kunden in allen Sprachregionen muss regulatorische Anforderungen in allen Sprachen verstehen. Ein Treuhandbüro, das Mandanten aus der Romandie und der Deutschschweiz bedient, braucht ein Werkzeug, das beide Sprachen gleichwertig beherrscht.
KI-Systeme, die diese Anforderung nicht erfüllen, sind für den Schweizer Markt unvollständig. Sie mögen für Teilregionen funktionieren, aber sie können nicht die Breite abdecken, die Schweizer Unternehmen brauchen.
Vier Sprachen sind kein Luxus. Sie sind eine Voraussetzung.
Wenn Mehrsprachigkeit für Ihr Unternehmen relevant ist, kontaktieren Sie uns unter [email protected] oder besuchen Sie unsere Kontaktseite.