Von Fedlex zu KI: Wie wir 27'000 Gesetze strukturiert haben

Der technische Weg von öffentlichen Behördendaten zu einer durchsuchbaren, KI-fähigen Rechtsdatenbank. Ein Einblick in die Datenarchitektur hinter Enclava.

Von Fedlex zu KI: Wie wir 27'000 Gesetze strukturiert haben

Schweizer Recht ist öffentlich. Jedes Bundesgesetz steht auf Fedlex. Jede kantonale Gesetzessammlung ist online. Viele Gerichtsentscheide sind auf den Websites der Gerichte publiziert. Die Daten sind da. Aber «da» und «nutzbar» sind zwei verschiedene Dinge.

Wir haben in drei Wochen eine Datenbank aufgebaut, die 27'795 Schweizer Gesetze, 2,02 Millionen strukturierte Gesetzeseinheiten und 1,14 Millionen Gerichtsentscheide von 115 Gerichten umfasst. Dieser Artikel beschreibt den Weg von der öffentlichen Quelle zur durchsuchbaren Wissensdatenbank.

Die Ausgangslage: Was der Bund bereitstellt

Die Schweizerische Eidgenossenschaft betreibt mit Fedlex eine der besten offenen Rechtsplattformen Europas. Die Systematische Rechtssammlung (SR) ist vollständig digitalisiert und über eine SPARQL-Schnittstelle abfragbar. Das Format ist Akoma Ntoso, ein internationaler XML-Standard für Gesetzestexte.

Das bedeutet: Jeder Artikel, jeder Absatz, jede Änderungshistorie ist maschinenlesbar. Nicht als PDF, sondern als strukturiertes XML mit semantischen Markierungen für Verweise, Definitionen und Gliederungselemente.

Schritt 1: Datenextraktion

Die erste Aufgabe war, sämtliche Bundesgesetze und Verordnungen aus Fedlex zu extrahieren. Über die SPARQL-Schnittstelle haben wir alle SR-Nummern abgefragt und die zugehörigen Akoma-Ntoso-Dokumente heruntergeladen.

Für die kantonalen Gesetze war der Weg weniger einheitlich. Jeder der 26 Kantone betreibt seine eigene Gesetzessammlung. Einige (Zürich, Bern, Waadt) bieten strukturierte APIs. Andere publizieren ausschliesslich PDFs. Für jeden Kanton musste ein eigener Extraktor gebaut werden.

Am Ende: 27'795 Gesetze aus allen 26 Kantonen, dem Bund und interkantonal. Das umfasst: Bundesgesetze, Bundesverordnungen, kantonale Gesetze, kantonale Verordnungen, interkantonale Vereinbarungen und Staatsverträge.

Schritt 2: Strukturierung in Gesetzeseinheiten

Ein Gesetz als Ganzes ist für KI-Anwendungen zu gross. Ein einzelner Artikel ist manchmal zu klein (fehlender Kontext). Die relevante Einheit ist die «Gesetzeseinheit» (Law Unit): ein strukturierter Abschnitt mit eigenem inhaltlichen Schwerpunkt.

Wir haben die 27'795 Gesetze in 2,02 Millionen Gesetzeseinheiten zerlegt. Jede Einheit enthält:

  • Den vollständigen Text
  • Die hierarchische Position im Gesetz (Buch > Titel > Kapitel > Abschnitt > Artikel > Absatz)
  • Die SR-Nummer und den Paragraphen-Verweis
  • Die Sprache (DE, FR, IT, EN)
  • Metadaten: Inkrafttreten, letzte Änderung, Status

Diese Granularität ist entscheidend. Wenn eine Anwältin nach «Kündigungsfrist bei unbefristetem Arbeitsverhältnis» sucht, soll sie Art. 335c OR finden, nicht das gesamte Obligationenrecht.

Schritt 3: Gerichtsentscheide

Schweizer Gerichte publizieren ihre Entscheide auf verschiedenen Plattformen. Das Bundesgericht auf bger.ch. Das Bundesverwaltungsgericht auf bvger.ch. Kantonale Gerichte auf entscheidsuche.ch oder eigenen Portalen.

Wir haben systematisch alle verfügbaren Entscheide gesammelt. Das Ergebnis: 1,14 Millionen Entscheide von 115 Gerichten. Die Bundesgerichts-Entscheide sind vollständig. Die BVGer-Entscheide sind vollständig (91'582 Entscheide, null Stubs). Die kantonalen Entscheide variieren in der Abdeckung je nach Kanton.

Jeder Entscheid wurde strukturiert mit: Gericht, Datum, Aktenzeichen, Verfahrensart, angewandte Gesetze, Verweise auf andere Entscheide und Volltext.

Schritt 4: Der Zitationsgraph

Gesetze zitieren andere Gesetze. Entscheide zitieren Gesetze. Entscheide zitieren andere Entscheide. Diese Verweise bilden ein Netzwerk: den Zitationsgraphen.

Wir haben 1,42 Millionen Zitationskanten extrahiert. Jede Kante verbindet eine Quelle (z.B. einen BGer-Entscheid) mit einem Ziel (z.B. einen OR-Artikel oder einen früheren Entscheid). Dieses Netzwerk macht sichtbar, wie Schweizer Recht zusammenhängt.

Ein konkretes Beispiel: Art. 58 DBG (Gewinnsteuer juristischer Personen) wird von 842 Bundesgerichtsentscheiden zitiert. 23 kantonale Entscheide nehmen in den letzten zwei Jahren darauf Bezug. Die Zitationshäufigkeit zeigt, welche Artikel in der Praxis umstritten sind. Abnehmende Zitationshäufigkeit kann darauf hindeuten, dass eine Rechtsfrage geklärt ist. Zunehmende Häufigkeit signalisiert, dass neue Konflikte entstehen.

Keine andere Plattform in der Schweiz bietet diese Analyse.

Schritt 5: Embedding und semantische Suche

Stichwortsuche hat eine fundamentale Schwäche: Sie findet nur, was exakt so geschrieben steht, wie gesucht wird. «Kündigung des Arbeitsverhältnisses» findet nicht «Auflösung des Anstellungsvertrages», obwohl beides dasselbe meint.

Semantische Suche löst dieses Problem. Jede der 2,02 Millionen Gesetzeseinheiten und jeder der 1,14 Millionen Entscheide wurde in einen Vektor umgewandelt (Embedding). Diese Vektoren repräsentieren den Inhalt des Textes, nicht seine Wortwahl.

Total: 3,13 Millionen Embeddings. Das Ergebnis: Eine Suche nach «Arbeitgeber muss Lohn weiterzahlen bei Krankheit» findet Art. 324a OR, auch wenn diese exakte Formulierung nirgends im Gesetzestext vorkommt.

Schritt 6: Mehrsprachigkeit

Schweizer Recht existiert in vier Sprachen. Die drei Amtssprachen (Deutsch, Französisch, Italienisch) sind rechtlich gleichwertig. Viele Entscheide existieren nur in einer Sprache.

Unsere Datenbank deckt ab: 1,5 Millionen Gesetzeseinheiten auf Deutsch, 232'000 auf Französisch, 235'000 auf Italienisch und 45'000 auf Englisch. Die Suche funktioniert sprachübergreifend: Eine Frage auf Deutsch kann einen relevanten Entscheid auf Französisch finden, wenn dieser die beste Antwort enthält.

Was das für die Praxis bedeutet

Die Kombination aus strukturierten Daten, Zitationsgraph und semantischer Suche verändert die Rechtsrecherche. Statt eine Stunde mit Stichwortverfeinerung zu verbringen, beschreibt die Anwältin ihr Problem in natürlicher Sprache. Die Plattform findet relevante Gesetze, Entscheide und deren Verbindungen zueinander.

Jedes Ergebnis verweist auf die offizielle Quelle. Keine Halluzinationen. Kein Raten. Wenn die Antwort nicht in den Daten ist, sagt das System das.

Alle Daten stammen von offiziellen Behördenquellen und werden jede Nacht aktualisiert. Kein Zwischenhändler. Kein Verlag. Die Quelle selbst.

Weitere Informationen: montvirtua.com

Dieser Artikel dient der allgemeinen Information und stellt keine Rechtsberatung dar.

Zurück zum Blog