La Suisse est l’un des pays les plus transparents au monde en matiere de donnees gouvernementales. Lois federales, legislation cantonale, decisions de justice, publications reglementaires, inscriptions au registre du commerce, avis de la gazette officielle : tout est publie via des canaux gouvernementaux officiels. Une grande partie est structuree. Une grande partie est lisible par des machines. La quasi-totalite est gratuite.
Et presque personne n’en fait quelque chose d’utile.
Ce que la Suisse publie reellement
L’etendue des donnees ouvertes gouvernementales suisses est remarquable. La plupart des professionnels interagissent avec de petites tranches via des portails specialises, mais peu saisissent l’image complete.
Legislation federale. Fedlex (fedlex.data.admin.ch) publie chaque loi federale, ordonnance et traite international dans les trois langues officielles plus l’anglais. Les donnees sont disponibles sous forme de XML structure avec des metadonnees detaillees : numeros RS, dates de promulgation, historiques de modification et relations entre les dispositions. Il y a plus de 4 900 actes federaux, comprenant des dizaines de milliers d’articles individuels.
Legislation cantonale. Chacun des 26 cantons suisses publie sa propre legislation a travers des bases de donnees cantonales. Les formats varient (certains structures, d’autres non), mais les donnees sont accessibles au public. A travers tous les cantons, cela represente environ 23 000 actes juridiques supplementaires avec des centaines de milliers de dispositions individuelles.
Decisions de justice. Le Tribunal federal (TF) publie toutes ses decisions via son portail officiel. Le Tribunal administratif federal (TAF) et le Tribunal penal federal (TPF) font de meme. De nombreux tribunaux cantonaux publient egalement leurs decisions. Au total, les tribunaux suisses ont publie plus d’un million de decisions consultables couvrant des decennies de jurisprudence.
FOSC (Feuille officielle suisse du commerce). Chaque creation, dissolution, fusion, changement de conseil d’administration, modification de capital et procedure de faillite en Suisse est publie dans la FOSC. Les archives contiennent des millions d’entrees remontant a des decennies. C’est le registre definitif de la vie des entreprises suisses.
Publications de la FINMA. La FINMA publie des circulaires, des avis de surveillance, des actions d’execution, des rapports annuels et des documents d’orientation. Tout est accessible au public. Tout est pertinent pour chaque institution financiere en Suisse.
AFC (Administration federale des contributions). Statistiques fiscales, decisions, circulaires, conventions de double imposition et directives administratives. Publies ouvertement.
Curia Vista. La base de donnees parlementaire suivant chaque motion, interpellation, postulat et initiative a l’Assemblee federale. C’est le pipeline legislatif : quelles lois arrivent, a quoi ressemble le debat et comment le paysage politique faconne les resultats reglementaires.
Opendata.swiss. Le portail federal de donnees ouvertes agregue des jeux de donnees de l’ensemble du gouvernement. Plus de 10 000 jeux de donnees couvrant la demographie, l’economie, la geographie, les transports, l’environnement et l’administration.
Pourquoi personne ne les utilise
Les donnees existent. Elles sont gratuites. Elles font autorite. Alors pourquoi restent-elles inutilisees ?
Fragmentation. Les donnees federales sont a un endroit. Les donnees cantonales sont a 26 endroits differents avec 26 formats differents. Les decisions de justice sont sur des portails separes. Les publications FINMA sont sur le site de la FINMA. La FOSC est sur sa propre plateforme. Il n’y a pas de point d’acces unifie. Un professionnel qui a besoin de croiser une loi federale avec les implementations cantonales et les decisions de justice pertinentes doit naviguer entre plusieurs systemes, chacun avec sa propre interface de recherche et sa propre structure de donnees.
Incoherence des formats. Fedlex fournit du XML magnifiquement structure. Certaines bases de donnees cantonales fournissent des donnees structurees. D’autres fournissent des scans PDF. Les decisions de justice vont du XML structure au HTML brut en passant par des PDF non interrogeables. Construire un systeme complet necessite de gerer tous ces formats.
Volume. Le corpus total de donnees juridiques et reglementaires suisses atteint des millions de documents. Traiter, structurer et indexer ce volume necessite des ressources de calcul et un effort d’ingenierie significatifs. Ce n’est pas un projet de week-end.
Pas de couche IA. Les donnees sont publiees pour la consommation humaine. Les portails gouvernementaux fournissent des interfaces de recherche concues pour des personnes qui savent ce qu’elles cherchent. Ils ne fournissent pas de recherche semantique, d’interrogation en langage naturel, d’analyse de references croisees ou le type de recherche intelligente que l’IA permet. Un avocat peut trouver un article specifique s’il connait le numero RS. Il ne peut pas demander “quelles sont mes obligations lors de la resiliation d’un bail commercial a Zurich ?” et obtenir une reponse complete multi-sources.
Percu comme de l’infrastructure ennuyeuse. Les startups IA preferent construire des chatbots grand public ou des copilotes d’entreprise. Le travail ingrat d’ingestion, de structuration et de maintenance de donnees gouvernementales a grande echelle n’attire pas l’attention du capital-risque. C’est la plomberie des donnees que personne ne veut faire.
L’opportunite
Voici ce qui devient possible quand on traite les donnees ouvertes gouvernementales suisses comme une base de connaissances unifiee, structuree et prete pour l’IA :
Recherche juridique complete. Chaque loi federale, chaque loi cantonale, chaque decision de justice publiee, reliees par des graphes de citations. Posez une question juridique et obtenez des reponses ancrees dans le corpus complet, pas seulement le sous-ensemble que couvre un seul portail.
Detection des changements reglementaires. Surveillez toutes les sources legislatives et reglementaires en continu. Detectez les changements a mesure qu’ils se produisent. Alertez les professionnels lorsque des dispositions affectant leur travail sont modifiees. Plus de decouverte d’un amendement apres qu’il ait deja affecte un client.
Intelligence inter-domaines. Connectez les donnees juridiques aux donnees fiscales, reglementaires et du registre du commerce. Un changement d’entreprise publie dans la FOSC peut etre automatiquement croise avec les obligations reglementaires applicables. Une nouvelle circulaire FINMA peut etre cartographiee par rapport aux dispositions juridiques qu’elle met en oeuvre.
Analyse historique. Avec des decennies de decisions de justice et de modifications legislatives, les donnees permettent des analyses de tendances sophistiquees. Comment l’interpretation du Tribunal federal d’une disposition particuliere a-t-elle evolue dans le temps ? A quelle frequence certains types d’affaires font-ils l’objet d’un appel ? Quel est le taux de succes de certains arguments juridiques ?
Acces multilingue. Construisez un systeme qui comprend les requetes dans n’importe quelle langue et recherche dans toutes les versions linguistiques. Un avocat francophone a Geneve obtient des resultats d’arrets du TF en allemand pertinents pour son dossier mais qu’il n’aurait peut-etre jamais trouves en cherchant uniquement en francais.
Ce qu’il faut pour construire cela
Transformer les donnees ouvertes gouvernementales suisses en infrastructure IA utilisable n’est pas trivial. Cela necessite :
Ingestion complete. Chaque source doit etre identifiee, connectee et surveillee. Sources federales via les API Fedlex. Sources cantonales via des scrapers individuels ou des API la ou elles sont disponibles. Decisions de justice depuis le portail de chaque tribunal. Publications FINMA depuis le site de la FINMA. FOSC depuis la gazette commerciale. Chaque source a sa propre frequence de mise a jour, son propre format de donnees et sa propre methode d’acces.
Analyse structurelle. Les donnees brutes doivent etre analysees en unites structurees. Les lois doivent etre decomposees en articles, alineas et sous-alineas avec les relations hierarchiques preservees. Les decisions de justice doivent etre analysees en metadonnees (tribunal, date, numero de dossier, dispositions juridiques citees) et en contenu. Les entrees FOSC doivent etre analysees en enregistrements structures avec des references d’entites.
Construction du graphe de citations. Chaque reference d’un document a un autre doit etre identifiee, extraite et stockee comme un lien dans un graphe de citations. Un article de loi qui reference une autre loi. Une decision de justice qui cite un article de loi. Une circulaire FINMA qui met en oeuvre une disposition juridique. Ces relations sont ce qui transforme une collection de documents en un graphe de connaissances.
Vectorisation et indexation. Chaque unite structuree doit etre convertie en embeddings vectoriels pour la recherche semantique et indexee avec BM25 pour la recherche par mots-cles. Pour le corpus suisse, cela signifie des millions d’embeddings dans plusieurs langues.
Maintenance continue. Le systeme doit rester a jour. Synchronisations nocturnes avec toutes les sources. Detection des changements pour les modifications, nouvelles decisions et nouvelles publications. Controle de version pour que les utilisateurs puissent voir ce qui a change et quand.
C’est un effort d’ingenierie significatif. C’est aussi un avantage competitif significatif. Une fois construit, le graphe de connaissances juridiques et reglementaires suisses complet est extremement difficile a reproduire. Les donnees sont ouvertes, mais la version structuree, indexee et prete pour l’IA ne l’est pas.
Qui devrait s’y interesser
Cabinets d’avocats qui veulent des capacites de recherche au-dela de ce que Swisslex et les outils existants offrent. La recherche semantique alimentee par IA a travers le corpus juridique suisse complet, avec graphes de citations et support multilingue, est un saut qualitatif en capacite de recherche.
Equipes conformite qui doivent surveiller les changements reglementaires a travers plusieurs domaines. Detection automatisee des changements et analyse des ecarts par rapport aux politiques existantes.
Institutions financieres qui ont besoin d’une intelligence reglementaire complete et actuelle. Circulaires FINMA, legislation bancaire, exigences LBA et obligations transfrontalieres dans un seul systeme interrogeable.
Organisations gouvernementales et du secteur public qui veulent rendre leurs propres donnees plus accessibles et utiles aux administres.
Editeurs juridiques qui veulent enrichir leurs produits avec des capacites IA sans construire l’infrastructure de zero.
L’avantage du premier entrant
L’opportunite est claire, les donnees sont disponibles et la technologie pour les traiter existe. Ce qui a manque, c’est l’engagement a faire le travail ingrat de construction de l’infrastructure.
L’entreprise qui construit la premiere la base de connaissances juridiques et reglementaires suisses complete et prete pour l’IA aura un avantage structurel presque impossible a surmonter. Les donnees sont ouvertes, mais les annees d’effort d’ingenierie, les millions de documents traites, le graphe de citations avec des millions de liens et le pipeline maintenu en continu ne peuvent pas etre reproduits du jour au lendemain.
Mont Virtua a construit cette infrastructure. Notre base de donnees couvre 27 795 lois federales et cantonales, plus d’un million de decisions de justice provenant de 115 tribunaux, 1,4 million de liens de citations, 2,5 millions d’entrees FOSC et des donnees reglementaires FINMA completes. Tout structure, tout indexe, tout mis a jour en continu. Tout diffuse via Enclava, notre plateforme d’intelligence IA reglementee. Visitez enclava.ch pour acceder aux donnees ouvertes gouvernementales suisses comme elles auraient toujours du etre accessibles.