Qu'est-ce que le RAG reglemente ? La technologie derriere une IA fiable pour les professionnels

La generation augmentee par la recherche (RAG) est la technologie qui rend l'IA fiable pour les industries reglementees. Voici comment elle fonctionne, pourquoi elle compte et ce qui distingue un bon RAG d'un mauvais.

Vous avez probablement entendu le terme “RAG” dans des conversations sur l’IA. C’est l’un de ces acronymes qu’on lance dans les conferences sans beaucoup d’explication, laissant la plupart des professionnels avec le sentiment vague que c’est important mais sans comprehension claire de ce que cela signifie reellement ou pourquoi ils devraient s’en soucier.

Si vous travaillez dans une industrie reglementee, le RAG n’est pas juste important. C’est la difference entre une IA en laquelle vous pouvez avoir confiance et une IA en laquelle vous ne le pouvez pas.

Le probleme que le RAG resout

Pour comprendre le RAG, vous devez comprendre la limitation fondamentale des grands modeles de langage comme GPT-4, Claude et Gemini.

Ces modeles sont entraines sur de vastes quantites de donnees textuelles. Pendant l’entrainement, ils absorbent des schemas, des faits et des relations a partir de ces donnees. Apres l’entrainement, le modele est fige. Il n’apprend pas de nouvelles informations. Il ne se met pas a jour quand les lois changent. Il ne connait pas la circulaire FINMA publiee mardi dernier.

Cela cree trois problemes pour l’usage professionnel :

Obsolescence. Les connaissances du modele ont une date limite. Tout ce qui s’est passe apres l’entrainement est invisible pour le modele. En droit, ou un seul amendement peut changer l’interpretation d’un statut entier, travailler avec des informations obsoletes n’est pas acceptable.

Hallucination. Quand un modele n’a pas d’information sur un sujet, il ne dit pas “je ne sais pas”. Il genere du texte qui semble plausible mais peut etre entierement fabrique. Il inventera des citations de jurisprudence, creera des dispositions reglementaires fictives et les presentera avec la meme assurance que des faits verifies.

Pas d’attribution de sources. Meme quand la reponse du modele est correcte, il ne peut pas vous dire d’ou vient l’information. Il ne peut pas pointer vers l’article de loi specifique, la decision de justice specifique ou la directive reglementaire specifique qui soutient sa declaration. Pour les professionnels qui doivent citer leurs sources, c’est eliminatoire.

Le RAG resout ces trois problemes a travers une architecture d’une simplicite trompeuse.

Comment fonctionne le RAG

RAG signifie Retrieval-Augmented Generation, ou generation augmentee par la recherche. Le nom decrit le processus :

Etape 1 : Recherche. Quand un utilisateur pose une question, le systeme cherche d’abord dans une base de connaissances curee les informations pertinentes. Ce n’est pas une recherche par mots-cles. Le systeme convertit la question en une representation mathematique (un vecteur) et trouve les documents dont le sens est similaire. Il execute aussi des recherches textuelles traditionnelles pour les correspondances exactes. Les resultats sont combines et classes par pertinence.

Etape 2 : Augmentation. Les documents recuperes sont fournis au modele de langage comme contexte. On dit essentiellement au modele : “Voici l’information pertinente. Utilise-la pour repondre a la question.”

Etape 3 : Generation. Le modele genere sa reponse a partir du contexte recupere, pas de ses donnees d’entrainement. Parce que la reponse est ancree dans des documents specifiques, le modele peut citer ses sources. Parce que la base de connaissances est continuellement mise a jour, la reponse reflete les informations actuelles. Parce que le modele travaille a partir de vrais documents plutot que de sa memoire parametrique, l’hallucination est dramatiquement reduite.

Pensez-y comme la difference entre demander a quelqu’un de repondre de memoire et lui donner les dossiers pertinents en lui demandant de repondre a partir des documents. La seconde approche est plus fiable, et vous pouvez verifier la reponse en consultant les dossiers.

Ce qui rend le RAG “reglemente”

Les systemes RAG standards sont une amelioration significative par rapport aux modeles de langage bruts. Mais pour les industries reglementees, le RAG standard ne suffit pas. Le RAG reglemente ajoute plusieurs couches critiques.

Donnees sources verifiees. La base de connaissances doit contenir des informations faisant autorite et verifiees provenant de sources officielles. Pour le droit suisse, cela signifie la legislation federale de Fedlex, les lois cantonales des bases de donnees cantonales officielles, les decisions de justice des registres officiels des tribunaux et les publications reglementaires de la FINMA, du SECO et d’autres autorites. Les donnees ne peuvent pas etre scrapees de sites juridiques aleatoires. Elles doivent venir de la source, et la provenance doit etre documentee.

Donnees structurees, pas juste du texte. Une base de connaissances juridiques n’est pas une pile de documents. Les lois ont une structure hierarchique : livres, titres, chapitres, articles, alineas, sous-alineas. Les decisions de justice ont des metadonnees structurees : tribunal, date, numero de dossier, parties, dispositions juridiques en cause. Les circulaires reglementaires ont des historiques de version, des dates d’entree en vigueur et des registres de modification. Le RAG reglemente preserve cette structure, permettant une recherche precise au niveau de l’article plutot qu’au niveau du document.

Graphes de citations. Les dispositions juridiques et reglementaires existent dans un reseau de relations. Une loi reference d’autres lois. Les decisions de justice citent des dispositions juridiques et d’autres decisions. Les reglementations mettent en oeuvre des directives. Le RAG reglemente construit et maintient ces graphes de citations, de sorte que lorsqu’un utilisateur recupere une disposition, il voit aussi les decisions qui l’interpretent, les reglementations qui la mettent en oeuvre et les amendements qui l’ont modifiee.

Alignement multilingue. En Suisse, les lois federales existent dans trois langues officielles (allemand, francais, italien), chaque version faisant egalement autorite. Un systeme RAG reglemente doit gerer les requetes multilingues, rechercher a travers les langues et presenter les resultats dans la langue preferee de l’utilisateur tout en maintenant l’alignement inter-linguistique.

Detection des changements. Les lois et reglementations changent. Un systeme RAG reglemente doit detecter ces changements, mettre a jour la base de connaissances et optionnellement alerter les utilisateurs qui travaillent avec des dispositions affectees. Un systeme mis a jour mensuellement dans un environnement ou les lois peuvent changer chaque semaine ne repond pas a la norme.

Piste d’audit. Chaque recherche, chaque generation, chaque source utilisee doit etre journalisee. Quand un professionnel cite des informations du systeme, il doit pouvoir demontrer la chaine de preuves : ce qui a ete demande, ce qui a ete recupere, quelles sources ont informe la reponse.

La pile technique

Pour ceux qui s’interessent a l’ingenierie, voici ce qui se trouve sous le capot d’un systeme RAG reglemente moderne.

Base de donnees vectorielle. Les documents sont convertis en vecteurs de haute dimension (des representations numeriques qui capturent le sens) a l’aide de modeles d’embedding. Ces vecteurs sont stockes dans une base de donnees specialisee (comme pgvector, Pinecone ou Weaviate) qui prend en charge la recherche par similarite. Quand une requete arrive, le systeme trouve les documents dont les representations vectorielles sont les plus similaires a celle de la requete.

Index BM25. La recherche vectorielle capture la similarite semantique (le sens), mais parfois vous avez besoin de correspondances exactes. BM25 est un algorithme de recherche textuelle eprouve qui excelle a trouver des termes specifiques, des numeros de dossier, des references d’articles et de la terminologie technique. Un bon systeme RAG execute les deux recherches en parallele.

Reciprocal Rank Fusion (RRF). Les resultats de la recherche vectorielle et de BM25 sont combines a l’aide d’un algorithme de classement qui prend le meilleur des deux approches. Les documents qui se classent bien dans les deux recherches sont priorises.

Re-classement par cross-encoder. La recherche initiale ratisse large. Un modele cross-encoder re-classe ensuite les resultats en examinant chaque paire document-requete en detail, poussant les resultats les plus pertinents vers le haut.

Embedding contextuel. Une technique pionniere d’Anthropic. Avant de vectoriser un fragment de document, le systeme utilise un modele de langage pour generer une breve description contextuelle : a quel document ce fragment appartient, ou il se situe dans la structure du document et de quoi il traite. Ce contexte est ajoute au fragment avant la vectorisation, ameliorant considerablement la precision de la recherche.

Embeddings multilingues. Des modeles comme BGE-M3 produisent des embeddings qui fonctionnent a travers les langues. Une requete en allemand peut recuperer des documents en francais si le sens correspond. C’est essentiel pour le travail juridique suisse.

Ensemble, ces composants creent un pipeline de recherche bien plus sophistique qu’une recherche Google. Il comprend le sens, respecte la structure, gere plusieurs langues et produit des resultats classes avec attribution complete des sources.

Pourquoi cela compte pour votre pratique

L’impact pratique du RAG reglemente n’est pas abstrait. Considerez quelques scenarios :

Un avocat d’affaires examinant une transaction transfrontaliere. Il doit verifier des dispositions a travers le droit suisse des societes, la reglementation europeenne des fusions et les obligations des traites bilateraux. Un systeme RAG reglemente recupere les dispositions specifiques des trois domaines, montre les relations de citation entre elles et met en evidence les amendements recents. Ce qui prendrait une demi-journee de recherche manuelle prend quinze minutes.

Un responsable conformite evaluant une nouvelle circulaire FINMA. Il doit identifier chaque politique interne affectee par le changement. Le systeme RAG cartographie les dispositions de la circulaire par rapport au cadre de politiques de l’institution, produit une analyse des ecarts et genere un premier brouillon des mises a jour requises. Le responsable examine, affine et approuve. Temps total : deux heures au lieu de deux semaines.

Un conseiller fiscal evaluant une restructuration. La restructuration touche l’impot sur les societes, la TVA, les droits de timbre et potentiellement les obligations de retenue a la source dans trois cantons. Le systeme RAG recupere les dispositions pertinentes de tous les regimes fiscaux applicables, signale les decisions recentes qui affectent l’analyse et presente une vue d’ensemble structuree. Le conseiller se concentre sur la strategie plutot que sur la recherche.

Dans chaque cas, le systeme RAG effectue le travail de recherche et de synthese. Le professionnel apporte le jugement. La combinaison est plus puissante que l’un ou l’autre seul.

Choisir le bon systeme RAG

Tous les systemes RAG ne se valent pas. Si vous evaluez des outils IA pour le travail reglemente, voici les questions a poser :

  1. D’ou viennent les donnees sources ? Si le fournisseur ne peut pas vous dire exactement quelles sources faisant autorite alimentent sa base de connaissances, c’est un probleme.
  2. A quelle frequence les donnees sont-elles mises a jour ? Mensuellement ne suffit pas pour le travail juridique. Hebdomadairement est le minimum. Quotidiennement ou en temps reel est la norme a viser.
  3. Pouvez-vous verifier les sources ? Chaque resultat devrait inclure des citations cliquables vers le document source original. Pas de citation, pas de confiance.
  4. Ou est hebergee l’infrastructure ? Pour les industries reglementees suisses, l’hebergement suisse n’est pas optionnel.
  5. Y a-t-il une piste d’audit ? Pouvez-vous reconstituer la chaine de la requete a la recherche au resultat ?
  6. Le systeme gere-t-il les requetes multilingues ? En Suisse, c’est une exigence fonctionnelle, pas un avantage supplementaire.

Enclava, construit par Mont Virtua, est concu autour de ces principes. Donnees juridiques et reglementaires suisses verifiees, mises a jour en continu, multilingues, hebergees en Suisse, avec attribution complete des sources sur chaque resultat. Si vous voulez voir a quoi ressemble le RAG reglemente en pratique, visitez enclava.ch.

Retour au blog

Articles similaires