Cos'e il RAG Regolamentato? La Tecnologia Dietro l'IA Affidabile per i Professionisti

La Retrieval-Augmented Generation (RAG) e la tecnologia che rende l'IA affidabile per i settori regolamentati. Ecco come funziona, perche conta e cosa distingue un buon RAG da un cattivo RAG.

Probabilmente avete sentito il termine “RAG” nelle conversazioni sull’IA. E uno di quegli acronimi che vengono lanciati alle conferenze senza molte spiegazioni, lasciando la maggior parte dei professionisti con una vaga sensazione che sia importante ma senza una chiara comprensione di cosa significhi effettivamente o perche dovrebbero interessarsene.

Se lavorate in un settore regolamentato, il RAG non e solo importante. E la differenza tra un’IA di cui potete fidarvi e un’IA di cui non potete fidarvi.

Il problema che il RAG risolve

Per comprendere il RAG, dovete capire la limitazione fondamentale dei grandi modelli linguistici come GPT-4, Claude e Gemini.

Questi modelli sono addestrati su vaste quantita di dati testuali. Durante l’addestramento, assorbono schemi, fatti e relazioni da questi dati. Dopo l’addestramento, il modello e congelato. Non apprende nuove informazioni. Non si aggiorna quando le leggi cambiano. Non sa della circolare FINMA pubblicata martedi scorso.

Questo crea tre problemi per l’uso professionale:

Obsolescenza. La conoscenza del modello ha una data di taglio. Tutto cio che e accaduto dopo l’addestramento e invisibile al modello. Nel diritto, dove una singola modifica puo cambiare l’interpretazione di un intero statuto, lavorare con informazioni obsolete non e accettabile.

Allucinazioni. Quando un modello non ha informazioni su un argomento, non dice “non lo so”. Genera testo che suona plausibile ma potrebbe essere interamente fabbricato. Inventera citazioni di casi, creera disposizioni normative fittizie e le presentera con la stessa sicurezza dei fatti verificati.

Nessuna attribuzione delle fonti. Anche quando la risposta del modello e corretta, non puo dirvi da dove proviene l’informazione. Non puo indicare l’articolo di legge specifico, la decisione giudiziaria specifica o la guida normativa specifica che supporta la sua affermazione. Per i professionisti che devono citare le fonti, questo e un impedimento insormontabile.

Il RAG risolve tutti e tre i problemi attraverso un’architettura ingannevolmente semplice.

Come funziona il RAG

RAG sta per Retrieval-Augmented Generation (Generazione Aumentata dal Recupero). Il nome descrive il processo:

Passo 1: Recupero. Quando un utente pone una domanda, il sistema cerca prima in una base di conoscenza curata le informazioni pertinenti. Questa non e una ricerca per parole chiave. Il sistema converte la domanda in una rappresentazione matematica (un vettore) e trova i documenti il cui significato e simile. Esegue anche ricerche testuali tradizionali per corrispondenze esatte. I risultati vengono combinati e classificati per rilevanza.

Passo 2: Arricchimento. I documenti recuperati vengono forniti al modello linguistico come contesto. Al modello viene essenzialmente detto: “Ecco le informazioni pertinenti. Usa queste per rispondere alla domanda.”

Passo 3: Generazione. Il modello genera la sua risposta sulla base del contesto recuperato, non dei suoi dati di addestramento. Poiche la risposta e fondata su documenti specifici, il modello puo citare le sue fonti. Poiche la base di conoscenza e continuamente aggiornata, la risposta riflette le informazioni attuali. Poiche il modello lavora da documenti reali piuttosto che dalla memoria parametrica, le allucinazioni sono drasticamente ridotte.

Pensatela come la differenza tra chiedere a qualcuno di rispondere a memoria e dargli i fascicoli pertinenti chiedendogli di rispondere dai documenti. Il secondo approccio e piu affidabile, e potete verificare la risposta controllando i fascicoli.

Cosa rende il RAG “regolamentato”

I sistemi RAG standard sono un miglioramento significativo rispetto ai modelli linguistici grezzi. Ma per i settori regolamentati, il RAG standard non e sufficiente. Il RAG regolamentato aggiunge diversi livelli critici.

Dati di origine verificati. La base di conoscenza deve contenere informazioni autorevoli e verificate da fonti ufficiali. Per il diritto svizzero, questo significa legislazione federale da Fedlex, leggi cantonali dalle banche dati cantonali ufficiali, decisioni giudiziarie dai registri ufficiali dei tribunali e pubblicazioni normative da FINMA, SECO e altre autorita. I dati non possono essere scraped da siti giuridici casuali. Devono provenire dalla fonte, e la provenienza deve essere documentata.

Dati strutturati, non solo testo. Una base di conoscenza giuridica non e un mucchio di documenti. Le leggi hanno una struttura gerarchica: libri, titoli, capitoli, articoli, paragrafi, sottoparagrafi. Le decisioni giudiziarie hanno metadati strutturati: tribunale, data, numero di caso, parti, disposizioni legali in questione. Le circolari normative hanno cronologie delle versioni, date di efficacia e registri delle modifiche. Il RAG regolamentato preserva questa struttura, consentendo un recupero preciso a livello di articolo piuttosto che a livello di documento.

Grafi di citazioni. Le disposizioni legali e normative esistono in una rete di relazioni. Una legge fa riferimento ad altre leggi. Le decisioni giudiziarie citano disposizioni legali e altre decisioni. I regolamenti attuano direttive. Il RAG regolamentato costruisce e mantiene questi grafi di citazioni, in modo che quando un utente recupera una disposizione, veda anche le decisioni che la interpretano, i regolamenti che la attuano e le modifiche che l’hanno cambiata.

Allineamento multilingue. In Svizzera, le leggi federali esistono in tre lingue ufficiali (tedesco, francese, italiano), con tutte le versioni ugualmente autorevoli. Un sistema RAG regolamentato deve gestire query multilingue, recuperare attraverso le lingue e presentare i risultati nella lingua preferita dell’utente mantenendo l’allineamento interlinguistico.

Rilevamento dei cambiamenti. Leggi e regolamenti cambiano. Un sistema RAG regolamentato deve rilevare questi cambiamenti, aggiornare la base di conoscenza e opzionalmente avvisare gli utenti che stanno lavorando con disposizioni interessate. Un sistema aggiornato mensilmente in un ambiente dove le leggi possono cambiare settimanalmente non soddisfa lo standard.

Audit trail. Ogni recupero, ogni generazione, ogni fonte utilizzata deve essere registrata. Quando un professionista cita informazioni dal sistema, deve poter dimostrare la catena delle evidenze: cosa e stato chiesto, cosa e stato recuperato, quali fonti hanno informato la risposta.

Lo stack tecnico

Per chi e curioso dell’ingegneria, ecco cosa c’e sotto il cofano di un moderno sistema RAG regolamentato.

Database vettoriale. I documenti vengono convertiti in vettori ad alta dimensione (rappresentazioni numeriche che catturano il significato) utilizzando modelli di embedding. Questi vettori sono archiviati in un database specializzato (come pgvector, Pinecone o Weaviate) che supporta la ricerca per similarita. Quando arriva una query, il sistema trova i documenti le cui rappresentazioni vettoriali sono piu simili al vettore della query.

Indice BM25. La ricerca vettoriale cattura la similarita semantica (significato), ma a volte servono corrispondenze esatte. BM25 e un algoritmo di ricerca testuale collaudato che eccelle nel trovare termini specifici, numeri di caso, riferimenti ad articoli e terminologia tecnica. Un buon sistema RAG esegue entrambe le ricerche vettoriali e BM25 in parallelo.

Reciprocal Rank Fusion (RRF). I risultati della ricerca vettoriale e di BM25 vengono combinati utilizzando un algoritmo di ranking che prende il meglio di entrambi gli approcci. I documenti che si classificano in alto in entrambe le ricerche vengono prioritizzati.

Reranking con cross-encoder. Il recupero iniziale lancia una rete ampia. Un modello cross-encoder poi riclassifica i risultati esaminando ogni coppia documento-query in dettaglio, spingendo i risultati piu rilevanti in cima.

Embedding contestuale. Una tecnica pionieristica di Anthropic. Prima di convertire in embedding un chunk di documento, il sistema utilizza un modello linguistico per generare una breve descrizione contestuale: a quale documento appartiene questo chunk, dove si colloca nella struttura del documento e di cosa tratta. Questo contesto viene preposto al chunk prima dell’embedding, migliorando drasticamente l’accuratezza del recupero.

Embedding multilingue. Modelli come BGE-M3 producono embedding che funzionano attraverso le lingue. Una query in tedesco puo recuperare documenti in francese se il significato corrisponde. Questo e essenziale per il lavoro giuridico svizzero.

Insieme, questi componenti creano una pipeline di recupero molto piu sofisticata di una ricerca Google. Comprende il significato, rispetta la struttura, gestisce piu lingue e produce risultati classificati con attribuzione completa delle fonti.

Perche questo conta per la vostra pratica

L’impatto pratico del RAG regolamentato non e astratto. Considerate alcuni scenari:

Un avvocato societario che esamina una transazione transfrontaliera. Deve verificare disposizioni nel diritto societario svizzero, nella regolamentazione UE sulle fusioni e negli obblighi dei trattati bilaterali. Un sistema RAG regolamentato recupera le disposizioni specifiche da tutti e tre i domini, mostra le relazioni di citazione tra di esse ed evidenzia le modifiche recenti. Cio che richiederebbe mezza giornata di ricerca manuale richiede quindici minuti.

Un responsabile della conformita che valuta una nuova circolare FINMA. Deve identificare ogni politica interna interessata dal cambiamento. Il sistema RAG mappa le disposizioni della circolare rispetto al framework delle politiche dell’istituzione, produce un’analisi delle lacune e genera una prima bozza degli aggiornamenti necessari. Il responsabile rivede, perfeziona e approva. Tempo totale: due ore invece di due settimane.

Un consulente fiscale che valuta una ristrutturazione. La ristrutturazione tocca l’imposta sulle societa, l’IVA, le tasse di bollo e potenzialmente gli obblighi di ritenuta alla fonte in tre cantoni. Il sistema RAG recupera le disposizioni pertinenti da tutti i regimi fiscali applicabili, segnala decisioni recenti che influenzano l’analisi e presenta una panoramica strutturata. Il consulente si concentra sulla strategia piuttosto che sulla ricerca.

In ogni caso, il sistema RAG svolge il lavoro di recupero e sintesi. Il professionista fornisce il giudizio. La combinazione e piu potente di ciascuno dei due da solo.

Scegliere il sistema RAG giusto

Non tutti i sistemi RAG sono uguali. Se state valutando strumenti IA per il lavoro regolamentato, ecco le domande da porre:

  1. Da dove provengono i dati di origine? Se il fornitore non puo dirvi esattamente quali fonti autorevoli alimentano la sua base di conoscenza, c’e un problema.
  2. Con quale frequenza vengono aggiornati i dati? Mensilmente non e sufficiente per il lavoro giuridico. Settimanalmente e il minimo. Giornaliero o in tempo reale e lo standard a cui aspirare.
  3. Potete verificare le fonti? Ogni output dovrebbe includere citazioni cliccabili al documento di origine. Nessuna citazione, nessuna fiducia.
  4. Dove e ospitata l’infrastruttura? Per i settori regolamentati svizzeri, l’hosting svizzero non e opzionale.
  5. C’e un audit trail? Potete ricostruire la catena dalla query al recupero all’output?
  6. Gestisce query multilingue? In Svizzera, questo e un requisito funzionale, non un nice-to-have.

Enclava, costruita da Mont Virtua, e progettata attorno a questi principi. Dati giuridici e normativi svizzeri verificati, continuamente aggiornati, multilingue, con hosting svizzero, con attribuzione completa delle fonti su ogni output. Se volete vedere come appare il RAG regolamentato nella pratica, visitate enclava.ch.

Torna al blog

Articoli correlati