Il diritto svizzero è pubblico. Ogni legge federale si trova su Fedlex. Ogni raccolta legislativa cantonale è online. Molte decisioni giudiziarie sono pubblicate sui siti dei tribunali. I dati ci sono. Ma «ci sono» e «utilizzabili» sono due cose diverse.
In tre settimane abbiamo costruito una banca dati che comprende 27 795 leggi svizzere, 2,02 milioni di unità legislative strutturate e 1,14 milioni di decisioni giudiziarie di 115 tribunali. Questo articolo descrive il percorso dalla fonte ufficiale alla base di conoscenza consultabile.
Il punto di partenza: cosa mette a disposizione la Confederazione
La Confederazione Svizzera gestisce Fedlex, una delle migliori piattaforme giuridiche aperte d’Europa. La Raccolta sistematica del diritto federale (RS) è completamente digitalizzata e interrogabile tramite un endpoint SPARQL. Il formato è Akoma Ntoso, uno standard XML internazionale per i testi legislativi.
Ciò significa: ogni articolo, ogni capoverso, ogni cronologia delle modifiche è leggibile da macchina. Non come PDF, ma come XML strutturato con marcatura semantica per i rinvii, le definizioni e gli elementi strutturali.
Fase 1: estrazione dei dati
Il primo compito è stato estrarre tutte le leggi e ordinanze federali da Fedlex. Tramite l’endpoint SPARQL abbiamo interrogato tutti i numeri RS e scaricato i corrispondenti documenti Akoma Ntoso.
Per le leggi cantonali, il percorso era meno uniforme. Ognuno dei 26 cantoni gestisce la propria raccolta legislativa. Alcuni (Zurigo, Berna, Vaud) offrono API strutturate. Altri pubblicano esclusivamente in PDF. Per ogni cantone è stato necessario sviluppare un estrattore separato.
Risultato finale: 27 795 leggi da tutti i 26 cantoni, dalla Confederazione e da organismi intercantonali. Comprende: leggi federali, ordinanze federali, leggi cantonali, ordinanze cantonali, concordati intercantonali e trattati.
Fase 2: strutturazione in unità legislative
Una legge nella sua interezza è troppo grande per le applicazioni di IA. Un singolo articolo è talvolta troppo piccolo (manca il contesto). L’unità rilevante è l’«unità legislativa»: una sezione strutturata con un proprio focus tematico.
Abbiamo scomposto le 27 795 leggi in 2,02 milioni di unità legislative. Ogni unità contiene:
- Il testo integrale
- La posizione gerarchica nella legge (Libro > Titolo > Capitolo > Sezione > Articolo > Capoverso)
- Il numero RS e il riferimento al paragrafo
- La lingua (DE, FR, IT, EN)
- Metadati: entrata in vigore, ultima modifica, stato
Questa granularità è fondamentale. Quando un’avvocata cerca «termine di disdetta per contratti di lavoro a tempo indeterminato», deve trovare l’art. 335c CO, non l’intero Codice delle obbligazioni.
Fase 3: decisioni giudiziarie
I tribunali svizzeri pubblicano le loro decisioni su diverse piattaforme. Il Tribunale federale su bger.ch. Il Tribunale amministrativo federale su bvger.ch. I tribunali cantonali su entscheidsuche.ch o sui propri portali.
Abbiamo raccolto sistematicamente tutte le decisioni disponibili. Risultato: 1,14 milioni di decisioni di 115 tribunali. Le decisioni del Tribunale federale sono complete. Le decisioni del Tribunale amministrativo federale sono complete (91 582 decisioni, zero stubs). La copertura cantonale varia da cantone a cantone.
Ogni decisione è stata strutturata con: tribunale, data, numero di dossier, tipo di procedimento, leggi applicate, rinvii ad altre decisioni e testo integrale.
Fase 4: il grafo delle citazioni
Le leggi citano altre leggi. Le decisioni citano leggi. Le decisioni citano altre decisioni. Questi rinvii formano una rete: il grafo delle citazioni.
Abbiamo estratto 1,42 milioni di archi di citazione. Ogni arco collega una fonte (p. es. una decisione del Tribunale federale) a un obiettivo (p. es. un articolo del CO o una decisione precedente). Questa rete rende visibile come il diritto svizzero è interconnesso.
Un esempio concreto: l’art. 58 LIFD (imposta sull’utile delle persone giuridiche) è citato da 842 decisioni del Tribunale federale. 23 decisioni cantonali vi fanno riferimento negli ultimi due anni. La frequenza delle citazioni rivela quali articoli sono controversi nella pratica. Una frequenza decrescente può indicare che una questione giuridica è stata risolta. Una frequenza crescente segnala l’emergere di nuovi conflitti.
Nessun’altra piattaforma in Svizzera offre questa analisi.
Fase 5: embedding e ricerca semantica
La ricerca per parole chiave ha una debolezza fondamentale: trova solo ciò che è scritto esattamente come viene cercato. «Disdetta del rapporto di lavoro» non trova «scioglimento del contratto di impiego», anche se entrambi significano la stessa cosa.
La ricerca semantica risolve questo problema. Ognuna delle 2,02 milioni di unità legislative e ognuna delle 1,14 milioni di decisioni è stata convertita in un vettore (embedding). Questi vettori rappresentano il contenuto del testo, non la sua formulazione.
Totale: 3,13 milioni di embedding. Risultato: una ricerca «il datore di lavoro deve continuare a pagare il salario in caso di malattia» trova l’art. 324a CO, anche se quella formulazione esatta non compare in nessun punto del testo di legge.
Fase 6: multilinguismo
Il diritto svizzero esiste in quattro lingue. Le tre lingue ufficiali (tedesco, francese, italiano) sono giuridicamente equivalenti. Molte decisioni esistono solo in una lingua.
La nostra banca dati copre: 1,5 milioni di unità legislative in tedesco, 232 000 in francese, 235 000 in italiano e 45 000 in inglese. La ricerca funziona in modo translinguistico: una domanda in tedesco può trovare una decisione pertinente in francese, se quella decisione contiene la risposta migliore.
Cosa significa per la pratica
La combinazione di dati strutturati, grafo delle citazioni e ricerca semantica trasforma la ricerca giuridica. Invece di passare un’ora a perfezionare parole chiave, l’avvocata descrive il suo problema in linguaggio naturale. La piattaforma trova le leggi pertinenti, le decisioni e le connessioni tra di esse.
Ogni risultato rimanda alla fonte ufficiale. Nessuna allucinazione. Nessuna supposizione. Se la risposta non è nei dati, il sistema lo dice.
Tutti i dati provengono da fonti governative ufficiali e vengono aggiornati ogni notte. Nessun intermediario. Nessun editore. La fonte stessa.
Ulteriori informazioni: montvirtua.com
Questo articolo ha finalità informative e non costituisce una consulenza legale.