La scelta tra modelli IA open source e proprietari non è, per le aziende regolamentate, una decisione puramente tecnica. Ha implicazioni sulla sovranità dei dati, la compliance, i costi e l’indipendenza strategica a lungo termine. Ciononostante, il dibattito viene spesso ridotto a “l’open source è più economico” o “i modelli proprietari sono migliori”. Entrambe le affermazioni sono troppo semplicistiche.
Questo articolo offre un confronto oggettivo dei due approcci, specificamente per l’impiego nei settori regolamentati come il diritto, la finanza e la sanità.
Cosa significa open source per i modelli IA
Il termine “open source” viene utilizzato nell’ambito dell’IA in modo diverso rispetto allo sviluppo software tradizionale. Nel software classico, open source significa che il codice sorgente è liberamente disponibile, può essere esaminato, modificato e ridistribuito. Per i modelli IA la situazione è più complessa.
Modelli completamente aperti mettono a disposizione i pesi del modello, il codice di addestramento e idealmente anche i dati di addestramento. Ciò consente la riproducibilità e la personalizzazione completa del modello. Esempi sono alcuni modelli della famiglia Llama di Meta o modelli Mistral.
Modelli parzialmente aperti mettono a disposizione i pesi del modello, ma non il codice o i dati di addestramento. Ciò consente l’utilizzo e il fine-tuning del modello, ma non la riproduzione completa del processo di addestramento.
Modelli proprietari come GPT di OpenAI o Claude di Anthropic sono accessibili solo tramite API. I pesi del modello, il codice di addestramento e i dati di addestramento non sono pubblici. L’utente invia dati all’API e riceve i risultati.
Questa distinzione è rilevante per i settori regolamentati, poiché influisce direttamente sul grado di controllo che un’azienda ha sul sistema IA.
Auditabilità
I settori regolamentati sono soggetti ad autorità di vigilanza che hanno il diritto di verificare i sistemi impiegati. Per i sistemi IA si pone la domanda: il sistema può essere sottoposto ad audit?
Vantaggio dell’open source. Quando i pesi del modello e il codice sono disponibili, un revisore può verificare tecnicamente il sistema. Può ricostruire come il modello è stato addestrato, quali dati sono stati utilizzati e come prende le decisioni. Per i settori regolamentati in cui è richiesta trasparenza nei confronti delle autorità di vigilanza, questo è un vantaggio considerevole.
Limitazione del proprietario. Con i modelli proprietari, un audit tecnico da parte di soggetti esterni non è possibile. Il fornitore può esibire certificazioni (SOC 2, ISO 27001), ma il funzionamento interno del modello resta una scatola nera. Per determinati requisiti normativi, in particolare nel settore finanziario sotto la vigilanza FINMA, ciò può risultare problematico.
Nella pratica, la rilevanza dell’auditabilità dipende dalla specifica regolamentazione. Non tutte le autorità di vigilanza richiedono l’accesso al codice del modello. Ma la tendenza è verso una maggiore trasparenza, non verso una minore. Il regolamento europeo sull’IA (AI Act), che riguarda anche le aziende svizzere con attività nell’UE, pone requisiti espliciti in materia di documentazione e tracciabilità dei sistemi IA.
Sovranità dei dati
Per le aziende svizzere nei settori regolamentati, la questione della sovranità dei dati è centrale. Dove vengono elaborati i dati? Chi ha potenzialmente accesso?
Vantaggio dell’open source. I modelli open source possono essere gestiti su infrastruttura propria. Un’azienda svizzera può installare e gestire un modello Llama o Mistral su un server svizzero. Nessun dato lascia la Svizzera. Nessuna giurisdizione straniera ha possibilità di accesso. Per gli studi legali che devono preservare il segreto professionale ai sensi dell’art. 13 LLCA, o per i fornitori di servizi finanziari sotto vigilanza FINMA, questa è la via più sicura.
Limitazione del proprietario. I modelli proprietari richiedono tipicamente l’invio di dati all’API del fornitore. Ciò significa che i dati vengono elaborati sull’infrastruttura del fornitore. Nel caso di fornitori statunitensi, sono potenzialmente soggetti al CLOUD Act. Anche se il fornitore utilizza server europei, il rischio giuridico permane finché il fornitore è soggetto al diritto statunitense.
Esistono forme intermedie: alcuni fornitori proprietari offrono istanze dedicate o deployment on-premises. Queste opzioni sono tuttavia costose e non sempre disponibili.
Prestazioni
Le prestazioni pure del modello sono un ambito in cui i modelli proprietari hanno tradizionalmente avuto un vantaggio. La situazione sta cambiando, ma resta differenziata.
Vantaggio del proprietario. I modelli proprietari più grandi (GPT-4, Claude) figurano ancora tra i modelli linguistici più performanti. Hanno finestre di contesto più ampie, una migliore aderenza alle istruzioni e ottengono i migliori risultati in molti benchmark.
La rincorsa dell’open source. Modelli open source come Llama 3, Mistral e i loro successori hanno ridotto significativamente il divario negli ultimi due anni. Per molte applicazioni pratiche, specialmente quando il modello viene perfezionato con dati specifici del dominio, i modelli open source forniscono risultati comparabili.
L’opzione del fine-tuning. Un vantaggio decisivo dei modelli open source è la possibilità di fine-tuning: il modello viene ulteriormente addestrato con dati specifici del dominio e ottimizzato per il caso d’uso specifico. Un modello generico, addestrato specificamente sul diritto svizzero, può in questo ambito superare un modello proprietario più grande e generico.
Per i settori regolamentati, le prestazioni in domini specifici contano più dei risultati generali dei benchmark. Un modello addestrato sui dati giuridici svizzeri otterrà risultati migliori nella ricerca giuridica svizzera rispetto a un modello generico, indipendentemente dalle sue prestazioni complessive.
Costi
La struttura dei costi differisce fondamentalmente tra i due approcci.
I modelli proprietari vengono tipicamente fatturati a consumo: per token, per richiesta o come abbonamento mensile. I costi sono prevedibili e la soglia di ingresso è bassa. Tuttavia, i costi scalano linearmente con l’utilizzo. Un’azienda che elabora migliaia di richieste al giorno paga canoni correnti considerevoli.
I modelli open source richiedono un investimento in infrastruttura: server con GPU performanti, storage, connettività di rete. L’investimento iniziale è più elevato, ma i costi correnti sono significativamente inferiori, poiché non si applicano canoni di utilizzo. A partire da un determinato volume di utilizzo, il self-hosting diventa economicamente più vantaggioso rispetto all’uso delle API.
Per le piccole aziende o i team che utilizzano l’IA occasionalmente, le API proprietarie sono spesso più convenienti. Per le aziende con un elevato volume di utilizzo o requisiti di sicurezza particolari, il self-hosting di modelli open source può essere la scelta migliore.
Indipendenza strategica
Un aspetto spesso trascurato è la dipendenza strategica che accompagna i modelli proprietari.
Vendor lock-in. Chi costruisce i propri processi su un modello proprietario dipende dal fornitore. Aumenti di prezzo, modifiche delle condizioni d’uso o la dismissione di un modello possono avere conseguenze significative. Il passaggio a un altro fornitore richiede adattamenti di prompt, workflow e integrazioni.
Rischi geopolitici. I maggiori fornitori di IA proprietari sono aziende statunitensi. Cambiamenti geopolitici, restrizioni all’esportazione o sviluppi normativi negli Stati Uniti possono influire sull’accesso a questi servizi. Per le aziende svizzere nei settori regolamentati, che devono poter contare sulla disponibilità a lungo termine dei propri strumenti, questo è un rischio rilevante.
Resilienza dell’open source. I modelli open source non possono essere “spenti”. Una volta scaricati e installati sulla propria infrastruttura, restano disponibili indipendentemente dalle decisioni dello sviluppatore originario. Ciò offre una resilienza che i modelli proprietari non possono garantire.
L’approccio pragmatico
Nella pratica, la decisione è raramente binaria. L’approccio più pragmatico per le aziende regolamentate combina i punti di forza di entrambi i mondi.
Dati sensibili su infrastruttura propria. Per l’elaborazione di dati riservati di mandanti, clienti o pazienti, i modelli open source su infrastruttura svizzera sono la scelta più indicata. Nessun dato esce dal controllo dell’azienda.
Modelli proprietari per attività non critiche. Per attività generiche senza dati sensibili, come sintesi interne di documenti pubblici o brainstorming, le API proprietarie possono essere utilizzate se la struttura dei costi è adeguata.
Piattaforme che integrano entrambi gli approcci. La soluzione più efficace sono le piattaforme che impiegano diversi modelli a seconda dei requisiti. La piattaforma Enclava di Mont Virtua segue questo approccio: hosting svizzero, controllo sull’elaborazione dei dati e la flessibilità di impiegare il modello migliore per ciascun caso d’uso.
Raccomandazione per i settori regolamentati
Per le aziende nei settori regolamentati raccomandiamo le seguenti linee guida:
Verificate se la vostra autorità di vigilanza pone requisiti specifici in materia di auditabilità dei sistemi IA. In caso affermativo, privilegiate i modelli open source o fornitori che offrano piena trasparenza.
Elaborate i dati sensibili esclusivamente su infrastruttura soggetta al diritto svizzero. Questo depone a favore del self-hosting di modelli open source o di fornitori con giurisdizione svizzera comprovata.
Valutate i costi complessivi, non solo quelli iniziali. Considerate infrastruttura, personale, manutenzione e scalabilità per le soluzioni open source, nonché i canoni di utilizzo a lungo termine per i modelli proprietari.
Evitate una dipendenza eccessiva da un singolo fornitore. Mantenete la possibilità di cambiare modello senza dover ristrutturare l’intera infrastruttura.
Se state pianificando una valutazione e desiderate sapere quale approccio sia più adatto alla vostra azienda, contattateci all’indirizzo [email protected] o visitate la nostra pagina di contatto.