Le autorità di regolamentazione svizzere richiedono la prova che i sistemi di IA funzionino in modo affidabile. I test tradizionali non possono fornirla. Ecco perché gli approcci statistici sono la soluzione.
Quando una banca distribuisce un modello di IA per valutare il rischio creditizio, o quando un’autorità cantonale utilizza l’apprendimento automatico per classificare le domande, sorge una domanda naturale: come fai a sapere che funziona?
Per il software tradizionale, la risposta è semplice. Scrivi i test. Ogni test verifica che un input specifico produca un output specifico. Se tutti i test hanno successo, hai fiducia nel sistema.
L’IA non funziona così.
Il problema del non-determinismo
I sistemi di IA — in particolare quelli basati su grandi modelli di linguaggio o apprendimento statistico — sono intrinsecamente non-deterministici. Poni la stessa domanda due volte e potresti ottenere risposte diverse. Non è un bug; è una caratteristica fondamentale di come questi sistemi operano.
Questo crea un problema di conformità. FINMA si aspetta la convalida del modello. ISO 42001 richiede la misurazione delle prestazioni. I revisori desiderano prove. Ma prove di cosa, esattamente, quando l’output del sistema varia per design?
Dal sì/no ai tassi di successo
La risposta risiede nel passaggio dai test binari (ha funzionato?) ai test statistici (con quale frequenza funziona ed è abbastanza spesso?).
Invece di affermare che una funzione restituisce un valore specifico, la esegui molte volte e chiedi se il tasso di successo osservato soddisfa una soglia definita a un determinato livello di confidenza. Questa è la base del test probabilistico.
Per un manager aziendale, l’analogia è il controllo di qualità nella produzione. Non testi ogni singolo articolo — testi un campione e fai un giudizio statistico sul lotto. Lo stesso principio si applica all’IA.
Cosa significa questo in pratica
Il test probabilistico produce prove strutturate e quantitative: tassi di successo, intervalli di confidenza, distribuzioni di latenza, dati di tendenza. Questo è esattamente il tipo di prova che i framework normativi richiedono.
Trasforma la conformità dell’IA da un giudizio soggettivo (“pensiamo che funzioni”) a un’affermazione misurabile e verificabile (“abbiamo dimostrato, con il 95% di confidenza, che il tasso di successo di questo sistema supera il 99,5%”).
Per i dettagli tecnici di implementazione, visita javai.org.
