L’Open Worldwide Application Security Project (OWASP) è una fondazione senza scopo di lucro che lavora per migliorare la sicurezza del software. OWASP ha carattere di associazione Internazionale no-profit, che non ha né poteri regolatori, né di standardizzazione, ma cerca (tramite i progetti che supporta e che vengono attivamente portati avanti dai leader e dalla community di riferimento), di mettere a disposizione delle collettività delle risorse (soluzioni software, framework di riferimento, o linee guida) di pubblica utilità per migliorare la sicurezza dei software che tutti, ogni giorno.
In questa veste, seguendo lo sviluppo dei primi Large Language Model (LLM, ovvero modelli linguistici oggi alla base di CHatGPT e di altri assistenti virtuali n.d.r.), l’OWASP ha pubblicato la “OWASP Top 10 LLM” che rappresenta uno dei progetti OWASP mirato ad identificare le 10 principali minacce nell’uso degli LLM.
Concepita in tempi relativamente brevi la top 10 è oggi un riferimento di awareness e di best practices. Davide Ariu, co-Chair di OWASP capitolo italiano e Co-Fondatore e C.E.O. di Pluribus One, ne spiega finalità e contenuti per consentire la migliore comprensione e adozione, da parte di chi sia interessato a questo tipo di tecnologia e voglia praticarla tenendo conto di requisiti di sicurezza informatica.
Indice degli argomenti
Introduzione alla top 10 OWASP per LLM
Il progetto OWASP Top 10 for Large Language Model Applications mira ad istruire sviluppatori, progettisti, architetti, manager e organizzazioni sui potenziali rischi per la sicurezza durante l’implementazione e la gestione di LLM.
Sulle finalità dell’iniziativa Davide Ariu spiega che “l’obiettivo della Top 10 è primariamente un obiettivo di awareness, in quanto ha la finalità di portare l’attenzione di sviluppatori, manager, e organizzazioni che utilizzano o prevedono di utilizzare gli LLM all’interno delle proprie applicazioni e/o processi dei rischi connessi con il loro utilizzo. Il lancio sul mercato degli LLM da ChatGPT in poi, e il loro potenziale di utilizzo in numerosi contesti, rappresenta il cambio di paradigma più significativo nel mondo dello sviluppo software e da qui la nascita di un progetto come la “Top 10 LLM”.
D’altra parte, OWASP non è nuovo a questo tipo di iniziative. L’esperto chiarisce infatti che “il progetto si pone in continuità con una tradizione di iniziative similari che proprio OWASP lanciò a partire dal 2003 con la prima ‘Top 10’ che elencava i dieci attacchi più probabili e rischiosi contro le Web application.
Questo progetto attivo da circa 20 anni, con un aggiornamento costante (ogni 3-4 anni) elenca la lista di attacchi più frequenti contro le Web Applications. La portata del progetto è tale da renderlo un punto di riferimento per i vendor e per i buyer, interessati a identificare le soluzioni di application security che garantiscano la copertura contro quel tipo di attacchi. Per questa ragione OWASP lo classifica come ‘Flagship project’, in quanto progetto di rilevanza strategica per la Community. Lo stesso principio è stato successivamente applicato ad altri contesti, e sono nati progetti analoghi come la ‘Top 10 API’ o la ‘Top 10 Mobile’ che sono stati lanciati progressivamente e in parallelo allo sviluppo e l’uso di API e delle applicazioni Mobile non appena adottate sul mercato”.
In aggiunta la OWASP ha annunciato a versione 1.0 del documento dal titolo Security & Governance Checklist che rappresenta una guida completa dedicata a figure come il Chief Information Security Officer (CISO) spesso chiamato a gestire l’implementazione della tecnologia Gen AI nella propria organizzazione.
Contributo all’awareness per la cyber sicurezza dei LLM
La velocità di accelerazione di alcune tecnologie grazie alla ricerca applicata non è sempre prevedibile, mente invece l’uso massiccio e distribuito è comprensibilmente guidato da logiche di business e di marketing che spingono per una adozione estesa.
Spesso i temi di sicurezza informatica non sono immediatamente studiati, o non possono esserlo fino a quando non si verifica una certa diffusione. In questo senso il presidente OWASP chiarisce che “come spesso accade, le valutazioni sulla sicurezza delle tecnologie seguono l’adozione delle tecnologie stesse. Anche perché alcuni problemi, emergono o si rendono visibili solo quando le tecnologie si rendono disponibili e/o vengono utilizzate su larga scala. Dunque, i rischi derivano dal fatto che gli output degli LLM vengono utilizzati da parte degli utenti, senza una adeguata valutazione. Le implicazioni possono essere di varia natura, in conseguenza del tipo di output. La Top 10 LLM identifica ad esempio un rischio di ‘Insecure Output Handling’ nel caso in cui si usi un LLM per produrre codice: questo codice potrebbe essere vulnerabile e quindi portare un rischio immediato per le applicazioni che ne fanno uso. Ma potremmo avere rischio di altra natura, che nella Top 10 è indicato come ‘Overreliance’ in relazione al caso in cui si usino gli LLM per produrre dei testi. Sappiamo che questi modelli per costruzione possono avere delle cosiddette ‘allucinazioni’ e dunque fornire delle informazioni non corrette, alimentando un rischio di mis-informazione, non necessariamente intenzionale”.
I rischi sono amplificati dall’uso massivo e distribuito che abbraccia anche diversi device e che estende la superficie potenziale vulnerabile. Quindi, fa notare l’esperto, “gli LLM avrebbero un impatto molto limitato se queste tecnologie fossero ad uso di pochi e in contesti circoscritti, ma chiaramente nel momento in cui diventano accessibili a tutti con un browser o tramite una app sullo smartphone il problema si manifesta con una portata completamente differente”.
E proprio come una tecnologia utilizzata senza coscienza delle sue conseguenze, può portare problemi, OWASP ha voluto rendere disponibile a tutti materiale e conoscenza sui temi di sicurezza per ‘pareggiare’ e bilanciare i conti: “La messa a disposizione degli LLM come servizi e applicazioni pubblicamente disponibili a tutti e a bassissimo costo ha cambiato le regole del gioco e quindi OWASP ha voluto fornire, tramite questo progetto e sempre in un ottica di awareness, il proprio punto di vista sulla sicurezza di queste tecnologie, affiancandosi in questo a numerose altre iniziative che a diversi livelli stanno cercando di promuovere un uso “sicuro” delle tecnologie di AI”,conclude Davide Ariu.
Tempi di analisi e monitoraggio degli LLM
È lecito chiedersi come mai la pubblicazione sia avvenuta proprio in questo momento dato che le tecnologie legate agli studi sugli algoritmi di AI sono da tempo ‘in cantiere’. Ma come spesso succede nella comunità scientifica non ci si improvvisa anzi, Davide Ariu spiega che “la pubblicazione della TOP 10 è stato possibile in tempi così celeri solo perché si è potuto far tesoro dei 20 anni di ricerca sul tema della sicurezza dell’AI e del Machine Learning che la comunità scientifica ha prodotto e che sono state poi il motore di una serie di valutazioni non solo di natura tecnologia ma anche ad esempio di natura etica e legale”.
Tuttavia, da allora (lasso temporale degli ultimi 20 anni n.d.r.) il panorama tecnologico è cambiato. L’avvento degli LLM ha cambiato diversi parametri dell’equazione dal punto di vista dell’applicabilità: gli LLM ampliano le possibilità di realizzazione e utilizzo in modi inimmaginabili anche solo cinque anni fa.
L’esperto spiega: “Questo cambiamento riguarda molteplici elementi. Volume di dati su cui vengono addestrati gli LLM, potenza computazionale di cui possono disporre, applicazioni in cui possono essere impiegati, e facilità di accesso per tutti. Quindi la TOP 10 è stata concepite in tempi relativamente brevi rispetto alla messa online di ChatGPT, risalente a novembre 2022, perché il progetto è stato approvato da OWASP a Maggio 2023 e ha prodotto il primo draft della Top 10 a luglio”.
Fare tesoro di quanto la comunità scientifica aveva già studiato è stato però un cruciale punto di partenza per OWASP che, come chiarisce Davide Ariu, “è stato espanso anche nella Top 10 LLM considerato lo sviluppo effettivo che I modelli hanno avuto”.
Tale punto di partenza è costituito dai risultati di OpenAI. L’esperto ricorda il paper che documenta il funzionamento di GPT 3 rilasciato a Maggio del 2020 che aveva già introdotto una sezione sui possibili abusi dei Language Models. I casi che venivano citati erano quelli della mis-informazione, produzione di campagne di spam o pishing, forme di abuso all’interno di processi legislativi o governativi.
Aggiornamenti e sviluppi della Top 10
Per il procedimento con cui è stata prodotta la top 10 e per la natura di monitoraggio continuo su questi temi da parte di OWASP ci saranno evoluzioni a tendere. Lo assicura Davide Ariu “In parallelo con l’evoluzione della tecnologia ed eventualmente anche della normativa relativa agli LLM il progetto evolverà” aggiungendo che “se dovessero cambiare o le tecnologie o ad esempio le modalità con cui queste vengono rese fruibili con un conseguente impatto sugli aspetti di security, il progetto cercherà ovviamente di tenerne conto”.
Non è però possibile anticipare tempistiche di aggiornamento, sulle quali il Presidente OWASP Italia non sa fare una previsione al momento, ma sottolinea alcuni aspetti: “Il primo è che questo progetto è un progetto molto recente, essendo nato nel 2023 in seguito all’esplosione degli LLM.
Nella sua categorizzazione, OWASP lo classifica infatti come ‘Lab project’ a differenza dei progetti maturi che magari esistono da molti anni e che sono classificati come ‘Production projects’ o addirittura ‘Flagship projects’ se hanno dimostrato una rilevanza strategica particolare (sono categorie di progetto proprie di OWASP n.d.r.).
Quindi, considerato che si tratta pur sempre di progetti mantenuti da una community che ci lavora su base volontaria, non abbiamo ancora un dato storico che ci permetta di dire quali potranno essere tempistiche ragionevoli di aggiornamento della Top 10 LLM”.
Ma è certo che il lavoro della fondazione OWASP non si ferma e resterà attiva nel monitorare fenomeni e tecnologie per garantire le prassi preventive di sicurezza informatica.