Con un nuovo modello che eguaglia le prestazioni di ChatGPT o1, a poco più di due anni dal debutto di quest’ultima, la startup cinese DeepSeek è riuscita a trasformare le restrizioni americani (divieti di esportazione dei chip di Nvidia eccetera) in innovazione, entrando a gamba tesa nella corsa all’intelligenza artificiale generativa dove gli Usa detenevano il dominio assoluto.
Con lati oscuri e poco chiari, però, che è necessario evidenziare. A partire dal possibile impatto cyber, geopolitico e sulla sicurezza nazionale, come sulla privacy – da cui una richiesta di info dal nostro Garante Privacy alla startup il 28 gennaio.
Indice degli argomenti
DeepSeek: la startup cinese che sfida ChatGpt come nel problema dei tre corpi
La comunità dell’intelligenza artificiale è in fermento per il modello open source DeepSeek R1. DeepSeek sostiene che R1 eguaglia o addirittura supera ChatGPT o1 di OpenAI su diversi benchmark chiave, ma a un costo inferiore.
R1 è una versione reasoning del modello V3 lanciato dalla stessa azienda a dicembre.
Entrambi i modelli sono disponibili sul sito e sulle app della società.
E funzionano bene, tanto che il presidente USA Donald Trump ha affermato che è “un campanello d’allarme per noi”. Per gli Usa e l’Occidente è una minaccia se la Cina riesce a fare passi avanti nell’AI nonostante i dazi.
Da un altro punto di vista “questo potrebbe essere un passo avanti davvero equo, ottimo per i ricercatori e gli sviluppatori con risorse limitate, soprattutto quelli del Sud globale”, afferma Hancheng Cao, assistente alla cattedra di sistemi informativi presso la Emory University.
Il successo di DeepSeek è ancora più notevole se si considerano i vincoli che le aziende cinesi di intelligenza artificiale devono affrontare a causa dei crescenti controlli sulle esportazioni di chip all’avanguardia da parte degli Stati Uniti.
Ma le prime prove dimostrano che queste misure non stanno funzionando come previsto.
Invece di indebolire le capacità di IA della Cina, le sanzioni sembrano spingere startup come DeepSeek a innovare in modi che privilegiano l’efficienza, la condivisione delle risorse e la collaborazione.
Un aspetto oscuro, dubbio, è anche se in effetti siano veritiere le informazioni sul paper di Deepseek; alcuni esperti dubitano che si siano usate Gpu economiche e i costi, anche tenuto conto di quelli energetici, siano così bassi.
In ogni caso sembra probabile che ci sia stata una svolta nel modello di costi e di efficienza per l’AI, con impatti geopolitici tutti da vedere.
Sulla piattaforma X Alessandro Aresu, autore del libro “Geopolitica dell’intelligenza artificiale”, ricorda “la Lunga Marcia di Huawei, citata in modo esplicito da HiSilicon, e anche nelle nuove soluzioni e integrazioni dell’azienda. La Lunga Marcia di BYD. Quella di ByteDance. La Lunga Marcia di DeepSeek”, per spiegare cosa non funziona in questo modello in cui la sorpresa cinesa sembra ispirarsi alla saga del “problema dei tre corpi”.
“Gli USA (gli alieni, nella metafora del libro, ndr) hanno individuato l’avversario e deciso di bloccare il suo sviluppo, in modo progressivamente sempre più netto, prima con controlli di investimenti, poi con controlli di esportazioni e altri strumenti di capitalismo politico”, posta Aresu su X.
Deepseek: problemi privacy e cyber. Interviene il Garante Privacy
Tanti i problemi privacy sollevati da Deepseek, con rischi anche di sicurezza.
DeepSeek invia esplicitamente i dati degli utenti, inclusi messaggi di chat e altre informazioni personali, a server situati in Cina. La loro politica sulla privacy prevede una raccolta estesa di dati, comprendendo informazioni sul dispositivo e interazioni dell’utenti.
Ecco perché il Garante per la protezione dei dati personali in Italia il 28 gennaio ha inviato una richiesta di informazioni a DeepSeek, un servizio di chatbot fornito da Hangzhou DeepSeek Artificial Intelligence e Beijing DeepSeek Artificial Intelligence.
Il giorno dopo questa richiesta, l’app è sparita dagli store Google e Apple.
Il 30 il Garante ha anche vietato a Deepseek l’uso dei dati degli italiani.
Le richieste del Garante
Il Garante ha richiesto chiarimenti su diversi aspetti:
- Tipologia di dati raccolti: Quali dati personali vengono raccolti e da quali fonti.
- Finalità del trattamento: Per quali scopi vengono utilizzati questi dati.
- Base giuridica: Qual è la base legale per il trattamento dei dati.
- Ubicazione dei server: Se i dati sono conservati su server situati in Cina.
Inoltre, è stata posta attenzione su come DeepSeek utilizza i dati per addestrare i suoi modelli di intelligenza artificiale. In particolare, il Garante ha chiesto chiarimenti riguardo all’eventuale uso di tecniche di web scraping per raccogliere informazioni e come gli utenti, sia iscritti che non iscritti, siano stati informati riguardo al trattamento dei loro dati.
Le società coinvolte hanno un termine di 20 giorni per fornire le informazioni richieste al Garante, il quale non ha al momento disposto la sospensione del servizio.
Il blocco dei dati degli italiani
Le risposte ricevute dalle società sono state considerate insufficienti e inadeguate per fornire rassicurazioni sulla protezione dei dati. In particolare, DeepSeek ha dichiarato di non operare in Italia e di non ritenersi soggetta alla normativa europea, contraddicendo le prove raccolte dal Garante e aumentando i sospetti sulla trasparenza delle loro operazioni.
A causa di questa mancanza di collaborazione e del rischio concreto per la privacy degli utenti italiani, il Garante ha preso una misura d’urgenza: la limitazione immediata del trattamento dei dati da parte di DeepSeek sul territorio nazionale. Ciò impedisce alle società di raccogliere, elaborare o conservare i dati degli utenti italiani fino a quando non saranno risolti i problemi evidenziati.
Parallelamente, il Garante continuerà a condurre un’indagine approfondita sulla conformità di DeepSeek alle normative europee sulla protezione dei dati, valutando anche l’impatto sui diritti dei cittadini di quanto raccolto indebitamente dalla piattaforma.
Il caso DeepSeek mette in luce le differenze tra il Regolamento Generale sulla Protezione dei Dati (GDPR) europeo e la Personal Information Protection Law (PIPL) cinese. Il GDPR offre una protezione rigorosa dei diritti dei cittadini attraverso trasparenza, controllo e sicurezza nel trattamento dei dati personali, mentre il PIPL, pur essendo un passo avanti nella legislazione cinese, rimane subordinato agli interessi dello Stato e alla sicurezza nazionale.
Condivisione e utilizzo dei dati
In effetti, DeepSeek, a quanto si legge nella sua privacy policy, potrebbe condividere dati degli utenti con:
Terze parti: partner commerciali per scopi pubblicitari o analisi.
Enti governativi cinesi: Le leggi locali possono obbligare l’azienda a fornire accesso ai dati su richiesta.
Non è chiaro se gli utenti possano rifiutare l’uso dei propri dati per scopi secondari, e l’assenza di trasparenza su questo punto è un problema.
Conformità normativa
Non è evidente se DeepSeek sia conforme al GDPR (Regolamento Generale sulla Protezione dei Dati) applicato nell’Unione Europea, che garantisce diritti come l’accesso ai dati, la possibilità di rettifica e la richiesta di cancellazione.
Problemi di censura e manipolazione
DeepSeek potrebbe censurare contenuti sensibili o adattarli secondo linee guida governative, limitando la libertà di espressione. E’ già noto che non risponde a domande scomode per le politiche di Pechino.
Contenuti dannosi
Un report Kela Cyber di oggi esplora le vulnerabilità di DeepSeek R1, un modello di intelligenza artificiale sviluppato in Cina.
Le falle di sicurezza, tra cui la possibilità di sbloccare facilmente il modello tramite tecniche come l'”Evil Jailbreak”, permettono agli aggressori di generare codice dannoso come ransomware e malware.
Il modello è vulnerabile anche per la sua trasparenza nel mostrare i passaggi di ragionamento, facilitando l’abuso da parte di attori malintenzionati.
Usare in locale
Il consiglio è di usarlo in locale, sul proprio pc, se si ha abbastanza gpu. Ed è forse questo il vero principale vantaggio di Deepseek.
Fuga di dati
Wiz, una società di cybersecurity con sede a New York, ha scoperto una grave falla di sicurezza nei servizi AI di DeepSeek. L’azienda cinese, che sviluppa modelli di intelligenza artificiale e ne offre l’accesso tramite cloud, aveva lasciato il proprio database ClickHouse completamente esposto su internet senza alcuna autenticazione.
Questo database, accessibile agli indirizzi oauth2callback.deepseek.com:9000 e dev.deepseek.com:9000, conteneva una grande quantità di dati sensibili, tra cui cronologie delle chat, chiavi API, informazioni di backend e metadati operativi. I ricercatori di Wiz hanno dimostrato che era possibile eseguire query SQL attraverso l’interfaccia HTTP di ClickHouse, potenzialmente permettendo a malintenzionati di estrarre log in chiaro delle chat, chiavi API e altre informazioni critiche.
Sebbene Wiz non abbia tentato un exploit completo, ha avvertito che, a seconda della configurazione del database, un attaccante avrebbe potuto recuperare password, file locali e dati proprietari. DeepSeek ha risolto il problema dopo essere stata avvisata, ma non ha rilasciato dichiarazioni ufficiali.
L’episodio solleva preoccupazioni sulla sicurezza dell’AI, con Wiz che avverte dei rischi legati all’adozione rapida di queste tecnologie senza adeguate misure di protezione.
Nel romanzo gli alieni (gli americani, ndr) hanno l’umanità (la Cina, ndr) in pugno: una monarchia tecnologica soverchiante dove gli alieni gridano “non avrete mai le nostre capacità, siete insetti!”, e i cinesi rispondono orgogliosamente “sì, siamo insetti, siamo moltissimi, istruiti, organizzati, resisteremo e vinceremo”.
Aresu conclude i suoi post su X: “E l’umanità-Cina vuole proprio sorprendere gli alieni-americani, in una guerra ibrida di annunci, inganni e risultati reali, resistendo e rilanciando sempre, fino a frustrare chi si crede razionale. Così chi era in trappola intrappola l’avversario”.
La creazione di DeepSeek R1
Per realizzare R1, DeepSeek ha dovuto rielaborare il suo processo di addestramento per ridurre lo sforzo sulle sue GPU, una varietà rilasciata da Nvidia per il mercato cinese che ha prestazioni limitate alla metà della velocità dei suoi prodotti di punta, secondo Zihan Wang, ex dipendente di DeepSeek e attuale dottorando in informatica alla Northwestern University.
DeepSeek R1 ha ricevuto l’apprezzamento dei ricercatori per la sua capacità di affrontare compiti di ragionamento complessi, in particolare in matematica e codifica. Secondo Lorenzo Guasti, tecnologo di Indire, che ha testato l’app di Gen AI cinese, “in ambito Stem (matematica, fisica eccetera) è molto potente, forse più di ChatGpt, a un primo esame, anche se si osservano i bias dovuti all’addestramento su testi cinesi (anche censurati, ndr)”.
Il modello impiega un approccio “a catena di pensiero” simile a quello utilizzato da ChatGPT o1, che gli consente di risolvere i problemi elaborando le richieste passo dopo passo.
Dimitris Papailiopoulos, ricercatore principale del laboratorio di ricerca AI Frontiers di Microsoft, afferma che ciò che lo ha sorpreso di più di R1 è la sua semplicità ingegneristica. “DeepSeek ha puntato a ottenere risposte precise piuttosto che a descrivere nel dettaglio ogni passaggio logico, riducendo in modo significativo il tempo di calcolo e mantenendo al contempo un alto livello di efficacia”, ha spiegato a Mit Technology Review.
La versione per dispositivi mobili
Inoltre, DeepSeek ha rilasciato sei versioni più piccole di R1, abbastanza miniaturizzate da permettere un’esecuzione locale sui computer portatili.
Una di queste sostiene di aver addirittura superato o1-mini di OpenAI in alcuni benchmark.
“DeepSeek ha replicato in larga misura o1-mini e lo ha reso open source”, ha twittato Aravind Srinivas, CEO di Perplexity. La startup non ha risposto alla richiesta di commenti di MIT Technology Review.
DeepSeek, la startup sconosciuta
Nonostante il fermento intorno a R1, DeepSeek rimane relativamente una startup sconosciuta. Con sede a Hangzhou, in Cina, è stata fondata nel luglio 2023 da Liang Wenfeng, ex studente della Zhejiang University dove ha studiato ingegneria informatica ed elettronica.
È stata incubata da High-Flyer, un hedge fund fondato da Liang nel 2015. Come Sam Altman di OpenAI, Liang punta a costruire un’intelligenza artificiale generale (AGI), una forma di IA in grado di eguagliare o addirittura battere gli esseri umani in una serie di compiti.
Fonti cinesi mi dicono che, a differenza di OpenAI che prima o poi potrebbe quotarsi in Borsa, “l’hedge fund cinese non ha alcuna Ipo all’orizzonte: DeepSeek potrebbe non essere mai quotata”.
Gli LLM di DeepSeek e le scorte di chip Nvidia
L’addestramento di modelli linguistici di grandi dimensioni (LLM) richiede un team di ricercatori altamente qualificati e una notevole potenza di calcolo.
In una recente intervista rilasciata al media cinese LatePost, Kai-Fu Lee, imprenditore veterano ed ex direttore di Google China, ha dichiarato che solo “i giocatori di prima fila” erano soliti impegnarsi nella costruzione di modelli di base come ChatGPT, poiché si tratta di un’attività che richiede molte risorse.
A complicare ulteriormente la situazione sono sopraggiunti i controlli statunitensi sulle esportazioni di semiconduttori avanzati. La decisione di High-Flyer di avventurarsi nell’IA, tuttavia, si lega direttamente a questi vincoli.
In anticipo sull’erogazione delle sanzioni, Liang ha acquistato una notevole scorta di chip Nvidia A100, un tipo di chip ora vietato all’esportazione in Cina. La testata cinese 36Kr stima che l’azienda abbia più di 10.000 unità di questi chip in magazzino. Ma Dylan Patel, fondatore della società di ricerca sull’intelligenza artificiale SemiAnalysis, ritiene che ne abbia almeno 50.000.
Il potenziale riconoscimento di queste scorte per l’addestramento dell’intelligenza artificiale ha spinto Liang a fondare DeepSeek, che è stata in grado di utilizzarle in combinazione con chip a bassa potenza per sviluppare i suoi modelli.
Rischi geopolitici di DeepSeek
Deepseek pone anche impatti di tipo geopolitico e sugli scambi economici internazionali.
Competizione tecnologica
Il rapido avanzamento di DeepSeek nel campo dell’IA ha messo in discussione la supremazia tecnologica degli Stati Uniti, sollevando timori riguardo a un possibile spostamento dell’equilibrio di potere tecnologico verso la Cina.
Competizione militare
La supremazia tech sull’AI ha un impatto anche sul potere militare dei blocchi in conflitto.
Implicazioni economiche
Il successo di DeepSeek ha provocato una significativa svalutazione delle azioni di importanti aziende tecnologiche statunitensi, come Nvidia, evidenziando la vulnerabilità dei mercati finanziari alle innovazioni tecnologiche globali. E quindi è potenzialmente destabilizzante per l’economia nazionale. Una dinamica che può portare a ulteriori dazi Usa verso la Cina, in un effetto a catena che incide sull’economia globale.
Sicurezza nazionale
Se DeepSeek consente profilazione e diffusione di disinformazione, propaganda, si aprono pericoli per la sicurezza nazionale, analoghi a quelli di TikTok.
Standard globali sull’IA
Con l’emergere di modelli IA cinesi competitivi, esiste la possibilità che la Cina influenzi gli standard globali sull’IA, con implicazioni sulle normative, l’etica e le pratiche operative a livello internazionale.
Come DeepSeek ha trasformato le sanzioni e le difficoltà hardware in un’opportunità
Giganti tecnologici come Alibaba e ByteDance, oltre a una manciata di startup con investitori molto facoltosi, dominano lo spazio cinese dell’intelligenza artificiale. Finora hanno reso difficile la competizione per le piccole e medie imprese. Una società come DeepSeek, che non ha intenzione di raccogliere fondi, è una rarità.
Zihan Wang, un ex dipendente di DeepSeek, ha detto al MIT Technology Review di aver avuto accesso ad abbondanti risorse di calcolo e alla libertà di sperimentare quando lavorava in DeepSeek, “un lusso che pochi neolaureati avrebbero avuto in qualsiasi azienda”.
In un’intervista alla testata cinese 36Kr nel luglio 2024, Liang ha dichiarato che un’ulteriore sfida che le aziende cinesi devono affrontare, oltre alle sanzioni sui chip, è che le loro tecniche di progettazione dell’intelligenza artificiale tendono a essere meno efficienti.
“Noi (la maggior parte delle aziende cinesi, ndr) dobbiamo consumare il doppio della potenza di calcolo per ottenere gli stessi risultati. Se a ciò si aggiungono le lacune nell’efficienza dei dati, ciò potrebbe significare che abbiamo bisogno di una potenza di calcolo fino a quattro volte superiore. Il nostro obiettivo è quello di colmare continuamente queste lacune”, ha affermato.
Tuttavia la startup cinese ha trovato il modo di ridurre l’utilizzo della memoria e accelerare i calcoli senza sacrificare in modo significativo la precisione. “Il team ama trasformare una sfida hardware in un’opportunità di innovazione”, afferma Wang.
Open source ed efficienza, il binomio vincente
Liang stesso rimane profondamente coinvolto nel processo di ricerca di DeepSeek, conducendo esperimenti insieme al suo team. “L’intero team condivide una cultura collaborativa e la dedizione alla ricerca”, afferma Wang.
Oltre a dare priorità all’efficienza, le aziende cinesi stanno abbracciando sempre più i principi dell’open source.
Alibaba Cloud ha rilasciato più di 100 nuovi modelli di intelligenza artificiale open source, che supportano 29 lingue e si rivolgono a varie applicazioni, tra cui la codifica e la matematica. Allo stesso modo, startup come Minimax e 01.AI hanno reso disponibili i loro modelli.
Open source ed efficienza, il binomio vincente
Liang stesso rimane profondamente coinvolto nel processo di ricerca di DeepSeek, conducendo esperimenti insieme al suo team. “L’intero team condivide una cultura collaborativa e la dedizione alla ricerca”, afferma Wang.
Oltre a dare priorità all’efficienza, le aziende cinesi stanno abbracciando sempre più i principi dell’open source.
Alibaba Cloud ha rilasciato più di 100 nuovi modelli di intelligenza artificiale open source, che supportano 29 lingue e si rivolgono a varie applicazioni, tra cui la codifica e la matematica. Allo stesso modo, startup come Minimax e 01.AI hanno reso disponibili i loro modelli.
L’accusa di furto di proprietà intellettuale da OpenAI
OpenAI ha recentemente accusato DeepSeek, una startup cinese, di furto di proprietà intellettuale, sostenendo che DeepSeek abbia utilizzato i modelli proprietari di OpenAI per addestrare la propria intelligenza artificiale. Questa accusa è emersa dopo che OpenAI ha trovato prove di una tecnica chiamata “distillazione”, che consente di creare modelli più piccoli e meno costosi estraendo informazioni da modelli più grandi e complessi.
Dettagli dell’accusa
OpenAI ha affermato che DeepSeek ha usato una tecnica di distillazione per sviluppare un modello open-source simile a GPT-4, violando i termini di servizio di OpenAI, che proibiscono la copia dei servizi e l’uso dell’output per creare modelli concorrenti.
OpenAI e Microsoft stanno indagando su possibili violazioni delle loro API da parte di DeepSeek, con flussi sospetti di dati provenienti da account legati alla startup cinese.
Questa situazione ha suscitato un ampio dibattito sull’etica e la legalità delle tecniche di addestramento AI, evidenziando le tensioni tra le aziende tecnologiche americane e quelle cinesi nel campo dell’intelligenza artificiale.
Gli LLM nel mondo: il 36% parla cinese
Secondo un libro bianco pubblicato l’anno scorso dalla China Academy of Information and Communications Technology, un istituto di ricerca statale, il numero di modelli linguistici di grandi dimensioni di IA in tutto il mondo ha raggiunto quota 1.328. II 36% di questi proviene dalla Cina.
Pechino si colloca così al secondo posto tra i maggiori contributori all’IA, dopo gli Stati Uniti.
“Questa generazione di giovani ricercatori cinesi si identifica fortemente con la cultura dell’open source perché ne trae molti vantaggi”, afferma Thomas Qitong Cao, professore assistente di politica tecnologica alla Tufts University.
“Il controllo delle esportazioni da parte degli Stati Uniti ha sostanzialmente messo le aziende cinesi in un angolo, costringendole a essere molto più efficienti con le loro limitate risorse di calcolo”, afferma Matt Sheehan, ricercatore di IA presso il Carnegie Endowment for International Peace. “Probabilmente in futuro assisteremo a un forte consolidamento legato alla mancanza di calcolo”.
Questo potrebbe già essere agli albori. Due settimane fa, Alibaba Cloud ha annunciato di aver stretto una partnership con la startup 01.AI, fondata da Kai-Fu Lee e con sede a Pechino, per unire i team di ricerca e creare un “laboratorio industriale di grandi modelli”.
“È efficiente dal punto di vista energetico e naturale che emerga una sorta di divisione del lavoro nel settore dell’IA”, afferma Cao, professore della Tufts. “La rapida evoluzione dell’IA richiede agilità alle aziende cinesi per sopravvivere”.
Il dado è tratto. La sfida cinese agli Usa è iniziata. Una sfida che riguarda anche il rischio disinformazione. Infatti i testi (con la censura cinese) sono serviti al training degli LLM di deepSeek.
Ora chi rimane fuori è l’Europa, più impegnata a regolamentare che ad innovare. Ma la formazione a basso costo cambierà l’industria e gli Llm cinesi, più economici da realizzare e il cui addestramento ha sfruttato 2.000 chip di seconda classe (contro i 16.000 chip di prima scelta del modello di Meta), dimostrano che non contano solo gli investimenti (ingenti) ma soprattutto la volontà di innovare e di essere competitivi.
Pubblicato il 27 gennaio, aggiornato nei giorni successivi