I dati di test sono essenziali nello sviluppo di soluzioni tecnologiche, in quanto consentono agli sviluppatori ed ingegneri di creare tali soluzioni, tramite in scenari rappresentativi, simili alla produzione. Utilizzando i dati di test, gli sviluppatori possono simulare situazioni del mondo reale e scoprire potenziali difetti, vulnerabilità o limitazioni nelle loro soluzioni.
Questi dati aiutano a identificare bug, mettere a punto algoritmi e ottimizzarne le prestazioni, assicurando che il prodotto finale soddisfi o superi le aspettative degli utenti e sia pronto per andare in “produzione”.
Indice degli argomenti
Mitigare i rischi connessi all’uso dei dati
In particolare, quando si lavora su procedure in esercizio oppure quando gli interventi hanno un impatto sui dati di produzione, sono necessarie misure o qualsiasi altra precauzione per mitigare i rischi connessi all’uso dei dati.
Alcune di queste misure intendono ridurre i rischi alle fasi di lavorazione, poiché attraverso la formalizzazione degli incarichi assegnati, richiedendo specifiche clausole di riservatezza per i dipendenti e/o soggetti coinvolti nelle operazioni.
La sicurezza dei dati personali sensibili e confidenziali utilizzati per il trattamento informatico è rimessa, in tal caso, alla deontologia del dipendente e/o dei collaboratori incaricati del trattamento dei dati.
Tali misure, peraltro necessarie, devono però prevedere anche l’utilizzo di strumenti adeguati e che consentano di operare sui dati sensibili, in modo di risolvere proattivamente alcune delle criticità legate alla privacy e alla riservatezza.
Impatto del GDPR sui dati di produzione
In base al Regolamento generale sulla protezione dei dati (GDPR), infatti, il Titolare deve garantire che i dati personali dei tuoi dipendenti, così come dei clienti, rimangano sempre completamente al sicuro in ogni fase del trattamento.
Quando i dati di produzione vengono duplicati, per le operazioni di testing e, dunque, per il miglioramento dei processi interni e l’efficienza dei sistemi e così via, in altri ambienti di non produzione, le organizzazioni devono essere in grado di garantire che questi dati siano sicuri e conformi al GDPR.
L’utilizzo dei dati di produzione originali sembra ovvio, poiché riflette bene lo scenario del mondo reale. Tuttavia, l’utilizzo dei dati personali della produzione come dati di test resta una pratica difficile da conciliare con le normative sulla protezione dei dati personali.
In primo luogo, è necessario individuare una base giuridica su cui fondare il trattamento dei dati. Le persone da cui tratti i dati personali non si aspettano che i loro dati forniti per la fornitura di un determinato servizio o l’erogazione del contratto, vengano utilizzati, anche a scopo di test.
Ciò è considerato incompatibile con le finalità iniziali (“limitazione delle finalità”).
Significa, tra l’altro, che è necessario disporre di una base giuridica separata ed è, in tal senso, che le informative richiamino il legittimo interesse dell’art. 6.1.a “il trattamento è necessario ai fini degli interessi legittimi perseguiti dal titolare del trattamento o da un terzo, a meno che su tali interessi non prevalgano gli interessi o i diritti e le libertà fondamentali dell’interessato che richiedono la protezione dei dati personali”.
In virtù del principio di minimizzazione dei dati del GDPR (che suggerisce di ridurre al minimo l’uso dei dati personali) è difficile poi conciliare l’utilizzo dei dati personali dalla produzione come dati di test.
Infine, il titolare del trattamento deve considerare che alternative e soluzioni valide sono attualmente disponibili sul mercato.
Il titolare e il responsabile ai fini di adempiere all’art. 32 del GDPR sono tenuti, infatti, a stabilire le misure a tecniche e organizzative adeguate a garantire un livello di sicurezza dei dati, avendo preliminarmente considerato lo stato dell’arte e dei costi di attuazione, nonché della natura, dell’oggetto, del contesto e delle finalità del trattamento, come anche del rischio di varia probabilità e gravità per i diritti e le libertà delle persone fisiche.
Le soluzioni per ottenere dati di test adeguati
Per quanto detto, i dati personali della produzione non possono essere utilizzati come dati di test, ponendo difficoltà per molte organizzazioni nell’ottenere i dati di test adeguati allo svolgimento delle operazioni. Vogliamo introdurre attraverso una panoramica generale il tema delle nuove soluzioni disponibili, considerandone i vantaggi rispetto alle classiche tecniche di anonimizzazione e soluzioni “legacy by design”.
Nell’ambito dell’esecuzione dei test, infatti, i dati potrebbero essere protetti mediante l’applicazione di “tecniche classiche di anonimizzazione” (modifica, mascheramento, binning ecc.) frequentemente utilizzate dalle organizzazioni.
Tali tecniche sono obsolete e spesso introducono “legacy by design”. Laddove per “legacy by design” s’intende una soluzione software che introduce intenzionalmente un debito tecnico nella fase di progettazione e costruzione dello sviluppo del software, utilizzando pertanto tecniche di anonimizzazione classiche obsolete per scopi di dati di test.
I dati, in tal caso, non riflettono quelli della produzione, non vi è coerenza tra set di dati o database.
L’anonimizzazione con le classiche tecniche di anonimizzazione richiede, inoltre, molto tempo, soprattutto per ambienti di test di grandi dimensioni. Poiché i dati e le strutture cambiano frequentemente nel tempo, è necessario, ripetere di volta in volta lo stesso lento e dispendioso processo.
Si deve, perciò, considerare che si tratta di un lavoro manuale e che presuppone la conoscenza del dominio. Sono necessarie, infatti, molte configurazioni manuali, ad esempio per stabilire “modelli”. Inoltre, spesso le configurazioni manuali e l’interfaccia utente complicata richiedono conoscenze e risorse esterne (di consulenza).
I dati sintetici come alternativa
Gli ultimi sviluppi nel campo dell’intelligenza artificiale (AI) consentono alle organizzazioni di creare un gemello di dati sintetici basato sui dati di produzione.
Il modello AI viene addestrato sui dati originali per apprendere tutte le caratteristiche, le relazioni e i modelli statistici.
Successivamente, questo algoritmo AI è in grado di generare punti dati completamente nuovi e modellare quei nuovi punti dati in modo tale da riprodurre le caratteristiche, le relazioni e i modelli statistici del set di dati originale.
Questo è ciò che chiamiamo gemello di dati sintetici; dati completamente nuovi e generati artificialmente che possono essere utilizzati come se fossero dati reali in una soluzione facile e veloce.
Copyright Syntho.
Le organizzazioni che utilizzano i dati sintetici generati dall’intelligenza artificiale come dati di test traggono vantaggio da dati simili alla produzione, una soluzione di privacy by design che funziona in modo facile, veloce e agile.
Il risultato è la disponibilità di dati di test sintetici simili alla produzione generati sulla base dei dati di produzione dalla potenza dell’intelligenza artificiale con una logica aziendale preservata ed integrità referenziale per coerenza su set di dati e database (ad esempio per test di integrazione end-to-end).
Utilizzando dati sintetici, si è in grado di disporre di dati simili alla produzione completamente nuovi e generati artificialmente. Quindi, questo consente dati di test ottimali senza l’uso di dati reali (personali) dalla produzione.
Questa soluzione consente di mitigare il lavoro manuale con un approccio completamente autonomo e integrato, in cui si utilizza il potere dell’intelligenza artificiale.
Ciò si traduce in una situazione in cui è possibile generare e aggiornare facilmente l’intero ambiente di test; in una situazione in cui le organizzazioni possono fornire e rilasciare soluzioni software all’avanguardia più velocemente e con una qualità superiore.
Le organizzazioni possono rilasciare più rapidamente e abbreviare il time-to-market, individuare i bug più rapidamente e in anticipo nel ciclo di test, eseguire distribuzioni corrette al primo tentativo, migliorare la qualità complessiva di test, sviluppo e consegna, utilizzare le risorse di test e sviluppo in modo più intelligente con conseguente maggiore (vedi indici NPS).
Conclusioni
La sfida odierna per le organizzazioni è quella di abbandonare l’uso dei dati personali dalla produzione come dati di test, richiedendo a tester e sviluppatori, abituati a pratiche e comportamenti, non più praticabili, in virtù delle questioni fin qui dibattute.
Le organizzazioni che mirano ad abbandonare l’utilizzo dei dati personali dalla produzione per conformarsi alle normative sulla privacy devono realizzare questo “cambiamento di mentalità” nel reparto IT.
Queste organizzazioni dovranno affrontare resistenze, attriti, esitazioni, dubbi e scetticismo da parte del reparto IT e dovranno trovare un modo per farle avanzare.
Allo scopo di superare queste sfide e facilitare il necessario cambiamento di mentalità, le organizzazioni possono avvalersi l’esperienza di competenze, specializzazioni ed esperienze di alcuni specialisti sul mercato, in grado di guidare tali cambiamenti attraverso e fornire best practice e strategie opportune all’interno dell’organizzazione.