Gli strumenti OSINT che sfruttano la tecnologia dei modelli di linguaggio di grandi dimensioni (LLM) sono in continua evoluzione, grazie alle capacità avanzate degli LLM di comprendere, analizzare e generare testi su larga scala.
Questi strumenti aiutano gli analisti a raccogliere, elaborare e sintetizzare informazioni da fonti open source con maggiore efficienza.
Di seguito, una panoramica di alcuni strumenti e framework OSINT che integrano, o potrebbero beneficiare, della tecnologia LLM.
Indice degli argomenti
Hunchly, per investigazioni su social media e Web
Hunchly è uno strumento utilizzato per investigazioni OSINT su Internet, in particolare sui social media e i siti web.
Non è un LLM in sé, ma può essere potenziato con l’integrazione di LLM per:
- Estrarre informazioni rilevanti da articoli e post durante la navigazione.
- Sintetizzare e riassumere contenuti da fonti diverse per velocizzare l’analisi.
- Automatizzare la raccolta di dati in tempo reale, migliorando l’efficienza nelle indagini digitali.
Maltego, utile per tracciare relazioni tra entità
Maltego è uno dei principali strumenti di visualizzazione delle informazioni OSINT, particolarmente utile per tracciare relazioni tra entità (persone, aziende, domini, indirizzi IP).
L’integrazione con LLM può potenziare l’analisi tramite:
- Generazione automatizzata di report complessi e riassuntivi.
- Riconoscimento e connessione di dati testuali, con capacità di analisi linguistica avanzata.
- Elaborazione di grandi set di dati testuali per evidenziare pattern o informazioni nascoste.
Rekon-ng, framework per la raccolta di informazioni OSINT
Recon-ng è un framework modulare per la raccolta di informazioni OSINT. Nonostante la sua base si concentri sulla raccolta di dati strutturati (come indirizzi email, domini, ecc.), può essere migliorato con LLM in diversi modi:
- Analisi semantica avanzata per interpretare dati testuali raccolti.
- Generazione di insight da dati complessi o ambigui, come descrizioni di eventi o discussioni su forum.
Shodan, il motore di ricerca dei dispositivi connessi
Shodan è il “motore di ricerca per dispositivi connessi a Internet”, come telecamere, server e router.
Gli LLM possono aiutare Shodan in:
- Raccolta e interpretazione automatizzata di informazioni da descrizioni dei dispositivi.
- Analisi delle vulnerabilità basata sul linguaggio, identificando potenziali minacce descritte in documenti tecnici o blog di sicurezza.
The Harvester, per raccogliere indirizzi IP ed e-mail
The Harvester è uno strumento di raccolta di informazioni utilizzato per raccogliere indirizzi email, sottodomini, indirizzi IP e altro ancora.
Anche se orientato verso dati strutturati, con l’integrazione di LLM potrebbe:
- Analizzare il contesto attorno alle informazioni raccolte (es. post sui social media con quegli indirizzi email).
- Generare rapporti più dettagliati su come le informazioni estratte si inseriscono in un contesto più ampio.
LLM potenziati da Google e Microsoft
Strumenti generici come Google Gemini (che prima si chiamava Bard) o Microsoft Copilot basati su modelli di linguaggio di grandi dimensioni, se configurati correttamente, possono essere utilizzati per scopi OSINT.
Questi strumenti possono:
- Riassumere rapidamente ampie sezioni di testi, come articoli di notizie o documenti governativi.
- Rispondere a domande complesse basate su fonti open source, suggerendo collegamenti o informazioni non immediatamente evidenti.
- Monitorare eventi e trend attraverso un’analisi in tempo reale di contenuti online, utilizzando LLM per elaborare grandi flussi di dati.
ChatGPT o GPT-4 (OpenAI)
La tecnologia di ChatGPT può essere utilizzata come strumento OSINT per:
- Ricerca avanzata di informazioni su eventi, persone o aziende da fonti pubblicamente accessibili, sintetizzando informazioni da fonti multiple.
- Analisi e generazione di report dettagliati e strutturati basati su dati raccolti.
- Monitoraggio continuo delle discussioni sui social media o su forum, per tracciare l’evoluzione di conversazioni su argomenti di interesse.
Sentinel Hub, per l’analisi di immagini satellitari
Sentinel Hub è una piattaforma per l’analisi di immagini satellitari. Integrando LLM, potrebbe migliorare l’interpretazione di testi associati alle immagini satellitari:
- Analisi di rapporti o descrizioni correlate a dati geospaziali.
- Sintesi di dati testuali associati a cambiamenti sul terreno osservati nelle immagini satellitari.
Apollo.io, alla ricerca di informazioni sui contatti aziendali
Apollo.io è uno strumento utilizzato per la raccolta di informazioni sui contatti aziendali. Con l’integrazione di LLM:
- Potrebbe elaborare e generare informazioni contestuali aggiuntive, utilizzando fonti open source per arricchire i profili aziendali.
- Può fornire suggerimenti automatizzati basati sulle tendenze emergenti nell’ambito di mercato.
Logalyze, per l’analisi di log e dati di sicurezza
Logalyze è una soluzione per l’analisi di log e dati di sicurezza. Gli LLM possono assistere nell’OSINT potenziando la capacità di Logalyze di:
- Analizzare log complessi in grandi dataset e identificare minacce o comportamenti sospetti.
- Sintetizzare avvisi di sicurezza e presentarli in un formato comprensibile, generando anche raccomandazioni basate su eventi storici o attuali.
Spiderfoot: raccolta dati da fonti online
Spiderfoot è una piattaforma OSINT che automatizza la raccolta di dati da un’ampia gamma di fonti online, inclusi social media e dark web.
L’integrazione con LLM può consentire:
- Identificazione di pattern nascosti o analisi semantica avanzata nei dati raccolti.
- Riassunti automatizzati e raccomandazioni basati su informazioni raccolte da più fonti.
Alcune considerazioni sull’uso di strumenti OSINT con LLM
Nonostante i vantaggi, ci sono alcune considerazioni importanti quando si utilizzano LLM per l’OSINT:
- Bias nei dati: gli LLM possono riflettere i pregiudizi nei dati di addestramento. È fondamentale interpretare i risultati con cautela.
- Privacy e sicurezza: l’uso di LLM per raccogliere informazioni deve rispettare le normative sulla privacy, come il GDPR, e assicurarsi che le informazioni sensibili non vengano sfruttate in modo inappropriato.
- Qualità delle fonti: gli LLM possono elaborare dati da fonti open source, ma è essenziale verificare sempre l’affidabilità e l’accuratezza delle informazioni raccolte.
Conclusioni
L’integrazione della tecnologia LLM nell’OSINT ha rivoluzionato il modo in cui le informazioni vengono raccolte e analizzate.
Strumenti come Maltego, Shodan, e altri strumenti di analisi delle informazioni possono essere significativamente potenziati con l’uso di modelli di linguaggio, migliorando la capacità degli investigatori di identificare connessioni nascoste, sintetizzare grandi quantità di dati e fornire analisi dettagliate in tempi ridotti.
Tuttavia, l’utilizzo di queste tecnologie richiede una comprensione profonda dei limiti e delle implicazioni etiche che ne derivano.