I governi comprano i tuoi dati senza mandato: ecco come

Una parte consistente della sorveglianza moderna nasce nel mercato pubblicitario digitale. Applicazioni mobili, browser e piattaforme online generano continuamente dati comportamentali che alimentano un’industria parallela, quella dei broker di dati. In quest’ambito si inserisce una pratica sempre più discussa negli USA: l’acquisto da parte delle agenzie federali di informazioni personali aggregate, spesso senza mandato.

Il fenomeno affonda le radici nella trasformazione digitale degli ultimi due decenni. La diffusione degli smartphone e della pubblicità programmatica ha reso disponibile una quantità senza precedenti di dati di geolocalizzazione, cronologie di navigazione e identificatori pubblicitari. Parallelamente, il quadro normativo statunitense, costruito in gran parte negli anni ’80 con l’Electronic Communications Privacy Act, non ha previsto l’emergere di intermediari commerciali (i data broker, appunto) capaci di aggregare e rivendere tali informazioni.

La lacuna normativa ha aperto uno spazio che oggi coinvolge agenzie come FBI, Dipartimento della Difesa e Immigration and Customs Enforcement (ICE).

Il ruolo dei data broker nella raccolta massiva di informazioni

I data broker operano come intermediari tra chi produce dati – app, siti web, SDK pubblicitari – e chi li utilizza per finalità analitiche o commerciali.

Raccolgono dataset su larga scala attraverso tecniche di tracciamento basate su ID pubblicitari, cookie e segnali di rete. Questi dati includono coordinate GPS, pattern di movimento, interessi dedotti e relazioni tra dispositivi.

Una caratteristica rilevante riguarda l’anonimizzazione. I dataset sono spesso venduti senza nomi espliciti, ma mantengono identificatori persistenti che consentono la re-identificazione.

Analizzando i luoghi frequentati di notte e durante il giorno, strumenti analitici possono derivare indicazioni strettamente personali come domicilio e luogo di lavoro, ricostruendo l’identità reale con elevata probabilità. Secondo gli esperti della Electronic Frontier Foundation (EFF), questa correlazione risulta tecnicamente semplice quando si incrociano più fonti di dati.

Acquisto governativo e aggiramento del mandato

Il nodo giuridico centrale riguarda la possibilità per le autorità di acquistare dati dai data broker che, se richiesti direttamente agli operatori di telecomunicazioni, richiederebbero un mandato.

Una storica sentenza d’Oltreoceano (Carpenter v. United States) del 2018 ha stabilito l’obbligo di autorizzazione giudiziaria per ottenere dati storici di localizzazione cellulare, ma non ha affrontato esplicitamente il caso dei dati disponibili sul mercato.

Le agenzie federali sfruttano questa zona grigia acquistando informazioni dai fornitori commerciali. In sede parlamentare, rappresentanti dell’FBI hanno confermato l’uso di “informazioni commercialmente disponibili” come strumento investigativo. La differenza non è tecnica ma procedurale: invece di richiedere dati a un operatore, l’agenzia li compra da un intermediario che li ha già aggregati.

Questa dinamica ha effetti pratici rilevanti. ICE, ad esempio, ha utilizzato sistemi basati su dati di localizzazione per monitorare spostamenti e identificare dispositivi presenti in specifiche aree geografiche, integrando queste informazioni con riconoscimento facciale e database di targhe automobilistiche.

Strumenti operativi: tracciamento e correlazione dei dispositivi

Le piattaforme acquistate dalle agenzie includono soluzioni come Penlink Webloc, che consente di individuare dispositivi presenti in un luogo e seguirne i movimenti nel tempo. Il funzionamento si basa sull’analisi di dataset pubblicitari che registrano eventi di localizzazione associati a identificatori univoci.

Dal punto di vista tecnico, il processo si articola in tre passaggi fondamentali: prima si acquisiscono i dati grezzi (cioè le informazioni raccolte così come sono, senza elaborazione), poi si procede alla normalizzazione degli identificatori (rendendo coerenti e uniformi gli elementi che identificano utenti o dispositivi, come ID o codici), e infine si esegue la correlazione temporale, ovvero l’analisi dei dati nel tempo per collegare eventi tra loro.

L’attività di correlazione permette di ricostruire sequenze di spostamenti e riconoscere schemi ricorrenti di comportamento. Quando questi schemi sono confrontati con altre fonti, come registri pubblici o dati provenienti dai social media, diventa molto probabile risalire all’identità dell’utente.

Alcuni fornitori dichiarano di filtrare luoghi sensibili come ospedali o scuole, ma non esistono standard tecnici uniformi né audit indipendenti che garantiscano l’efficacia di queste misure.

L’impatto dell’intelligenza artificiale sull’analisi dei dati

L’integrazione con modelli di intelligenza artificiale amplifica in modo significativo le capacità di analisi.

Sistemi basati su machine learning possono elaborare dataset eterogenei, identificare correlazioni latenti e generare profili comportamentali complessi. Il CEO di Anthropic, Dario Amodei, ha ad esempio evidenziato come l’uso combinato di dati commerciali e AI permetta di ricostruire “un quadro completo della vita di una persona” su larga scala.

Dal punto di vista tecnico, algoritmi di clustering e reti neurali possono aggregare segnali apparentemente isolati – spostamenti, ricerche online, interazioni social – e trasformarli in inferenze su preferenze politiche, relazioni personali o condizioni di salute.

La scalabilità rappresenta il vero salto qualitativo: operazioni che richiedevano settimane di analisi manuale possono essere eseguite in tempo reale su milioni di individui.

Il tema si intreccia con il confronto tra aziende tecnologiche e istituzioni. Anthropic ha rifiutato di consentire l’uso dei propri modelli per sorveglianza di massa, entrando in contrasto con il Dipartimento della Difesa. Tale posizione ha acceso il dibattito sul ruolo dei fornitori privati nella definizione dei limiti operativi delle tecnologie AI.

Il governo USA sostiene di poter utilizzare gli strumenti disponibili per qualsiasi finalità ritenuta legale, mentre le aziende cercano di imporre vincoli etici e tecnici. Il risultato è un equilibrio instabile, in cui le capacità tecnologiche evolvono più rapidamente delle regole che dovrebbero disciplinarle.

Accesso transfrontaliero ai dati e limiti del modello europeo

Le dinamiche descritte non si fermano ai confini statunitensi. Le agenzie d’Oltreoceano possono acquisire dataset che includono anche cittadini europei quando questi dati sono raccolti da applicazioni o servizi operanti su infrastrutture globali.

In pratica, se un’app installata su uno smartphone in Italia integra SDK pubblicitari o tracker gestiti da società statunitensi, i relativi flussi possono confluire nei database dei broker e diventare acquistabili anche da soggetti governativi.

Il punto critico riguarda la giurisdizione: una volta che i dati entrano nel circuito commerciale internazionale, il controllo previsto dal GDPR si indebolisce, soprattutto quando il trattamento avviene fuori dallo Spazio Economico Europeo.

La California ha introdotto strumenti più diretti attraverso normative come il California Consumer Privacy Act, rafforzato dal CPRA, che prevede registri pubblici dei broker e consente ai cittadini di richiedere la cancellazione centralizzata dei propri dati.

In Europa esiste già il diritto alla cancellazione, ma funziona in modo frammentato: l’utente deve rivolgersi singolarmente a ciascun titolare del trattamento, spesso senza sapere quali soggetti detengano effettivamente i suoi dati. Manca un meccanismo equivalente di registry obbligatorio e accessibile dei broker, oltre a una procedura unificata che renda l’esercizio dei diritti realmente scalabile. Quanta strada c’è ancora da fare!