/https://www.ilsoftware.it/app/uploads/2024/10/spirit-lm-meta-risposte-vocali-espressive.jpg)
Che i colossi tecnologici si affidino a tecniche poco ortodosse per addestrare i modelli AI è noto un po’ a tutti. Nonostante ciò, la recente ammissione di Meta sembra destinata a fare scalpore.
La compagnia, secondo quanto rivelato dal sito di Gigazine, ha ottenuto l’accesso a un vasto dataset per addestrare i propri sistemi AI utilizzando fonti non propriamente legali. Il database incriminato, del peso complessivo di circa 81,7 TB, sembra essere costituito da svariate informazioni ottenute in modo poco lecito, tanto da piattaforme della stessa società (Facebook e Instagram), quanto da forum e siti Web.
L’utilizzo di fonti per l’addestramento di questo tipo, comporta una serie di disagi da non sottovalutare a livello di privacy. Oltre a ciò, va poi considerato come questo tipo di comportamento va in netto contrasto con i diritti d’autore dei siti e delle piattaforme coinvolte loro malgrado nell’accaduto.
Meta e l’addestramento AI: tra violazione di privacy e diritti d’autore violati
Allo stato attuale Meta non ha ancora rilasciato una dichiarazione ufficiale su quanto avvenuto. Secondo il suddetto sito che ha reso pubblico l’accaduto, la compagnia probabilmente sta effettuando indagini interne per comprendere meglio quando è successo, adottando poi adeguate contromosse per mitigare le ripercussioni legali.
Andando indietro di solo qualche mese, va considerato come Meta abbia già ammesso che le sue piattaforme social siano una preziosa fonte di dati nel contesto dell’addestramento. La scorsa estate, infatti, per la prima volta la compagnia ha ammesso candidamente di attingere a Facebook per alimentare i propri modelli.
Per l’azienda di Mark Zuckerberg, questo è solo uno dei tanti problemi da affrontare in queste ultime settimane. Dai sempre più frequenti casi di leak, legati a dipendenti scontenti delle politiche della compagnia fino alla causa di Bright Data contro Facebook, il 2025 sembra profilarsi come un’annata molto difficile per Meta.