Intelligenza artificiale decodifica i papiri di Ercolano bruciati durante l'eruzione del Vesuvio

Sfide scientifiche

Duemila anni fa, un’eruzione vulcanica ha sepolto un’antica biblioteca di rotoli di papiro, conosciuti come i “Papiri di Ercolano“. Questi preziosi rotoli furono carbonizzati in seguito alla storica eruzione del Vesuvio, verificatasi nel 79 d.C. I manoscritti furono scoperti nel XVIII secolo e per oltre 800 la biblioteca di Napoli li ha gelosamente custoditi.

Esaminandoli, i papiri in questione hanno le sembianze di piccoli ceppi: in realtà si tratta di masse di cenere carbonizzata che, ovviamente, non possono essere aperte senza causare danni irreparabili. La sfida, che fino ad oggi sembrava impossibile da superare, consisteva nel leggere il contenuto dei papiri lasciandoli inalterati, nella loro condizione originale, quindi completamente arrotolati su se stessi.

I vincitori della sfida: letto il contenuto dei Papiri di Ercolano, carbonizzati nel 79 d.C.

A marzo 2023, Brent Seales, docente di scienze informatiche presso l’Università del Kentucky, insieme con gli imprenditori Nat Friedman e Daniel Gross, hanno lanciato la Vesuvius Challenge, un’iniziativa che ambiva proprio a decifrare il contenuto dei Papiri di Ercolano. Adesso, a distanza di appena un anno, il traguardo è stato già raggiunto. Almeno per ciò che riguarda l’obiettivo inizialmente prefisso.

Gli imprenditori hanno messo in palio centinaia di migliaia di dollari, a vantaggio di chiunque avesse proposto una soluzione efficace per leggere il contenuto dei papiri, senza provocare alcun danno. Ed oggi i vincitori dell’incredibile gara possono finalmente raccogliere il frutto del loro lavoro. Youssef Nader, Luke Farritor e Julian Schilliger incassano 700.000 dollari ma, soprattutto, dimostrano di aver individuato “le chiavi” giuste per accedere al contenuto dei manoscritti, a distanza di duemila anni.

Ricostruzione 3D rotolo papiri di Ercolano

Ricostruzione artistica in 3D tratta da Vesuvius Challenge.

Intelligenza artificiale e apprendimento automatico protagoniste dell’operazione di decodifica dei preziosi rotoli vesuviani

Come si spiega in questo documento, I ricercatori hanno utilizzato una combinazione di tecniche avanzate, inclusa la tomografia computerizzata (CT), la visione artificiale e l’apprendimento automatico per decodificare i Papiri di Ercolano.

Trasportati con cura presso il Diamond Light Source, un acceleratore di particelle vicino a Oxford (Regno Unito), i rotoli di Ercolano sono stati sottoposti a una scansione a raggi X ad alta intensità. In questo modo, usando il fascio parallelo così generato, i ricercatori hanno potuto ottenere una replica rapida, accurata e ad alta risoluzione (questo video mostra un rotolo in sezione).

Le immagini a raggi X hanno infatti permesso di creare una rappresentazione tridimensionale (3D) dei papiri, consentendo ai ricercatori di esaminarli virtualmente strato per strato senza danneggiare i supporti originali.

Il software chiamato Volume Cartographer ha quindi permesso di tracciare manualmente i vari strati del papiro elaborando la scansione 3D. Un passaggio rivelatosi essenziale per identificare la struttura e la disposizione dei fogli di papiro all’interno del rotolo.

Addestramento del modello usato per decodificare il contenuto dei papiri

Nel corso dell’estate 2023, un altro ricercatore, Casey Handmer, ha scoperto la presenza di un particolare modello chiamato crackle all’interno delle immagini ottenute ai raggi X. Tale modello sembrava formare lettere e segni.

Crackle papiri Ercolano

Fonte delle immagini: Casey Handmer’s blog.

Farritor, uno dei vincitori del Vesuvius Challenge, ha così provveduto ad addestrare un modello di apprendimento automatico per rilevare le forme associate al testo partendo proprio dalle immagini.

L’altro vincitore della grande sfida, Nader, ha esteso applicato tecniche di adattamento costruite a partire da modelli di apprendimento automatico precedentemente addestrati su frammenti aperti di papiri. Questa intuizione ha contribuito a rilevare l’inchiostro nelle immagini 3D evidenziandole chiaramente sui rotoli carbonizzati.

Con l’utilizzo dell’approccio noto come TimeSformer è stato quindi possibile ottenere immagini ancora più nitide. Il TimeSformer è un tipo di architettura basato su rete neurale che si propone come una variante del classico concetto di Transformer, introdotto da un team di Google nel 2017 (e oggi ampiamente utilizzato nei modelli generativi, compresi quelli della concorrente Microsoft-OpenAI).

La principale caratteristica di TimeSformer è la sua capacità di elaborare sequenze 3D e dati spaziotemporali. Mentre i modelli Transformer tradizionali sono progettati principalmente per dati bidimensionali e sequenziali, TimeSformer estende tale architettura per gestire sequenze di dati tridimensionali, come nel caso delle immagini a raggi X ottenute dalla scansione dei papiri. Qui trovate l’output prodotto a valle dell’elaborazione con TimeSformer.

Diverse misure legate all’ottimizzazione degli algoritmi di intelligenza artificiale hanno permesso di evitare i tipici problemi dovuti al sovradattamento e alle allucinazioni. Il sovradattamento si verifica quando un modello di machine learning si adatta troppo ai dati di addestramento, imparando anche i dettagli del rumore e delle variazioni casuali presenti in quei dati specifici. Le prestazioni su “dati nuovi” possono quindi risentirne negativamente.

I risultati degli studi sui Papiri di Ercolano sono da oggi sotto gli occhi del mondo

Il 12 ottobre 2023, Faritor, uno studente universitario di 21 anni, stagista presso SpaceX, è riuscito a decifrare per la prima volta una parola dai manoscritti di Ercolano: si trattava del termine “Πορφύρας”(viola, porpora).

Il lavoro è poi proseguito incessantemente riuscendo nel compito estremamente complesso di decifrare quattro parole con un’accuratezza superiore all’85% entro la fine del 2023. Il team composto dagli studiosi Nader, Farritor e Schilliger è riuscito a leggere più di 15 colonne di testo, per un totale di oltre 2.000 caratteri. Un’enormità per questo primo tentativo, considerato lo stato in cui versano i rotoli. Cliccando qui, potete verificare le colonne sin qui recuperate dai papiri: il 95% del testo dev’essere ancora scandagliato.

Di cosa parlano i papiri?

Il testo decifrato riguarda la “fonte di gioia“, il bene supremo nell’Epicureismo. Si tratta di un concetto caro al filosofo greco antico Epicuro, che insegnava una concezione particolare della felicità e del piacere. Quella “fonte di gioia” era strettamente legata alla ricerca del piacere, ma in un senso più profondo e duraturo. Non si trattava solo di cercare piaceri momentanei, ma di raggiungere una forma di piacere duraturo e stabile che portasse a una vita felice nel complesso. Per Epicuro, la felicità era raggiunta attraverso la moderazione, la soddisfazione dei bisogni essenziali, e la coltivazione di amicizia e relazioni significative. La “fonte di gioia” poteva essere trovata nella tranquillità dell’animo, nella soddisfazione delle necessità basilari, e nella minimizzazione delle preoccupazioni e delle ansie.

Sfida rinnovata per il 2024: l’asticella si alza ancora di più

La sfida, tuttavia, è solamente all’inizio. Per il 2024, gli organizzatori hanno fissato l’ambizioso obiettivo di decifrare l’85% del contenuto dei papiri entro la fine dell’anno. Per cercare di tagliare il traguardo, si parla dell’imminente installazione di uno scanner utile ad esaminare volumi di rotoli significativi, ogni giorno.

Nel 2023 i ricercatori sono passati dallo 0% al 5% di una pergamena. Nel 2024, l’obiettivo è portare il 5% del contenuto attualmente decodificato in un solo rotolo al 90% di tutti e quattro i rotoli a disposizione. Questo balzo in avanti getterà le basi per leggere con successo tutti gli 800 rotoli.

Il collo di bottiglia che rimane da superare riguarda il processo di tracciamento della superficie di ciascun foglio di papiro all’interno del singolo rotolo. Questo processo è oggi manuale richiedendo quindi un dispenso di forze davvero immenso. Il lavoro è costato più di 100 dollari per centimetro quadrato, soltanto per arrivare a leggere le 15 colonne pubblicate oggi.

Con questi costi esorbitanti, segmentare tutti i rotoli costerebbe centinaia di milioni o forse addirittura miliardi di dollari. A questo punto bisogna investire sull’automazione e quindi sulla cosiddetta autosegmentazione.

“Se siete interessati, potete contribuire con un investimento e unirvi così al più folle progetto archeologico in essere“, si legge nel post celebrativo di Vesuvius Challenge.

Chi sono gli investitori che hanno contribuito all’iniziativa

In apertura abbiamo citato Nat Friedman e Daniel Gross. Il primo è imprenditore e dirigente d’azienda noto per il suo coinvolgimento in diverse startup tecnologiche. È stato co-fondatore di Xamarin, un’azienda di sviluppo software, successivamente acquisita da Microsoft nel 2016. CEO fino a novembre 2021 di GitHub, la nota piattaforma di hosting di codice sorgente e collaborazione per sviluppatori software. Friedman ha anche ricoperto il ruolo di presidente in GNOME Foundation.

Gross è imprenditore e investitore. È noto per il suo coinvolgimento in diverse iniziative nel campo della tecnologia. Ha lavorato come direttore generale di Y Combinator, conosciuto acceleratore di startup.

Nell’immagine in apertura, tratta da Vesuvius Challenge, il professor Brent Seales insieme con i suoi collaboratori.

Intelligenza artificiale decodifica i papiri di Ercolano bruciati durante l'eruzione del Vesuvio

I vincitori della sfida: letto il contenuto dei Papiri di Ercolano, carbonizzati nel 79 d.C.

Intelligenza artificiale e apprendimento automatico protagoniste dell’operazione di decodifica dei preziosi rotoli vesuviani

Addestramento del modello usato per decodificare il contenuto dei papiri

I risultati degli studi sui Papiri di Ercolano sono da oggi sotto gli occhi del mondo

Di cosa parlano i papiri?

Sfida rinnovata per il 2024: l’asticella si alza ancora di più

Chi sono gli investitori che hanno contribuito all’iniziativa

Ti consigliamo anche

Character.AI lancia TalkingMachines per i video interattivi in tempo reale

Uno studio scientifico conferma che troppa AI ci rende stupidi

ChatGPT, privacy a rischio: l'ordine del giudice impone la conservazione dei log, OpenAI senza via di fuga

FLUX.1 Kontext [dev]: AI open source per l'editing immagini potenziata da NVIDIA e pronta per le GPU consumer