SSD, età media e ciclo di vita secondo BackBlaze

BackBlaze condivide le informazioni sulle unità SSD che, nei suoi data center, si sono dimostrate maggiormente durevoli. Come gli esperti hanno calcolato la durata media di ciascun modello.
SSD, età media e ciclo di vita secondo BackBlaze

Backblaze è un’azienda specializzata in servizi di archiviazione cloud e soluzioni di backup online. Offre agli utenti e alle aziende la possibilità di archiviare, proteggere e recuperare i propri dati in modo sicuro attraverso il cloud. Dal momento che la società utilizza migliaia di esemplari di unità SSD nei suoi data center, è possibile stabilire quali sono i modelli che durano di più e calcolare la loro vita media. Tenendo ben presente che lo stress al quale sono sottoposte le unità a stato solido presso BackBlaze non è lo stesso che si registra negli utilizzi normali in azienda, come in ufficio e a casa.

Al 30 giugno 2023, BackBlaze gestiva 3.144 SSD utilizzate come unità di avvio per i suoi server di archiviazione cloud. Ogni unità SSD è utilizzata per l’avvio del sistema, l’archiviazione di file di log, la memorizzazione di file temporanei e così via. Ogni giorno queste unità a stato solido leggono, scrivono ed eliminano dati a seconda delle attività espletate su ciascun server di storage cloud.

Tassi di guasto annualizzati (AFR) e durata degli SSD

Nel suo report trimestrale, BackBlaze ha aggiornato le prestazioni delle unità SSD complessivamente impiegate nei suoi data center. Ovviamente, i dati più utili e statisticamente rilevanti sono quelli che si riferiscono a modelli di SSD ampiamente utilizzati all’interno dell’azienda. Se uno specifico modello di SSD è usato in pochi esemplari, il dato relativo ai tassi di guasto annualizzati  (AFR) non deve essere in alcun modo preso in considerazione.

Storicamente, BackBlaze ha installato nelle sue strutture un numero enorme di hard disk mentre le unità SSD vi sono entrate a far parte molto più di recente. I tecnici spiegano nel caso dei dischi fissi, accumulando sempre più dati corso del tempo, è possibile stabilire l’età media intorno alla quale un hard disk inizia a manifestare problemi di funzionamento.

Lo stesso approccio viene adesso applicato alle unità SSD anche se, al momento, il volume dei dati disponibili non è neanche lontanamente paragonabile a quello generato nel caso degli hard disk.

Utilizzo dei parametri SMART per conteggiare la durata di ciascuna unità SSD

Come primo passo, gli esperti di BackBlaze hanno determinato il valore SMART_9_RAW di ciascuna unità SSD. Noto anche come “Power-On Hours” (POH) o “Hours in operation” è un parametro del sistema SMART (Self-Monitoring, Analysis and Reporting Technology) utilizzato nei dispositivi di archiviazione, inclusi gli SSD. Esso tiene traccia del numero di ore in cui il dispositivo è rimasto acceso e in funzione. Il dato SMART_9_RAW rappresenta il numero grezzo delle ore di funzionamento del dispositivo, senza alcuna elaborazione o interpretazione. È insomma una sorta di contatore utilizzabile per valutare l’usura e l’età del dispositivo.

Delle oltre 3.000 unità a stato solido in uso, BackBlaze ha registrato finora appena 63 malfunzionamenti complessivi. Esaminando il valore SMART_9_RAW per quelle unità problematiche, si è potuto concludere che l’età media in cui si presenta un guasto è pari a circa 14 mesi. Nel caso delle unità operative, tuttavia, il contatore SMART_9_RAW continua a crescere senza sosta. Lo dimostra la tabella seguente:

SSD funzionanti SSD guasti
Marca Modello età media età media
Crucial CT250MX500SSD1 598 11 mesi 9 7 mesi
Seagate ZA250CM10003 1,114 28 mesi 14 11 mesi
Seagate ZA250CM10002 547 40 mesi 17 25 mesi

Il valore al di sotto delle colonne “n°” indica il numero degli esemplari funzionanti e guasti nella struttura BackBlaze. Come si vede, sono poche le unità danneggiatesi e quelle ancora operative contribuiranno, nel corso del tempo, ad alzare significativamente l’età media.

Interessante notare che un SSD “consumer” come il Crucial MX500 da 250 GB assicura prestazioni eccellenti in termini di durata anche in un ambiente impegnativo com’è quello di un data center.

Curva a vasca da bagno anche per gli SSD

La curva a vasca da bagno (bathtub curve) è un concetto utilizzato in statistica e ingegneria della affidabilità per descrivere la distribuzione dei tassi di guasto di un sistema nel corso del tempo. La curva ha la forma di una vasca da bagno, con tre fasi distintive. Nella fase iniziale i tassi di guasto sono elevati: in questo periodo, spesso chiamato “mortalità infantile“, si verificano guasti dovuti a difetti di produzione, design o problemi di materiali.

Nella fase centrale il tasso di guasto si stabilizza presentando un andamento relativamente costante. Durante questa fase, i componenti sono considerati affidabili e il tasso di guasto è basso e costante nel tempo.

Verso la fine della vita utile del sistema (wear-out), il tasso di guasto inizia ad aumentare nuovamente: i componenti del sistema iniziano a mostrare segni di invecchiamento, usura e degrado. Di conseguenza, la probabilità di guasti aumenta in modo significativo.

Tassi guasto unità SSD

Gli esperti di BackBlaze osservano che mentre la curva effettiva (linea blu) prodotta dai guasti degli SSD in ogni trimestre è un po’ “irregolare”, la linea di tendenza rossa tratteggiata ha decisamente un aspetto di curva a vasca da bagno. La linea di tendenza corrisponde a circa il 70% dei dati quindi c’è un discreto grado di approssimazione ma, continua BackBlaze, è sorprendente vedere come gli episodi di guasti degli SSD seguano il percorso della collaudata curva a vasca da bagno, rivelatasi estremamente attendibile nel caso degli hard disk.

Credit immagine in apertura: iStock.com/Andrii Atanov

Ti consigliamo anche

Link copiato negli appunti