Quando scrivete con la tastiera italiana avete a disposizione un set di caratteri limitato. Sui sistemi desktop, caratteri aggiuntivi si possono ottenere utilizzando il tasto ALT e digitando un codice speciale. In Windows 10 e Windows 11 provate a premere la combinazione di tasti Windows + . (tasto Windows, raffigurante la bandierina del sistema operativo, insieme con il tasto .): avrete la possibilità di scegliere tra una vasta selezione di emoji e simboli. Unicode è uno standard internazionale per la codifica, la rappresentazione e la gestione del testo in diverse lingue e sistemi di scrittura. Il suo obiettivo è fornire un sistema unico che possa rappresentare caratteri di tutte le lingue del mondo, simboli, emoticon, segni di punteggiatura e altro, risolvendo i problemi legati alle precedenti codifiche di caratteri.

Raymond Chen, ingegnere software con oltre 30 anni di esperienza nello sviluppo di Microsoft Windows, raccontava di recente perché premendo ALT e una sequenza di numeri si ottengono dei simboli e qual è la logica dietro la loro generazione e visualizzazione.

Cos’è e come funziona Unicode

Unicode assegna a ogni carattere un numero univoco: questi codici punto sono rappresentati con una sintassi U+ seguito da un numero esadecimale. Lo standard Unicode supporta ogi oltre 150.000 caratteri di vari sistemi di scrittura, inclusi alfabeti latini, cirillici, arabi, cinesi, giapponesi, simboli matematici, e persino emoji.

L’idea alla base di Unicode è quella di risolvere diversi problemi di compatibilità legati alla rappresentazione del testo su piattaforme diverse e garantisce che un testo scritto in una lingua possa essere correttamente visualizzato su qualsiasi sistema in grado di supportare Unicode.

Le principali caratteristiche di Unicode sono la sua universalità, permettendo di scrivere e visualizzare correttamente i testi in qualsiasi lingua, da quelle che usano l’alfabeto latino, come l’italiano e l’inglese, a quelle che usano caratteri complessi come il cinese o l’arabo.

La soluzione standardizzata rappresentata da Unicode, che supera le restrizioni dei set di caratteri come ASCII o ISO-8859, offre ampie garanzie in termini di compatibilità, interoperabilità e supporto multilingua.

Le codifiche Unicode

Unicode definisce i codici da utilizzare per la resa di ciascun carattere, ma esistono vari modi per immagazzinare e trasmettere questi codici, detti codifiche.

Le principali codifiche di Unicode includono UTF-8: è in assoluto la più diffusa e utilizzata. Sfrutta da 1 a 4 byte per rappresentare un carattere ed è retrocompatibile con ASCII.

Ci sono poi UTF-che usa 2 o 4 byte per carattere (ampiamente integrata nei sistemi Windows) e UTF-16, che usa sempre 4 byte per carattere, garantendo una rappresentazione uniforme ma meno efficiente in termini di spazio.

Unicode evolve e introduce oltre 5.000 nuovi caratteri

Non tutti sanno che Unicode è uno standard piuttosto dinamico: è aggiornato regolarmente per includere nuovi caratteri e simboli (come le emoji). Così, Unicode si presenta come un sistema flessibile e sempre in espansione.

La Versione 16.0 dello Standard Unicode, presentata il 10 settembre 2024, segna un aggiornamento significativo. Unicode aggiunge sotto la sua ala qualcosa come 5.185 nuovi caratteri, tra cui 3.995 nuovi geroglifici. Sono inoltre inseriti oltre 700 simboli provenienti da ambienti di calcolo legacy, portando il numero totale di caratteri supportati a 154.998.

Un altro aspetto rilevante riguarda l’introduzione di nuovi caratteri giapponesi, che fanno riferimento a oltre 36.000 ideogrammi: vanno ad arricchire ulteriormente le rappresentazioni grafiche nelle tabelle dei codici.

Inserire i caratteri speciali da tastiera

In un altro articolo, abbiamo visto come ottenere i caratteri speciali da tastiera: in apertura abbiamo detto che lo si può fare usando il tasto ALT e una sequenza numerica, usando la combinazione di tasti Windows + . , ma ci sono altre metodologie che possono essere certamente utilizzate.

In Windows potete ad esempio digitare Mappa caratteri nella casella di ricerca per cercare i simboli che interessano oppure si può fare riferimento alla sezione Inserisci, Carattere speciale dei principali wordprocessor.

Come ricorda Chen, permangono ad oggi alcune difformità. Quando, ad esempio si usa il tasto ALT seguito da una serie di numeri (ad esempio, ALT+123 e ALT+125 consentono di ottenere le parentesi graffe, ALT+212 la “e” maiuscola accentata, ALT+126 il simbolo della tilde), se il numero digitato è superiore a 256 possono ingenerarsi comportamenti diversi a seconda dell’applicazione utilizzata.

Ad esempio ALT+9731 produce un cuore nelle applicazioni che accettano l’inserimento del testo e gestiscono il valore modulo 256, restituisce un pupazzo di neve nei controlli per l’inserimento dei dati (come RichEdit) che interpretano il valore modulo 65536.

In ogni caso, poiché il valore Unicode del cuore è U+2665 , digitando semplicemente 2665 in un’applicazione come Word o LibreOffice Writer quindi premendo ALT+X , si otterrà il simbolo atteso. Potete trovare altre informazioni in questa pagina Microsoft.

Quando e come arrivano gli aggiornamenti Unicode sui sistemi degli utenti

Gli aggiornamenti Unicode arrivano sui sistemi degli utenti tramite aggiornamenti software che includono nuove versioni del set di caratteri.

I sistemi operativi aggiornano periodicamente le loro librerie di caratteri Unicode attraverso aggiornamenti di sistema. Quando una nuova versione di Unicode viene rilasciata, di solito in nuovi simboli diventano disponibili attraverso aggiornamenti del sistema operativo (Windows Update, aggiornamenti di sistema su macOS e distribuzioni Linux).

I principali browser (Chrome, Firefox, Edge, Safari) aggiornano periodicamente il supporto Unicode tramite i loro aggiornamenti periodici. Le nuove versioni Unicode sono quindi rese disponibili al momento dell’aggiornamento del prodotto, in modo che i nuovi caratteri siano correttamente visualizzati nelle pagine Web.

Credit immagine in apertura: Microsoft Copilot Designer