Suno, come funziona l'IA che crea musica e legge qualunque testo

Come usare Suno per creare canzoni usando istruzioni basate sul linguaggio naturale. È anche possibile fornire il testo che l'intelligenza artificiale dovrà cantare, usando come base la melodia generata dall'IA.

Quando ci siamo trovati dinanzi a questo esempio, condiviso sul sito di Suno, ci sono tornati subito alla mente “tormentoni” come Vittorio Gassman legge gli ingredienti dei frollini. Questa volta, però, non è la voce del “Mattatore” per eccellenza a leggere un testo ma a farlo è un’intelligenza artificiale (IA), che non solo applica una sintesi vocale ma è progettata per generare musica, vere e proprie canzoni inedite.

Nel curioso esempio citato in apertura, l’IA di Suno riceve in input (prompt) parte del testo della licenza MIT (ne parliamo nelle differenze tra open source e software libero) e ci costruisce sopra una vera e propria canzone, peraltro piuttosto graziosa.

Cos’è Suno e come funziona

Come abbiamo visto in precedenza, Suno è una piattaforma che fa leva sull’IA per generare musica a partire da descrizioni testuali in linguaggio naturale. Questo strumento innovativo combina  le tecniche avanzate del suo modello generativo con alcune caratteristiche che pongono l’accento sulla creatività musicale. In questo modo gli utenti possono trasformare le parole in note, ritmi e armonie.

Uno strumento come Suno colma il divario tra linguaggio e musica; offre nuove opportunità per compositori, musicisti e appassionati; rende facilmente accessibile a tutti la generazione di brani musicali accattivanti e di grande effetto.

L’architettura di Suno

Suno si serve innanzi tutto di un modulo di preprocessing del testo: è responsabile della “pulizia” e della normalizzazione dell’input. Si occupa di effettuare la tokenizzazione, di eliminare eventuali stop words (che possono impattare negativamente sulla resa del brano musicale), utilizza tecniche di stemming e lemmatizzazione.

Entrambe queste due ultime tecniche sono utilizzate per normalizzare il testo in modo da ridurne la complessità e migliorare la precisione nelle applicazioni di analisi del linguaggio naturale, come il riconoscimento di entità, il raggruppamento di parole simili e la classificazione del testo. Nello specifico, lo stemming è il processo di riduzione delle parole alla loro forma radice, chiamata “stemma”; la lemmatizzazione è simile allo stemming ma utilizza una conoscenza morfologica delle parole e applica regole linguistiche per restituire le forme base corrette.

Il testo preprocessato è rappresentato poi come una sequenza di token, che serve come input per la fase successiva di estrazione delle caratteristiche. Il modulo seguente, infatti, converte il testo preprocessato in una rappresentazione numerica che può essere utilizzata per il machine learning. Impiega diverse tecniche, come word embeddings (Suno usa Word2Vec o GloVe per rappresentare le parole come vettori), analisi dell’emozione e modellazione del tema, per estrarre le caratteristiche significative dal testo.

In questo modo Suno può cogliere i tratti che descrivono le relazioni semantiche, il tono emotivo e la struttura tematica del testo specificato dall’utente. Da qui inizia la generazione dei pattern musicali con la previsione della sequenza, la generazione di armonia e melodia, la selezione degli strumenti e l’orchestrazione.

Alla fine della “catena” c’è il rendering audio che si occupa di trasformare i pattern musicali in un formato audio. Il modulo finale si serve di una combinazione di suoni sintetizzati e campioni per creare una rappresentazione audio ricca ed espressiva.

Creare una canzone con Suno

Per provare a generare una melodia con Suno, è sufficiente cliccare su Create nella pagina principale del progetto.

Nel riquadro Song description, basta specificare ciò che si desidera ottenere: piuttosto che nominare degli artisti, è bene descrivere con dovizia di particolari l’effetto musicale che si desidera ottenere. Di default, Suno produce un brano cantato ma attivando l’opzione Instrumental si può creare una base strumentale.

Suno, creare canzone

È però attivando Custom mode che si dischiudono le possibilità più estese rispetto all’utilizzo di un potente strumento come Suno.

Nel riquadro Lyrics, si possono digitare i testi da tradurre in musica. Il servizio invita a usare esclusivamente testi ideati in proprio, che non siano quindi soggetti a diritti d’autore. Diversamente, potrebbero crearsi spiacevoli problemi. Il pulsante Make random lyrics consente di generare testi in modo pseudocasuale.

Personalizzare musica con Suno e l'IA

Nella casella Style of music è possibile impostare l’atmosfera, il mood, il tempo e le caratteristiche vocali del cantante o della cantante. Fornire un prompt ben argomentato, significa ottenere una canzone ben strutturata, che può essere anche commercialmente interessante. Per farsi aiutare, si può fare clic su Use random style: Suno potrebbe riuscire a sorprendervi con il genere perfetto.

Tra le numerose funzionalità offerte da Suno, c’è la possibilità di estendere la durata delle canzoni: per unire tutti i segmenti in una singola canzone, si può semplicemente fare clic sulla voce “Ottieni la canzone completa“.

L’estensione della durata è disponibile su tutti e tre i piani offerti da Suno: Basic (gratuito), Pro e Premier. Tuttavia, ogni estensione utilizza 10 crediti, come la creazione della prima canzone della catena. Gli utenti della versione free hanno a disposizione ben 50 crediti gratis ogni giorno anche se da termini di utilizzo del servizio non possono utilizzare i contenuti generati per finalità commerciali.

Qualche utile suggerimento

Suno nasce per gestire testi in lingua inglese ma, a valle delle prove che abbiamo svolto, possiamo dire che non se la cava affatto male neppure con l’italiano. Nella nostra lingua potrebbe essere necessaria qualche ottimizzazione in più, ma i risultati non lasciano l’amaro in bocca.

Verificate anche questo esempio: nel riquadro Lyrics si può introdurre non soltanto il testo ma anche indicazioni articolate. Ad esempio si possono specificare sezioni come Verses, Chorus, Bridge, per specificare, rispettivamente, le strofe, il ritornello e la sezione ponte (un collegamento tra strofe e ritornello). Le indicazioni Verses, Chorus, Bridge possono essere inserite così come sono oppure racchiuse tra parentesi quadre per meglio evidenziarle all’IA.

L’Instrumental Break è un intermezzo strumentale che mette temporaneamente da parte il parlato per dare libero sfogo ai pezzi dell’orchestra. A questo proposito, come si vede nell’esempio, possono essere fornite specifiche prescrizioni, così da ottenere l’effetto che si ha in testa.

Conclusioni

Suno rappresenta un significativo passo avanti nella generazione musicale basata sull’intelligenza artificiale, dimostrando il potenziale dell’IA per la creazione ed elaborazione creativa dei brani.

Trasformando descrizioni testuali in composizioni musicali, Suno offre un approccio unico e innovativo alla creazione musicale che ha il potenziale per rivoluzionare il modo con cui ogni utente, anche coloro che non dispongono di un bagaglio di conoscenze approfondito, compongono, ascoltano e interagiscono con la musica.

Come dimostra la presentazione di strumenti quali Udio e Stable Audio, i concorrenti non mancano di certo ma l’ultima versione di Suno ha conquistato la leadership tra le soluzioni più abili nella generazione di brani musicali qualitativamente elevati.

Ti consigliamo anche

Link copiato negli appunti