Imparate il machine learning con il corso gratuito di Amazon MLU-Explain

Presentiamo il corso gratuito Amazon MLU-Explain per imparare il machine learning, utile per apprendere i segreti dei modelli generativi e delle moderne intelligenze artificiali.

Il concetto di machine learning è strettamente legato con quello di rete neurale e, in generale, con le applicazioni di intelligenza artificiale. Si tratta di un’area che si occupa dello sviluppo di algoritmi e modelli che consentono alla macchina di apprendere da dati passati, identificare pattern, fare previsioni ed eventualmente assumere delle decisioni senza essere esplicitamente programmata per compiti specifici.

Il machine learning (apprendimento automatico, in italiano) può essere suddiviso in due categorie principali: supervisionato e non supervisionato. Nell’apprendimento supervisionato, il modello è addestrato su un set di dati di input e output noti, mentre nell’apprendimento non supervisionato il modello deve identificare pattern e strutture nei dati senza l’aiuto di output conosciuti e approvati.

Il corso gratuito Amazon MLU-Explain per imparare il machine learning

Amazon, nell’ambito del suo progetto educativo Machine Learning University (MLU), offre un corso gratuito chiamato MLU-Explain. Si tratta di un’iniziativa studiata per insegnare la teoria dell’apprendimento automatico e la sua applicazione pratica in modo accessibile ed efficace.

Imparare machine learning gratis con MLU-Explain di Amazon

Obiettivo principale di MLU-Explain è insegnare i concetti cruciali del machine learning attraverso una serie di passaggi visuali e descrizioni interattive. Il primo modulo incentrato sulle reti neurali esplora componenti essenziali per molti dei più popolari ed apprezzati algoritmi: ChatGPT, Stable Diffusion e molti altri.

Si passa quindi ad approfondire il concetto di equality of odds (uguaglianza delle probabilità): il corso firmato da Amazon dà ampio spazio alla metrica utilizzata per valutare e ridurre ai minimi termini i cosiddetti bias. Questi ultimi rappresentano una deviazione sistematica o una distorsione nella raccolta, analisi e interpretazione dei dati, che porta a un’alterazione delle conclusioni o delle previsioni. I bias possono manifestarsi in vari modi, andando a influenzare negativamente la correttezza e l’affidabilità di un sistema, algoritmo o modello.

I bias nei modelli generativi possono danneggiare involontariamente o creare stereotipi negativi contro gruppi di soggetti sottorappresentati o storicamente svantaggiati. Il concetto di equality of odds mira a uniformare l’errore che un modello commette quando prevede risultati categorici per diversi gruppi.

Regressione logistica e apprendimento per rinforzo

Un modulo interattivo illustra come la regressione logistica possa essere applicata alla classificazione binaria. Utilizzando diversi esempi, gli esperti mostrano come un modello possa apprendere dai dati e fare previsioni precise in un contesto pratico. La regressione logistica è un algoritmo di apprendimento supervisionato utilizzato per classificare i dati in categorie o classi, prevedendo la probabilità che un’osservazione appartenga a una particolare classe in base alle sue specifiche caratteristiche.

Sebbene la logistic regression possa essere estesa a più di due categorie, è spesso utilizzata per la classificazione binaria, ovvero per prevedere a quale dei due gruppi un dato appartiene o se un evento si verificherà o meno.

Il corso esplora inoltre il cosiddetto apprendimento per rinforzo, concentrandosi sul dilemma esplorazione-esposizione. Attraverso scenari interattivi, spiega come gli agenti possono apprendere a prendere decisioni ottimali in ambienti complessi, bilanciando la scoperta di nuovi comportamenti e lo sfruttamento di quelli già noti.

L’apprendimento per rinforzo è un ramo dell’apprendimento automatico che si concentra su come “agenti intelligenti” possano imparare interagendo con l’ambiente circostante. A differenza dell’apprendimento supervisionato e non, nell’apprendimento per rinforzo il modello impara dalle conseguenze delle sue azioni senza conoscere a priori la giusta operazione da compiere.

Curva ROC e AUC: valutazione delle prestazioni dei classificatori

Un’analisi dettagliata della curva ROC e della cosiddetta Area Under the Curve (AUC) offrono una visione approfondita di come valutare le performance di un classificatore.

Un “classificatore” è un modello di machine learning addestrato per assegnare oggetti o dati a una o più classi, sulla base delle loro caratteristiche intrinseche. In altre parole, un classificatore prende in input delle caratteristiche di un’istanza e fornisce in output l’etichetta della classe a cui appartiene quell’istanza. Le “prestazioni” di un classificatore si riferiscono alla sua capacità di effettuare predizioni accurate.

Il corso introduce anche la tecnica di validazione incrociata K-Fold come strumento per migliorare le stime degli errori. Inoltre, spiegando l’importanza di dividere i dati in set di addestramento, test e validazione, il corso fornisce le basi per garantire che i modelli siano accurati e si comportino bene anche quando si trovano ad esaminare dati nuovi, mai visti in precedenza.

Alberi decisionali, bilancio tra bias e barianza, fenomeno della doppia discesa

Il corso MLU-Explain si conclude prendendo in esame tre concetti chiave nell’ambito del machine learning. Gli alberi decisionali, ad esempio, rappresentano un approccio intuitivo nell’ambito dell’apprendimento automatico, utilizzati sia per problemi di classificazione che di regressione. Questi algoritmi operano creando una struttura ad albero di decisioni basate sulle caratteristiche dei dati di addestramento. Ogni nodo dell’albero rappresenta una domanda su una caratteristica specifica, mentre i rami corrispondono alle risposte possibili. Tale struttura consente una comprensione visuale del processo decisionale e facilita l’interpretazione del modello.

Il bilancio tra bias e varianza è una considerazione cruciale nel processo di sviluppo dei modelli. Il bias, infatti, può essere anche definito come l’errore introdotto dalle semplificazioni fatte dal modello, mentre la varianza misura quanto il modello è sensibile alle variazioni dei dati di addestramento. Trovare il giusto compromesso tra queste due componenti è essenziale per evitare il presentarsi di fenomeni in grado di influenzare negativamente le prestazioni dei modelli.

Il concetto della doppia discesa è negli ultimi anni emerso come uno degli aspetti fondamentali da tenere in considerazioni quando si lavora su soluzioni per il machine learning. Contrariamente alla convinzione tradizionale secondo cui l’errore di un modello diminuisce monotonicamente con la complessità, la doppia discesa evidenzia una curva a “U”. In altre parole, dopo una prima fase di discesa dell’errore, aumentando la complessità del modello si presenta una seconda fase di riduzione dell’errore.

Credit immagine in apertura: iStock.com – MF3d

Ti consigliamo anche

Link copiato negli appunti