xAI lancia Voice Agent Builder per clonare la voce e creare call center con l'AI

xAI presenta Voice Agent Builder: piattaforma no-code per creare assistenti vocali AI integrati con telefonia e API.

xAI ha lanciato Voice Agent Builder, una piattaforma no-code per creare assistenti telefonici basati sull’Intelligenza Artificiale in pochi minuti.

Il debutto, avvenuto il primo di luglio in versione beta, si inserisce in un mercato dei voice agent in forte espansione, dove aziende di ogni settore cercano soluzioni per automatizzare supporto clienti, prenotazioni e processi ripetitivi. Alla base del sistema opera Grok Voice, il motore vocale di xAI progettato per conversazioni speech-to-speech a bassa latenza, senza i passaggi separati di riconoscimento, elaborazione e sintesi tipici delle architetture tradizionali.

Come funziona la configurazione no-code

L’utente descrive in linguaggio naturale il comportamento desiderato dell’agente, carica i documenti che fungeranno da base di conoscenza (testo semplice, Markdown, Word, PowerPoint, Excel, HTML, JSON) e definisce le azioni consentite, come chiamate API o accesso a calendari.

La piattaforma supporta il protocollo SIP per collegare numerazioni esistenti e connessioni WebSocket per client personalizzati, oltre alla compatibilità con server MCP per integrare strumenti esterni mantenendo un’interfaccia standardizzata. Ogni account riceve gratuitamente un numero di telefono dedicato, utile per test immediati prima di un eventuale passaggio in produzione. È disponibile anche una modalità di test diretta dal browser, senza bisogno di un telefono fisico.

Tra gli elementi distintivi rientra la gestione della voce: oltre 80 voci predefinite in numerose lingue, più la possibilità di clonare la voce del brand partendo da circa due minuti di audio. xAI dichiara di aver introdotto un sistema di verifica dell’identità del parlante per limitare usi non autorizzati della clonazione, un aspetto che resta comunque da monitorare con attenzione sul piano della sicurezza dei dati biometrici e del consenso informato.

Le possibilità di impiego superano il tradizionale centralino automatico: verifica di appuntamenti, gestione prenotazioni, consultazione database, risposte su prodotti e ordini, avvio di procedure di rimborso tramite API. Grazie al recupero delle informazioni dai documenti aziendali, l’agente può attingere a manuali tecnici, FAQ e procedure operative, restando aderente alle informazioni realmente disponibili nell’organizzazione. Ogni chiamata viene registrata e trascritta, con la possibilità di rivedere audio, testo e strumenti utilizzati durante la conversazione, un elemento utile per il controllo qualità e la conformità.

Prezzi, limiti e concorrenza

Il costo dichiarato da xAI è di 0,05 dollari al minuto per l’elaborazione vocale, con un ulteriore 0,01 dollari al minuto per la telefonia su numero fornito dalla piattaforma, una cifra che la posiziona come opzione più economica rispetto a concorrenti come ElevenLabs.

Restano comunque i limiti tipici dell’AI generativa: la qualità dipende dalla chiarezza delle istruzioni fornite e dall’accuratezza della base di conoscenza caricata. Prima dell’adozione in azienda vale la pena valutare protezione dei dati, conformità normativa e necessità di supervisione umana, elementi che continuano a determinare un utilizzo sicuro dell’intelligenza artificiale nelle comunicazioni vocali.

Ti consigliamo anche

Link copiato negli appunti