Un’anteprima esclusiva della modalità vocale avanzata promette di rivoluzionare l’interazione tra uomo e macchina con conversazioni naturali e reattive. OpenAI avvia il rollout graduale a un gruppo selezionato di utenti.
OpenAI ha recentemente annunciato l’inizio della distribuzione della versione alpha del nuovo Advanced Voice Mode per un ristretto gruppo di utenti ChatGPT Plus. Questa nuova funzionalità rappresenta un passo significativo verso conversazioni più naturali e in tempo reale con ChatGPT, permettendo agli utenti di interrompere e rispondere in modo dinamico durante le interazioni. La modalità vocale avanzata è progettata per cogliere e reagire alle emozioni dell’utente, offrendo un’esperienza comunicativa più immersiva e personalizzata.
Il rollout della versione alpha inizierà con un numero limitato di utenti selezionati e, nelle prossime settimane, OpenAI prevede di estendere gradualmente l’accesso a tutti gli utenti ChatGPT Plus. Gli utenti scelti per la fase iniziale riceveranno un avviso direttamente nell’app ChatGPT e un’email con le istruzioni dettagliate su come accedere e utilizzare la nuova funzionalità. È importante notare che, durante questa fase iniziale, la condivisione di video e schermo non sarà disponibile. Queste funzionalità si introduranno in un secondo momento.
Test e perfezionamento della modalità vocale
OpenAI ha investito notevoli risorse nella qualità e nella sicurezza delle conversazioni vocali offerte dalla modalità vocale avanzata. Il modello GPT-4o è stato potenziato per supportare milioni di conversazioni vocali simultanee con bassa latenza e alta qualità. Questo sforzo si accompagna da un miglioramento nella capacità del modello di rilevare e rifiutare contenuti inappropriati, un aspetto fondamentale per garantire un’interazione sicura e conforme alle normative.
Negli ultimi due mesi, la funzionalità vocale del modello è stata sottoposta a un intenso programma di test con oltre 100 red teamer esterni. Questi tester, parlanti collettivamente 45 lingue diverse e provenienti da 29 aree geografiche, hanno fornito feedback cruciale per l’ulteriore sviluppo della modalità vocale. Sulla base di questi test e delle valutazioni interne, OpenAI ha implementato nuove misure di sicurezza per garantire un’esperienza ottimale agli utenti.
Sicurezza e innovazione nella voce artificiale
Il Advanced Voice Mode di ChatGPT utilizzerà quattro voci preimpostate, sviluppate in collaborazione con doppiatori professionisti, per evitare che il modello possa impersonare altre persone, comprese figure pubbliche. Questa misura serve per prevenire l’uso improprio della tecnologia e garantire che le voci generate rimangano all’interno di parametri definiti e controllabili.
L’aggiunta dei nuovi filtri aiuterà a riconoscere e bloccare richieste di generare musica o altri contenuti audio protetti da copyright. Queste tecniche di sicurezza sono simili a quelle già applicate alla modalità testuale e assicurano che GPT-4o operi in conformità con le leggi vigenti, evitando la generazione di contenuti dannosi o inappropriati. La continua attenzione alla sicurezza e alla qualità delle conversazioni vocali evidenzia l’impegno di OpenAI verso l’innovazione responsabile e rispettosa delle normative.