sintesi vocale ai gpt

Voice Engine: la rivoluzione sintesi vocale in soli 15 Secondi

Scopri come la nuova piattaforma di OpenAI trasforma brevi campioni audio in voci sintetiche multilingue con applicazioni rivoluzionarie e precauzioni di sicurezza.

OpenAI ha recentemente introdotto una rivoluzionaria piattaforma chiamata Voice Engine, destinata a ridefinire il panorama della sintesi vocale. Questo innovativo strumento ha la capacità di creare una voce sintetica partendo da un breve segmento audio di soli 15 secondi, consentendo la lettura di testi in diverse lingue, inclusa quella originale del campione. Per valutare le sue potenzialità positive e le necessarie precauzioni di sicurezza, OpenAI ha avviato un accesso limitato a questa tecnologia, collaborando con diverse aziende in settori diversi.

Tra i partner che hanno avuto l’opportunità di testare Voice Engine vi sono Age of Learning nel campo dell’educazione tecnologica, HeyGen nel storytelling visivo, Dimagi per il software sanitario di prima linea, Livox per le app di comunicazione AI e il sistema sanitario Lifespan. Queste collaborazioni hanno consentito di esplorare applicazioni pratiche della tecnologia, come la creazione di contenuti vocali pre-sceneggiati e risposte personalizzate in tempo reale per gli studenti, generati attraverso GPT-4.

Il team di prodotto di OpenAI, guidato da Jeff Harris, ha iniziato lo sviluppo di Voice Engine alla fine del 2022, utilizzando dati licenziati e pubblicamente disponibili per arricchire le voci preimpostate dell’API di testo-parlato e la funzione Read Aloud di ChatGPT. Tuttavia, l’accesso a questa piattaforma rimarrà limitato a circa dieci sviluppatori, evidenziando la prudenza di OpenAI nell’introdurre questa tecnologia.

Clonare la voce attraverso l’intelligenza artificiale

Il settore della generazione di testo in audio, in particolare la clonazione vocale basata sull’intelligenza artificiale, sta vivendo una rapida evoluzione, con aziende come Podcastle ed ElevenLabs che si distinguono per le loro innovazioni. Tuttavia, questo progresso è accompagnato da crescenti preoccupazioni etiche e di sicurezza, come dimostrato dal recente bando della Federal Communications Commission statunitense sulle chiamate automatizzate che utilizzano voci IA clonate senza consenso.

OpenAI ha imposto rigorose politiche d’uso ai suoi partner, vietando l’impersonificazione di individui o organizzazioni senza consenso, richiedendo il consenso esplicito del parlante originale e impedendo agli utenti di creare voci proprie. Ogni clip audio generata porterà una watermark per tracciabilità e verrà monitorato attentamente l’uso della voce sintetica.

In risposta ai potenziali rischi, OpenAI propone varie misure preventive, come l’eliminazione dell’autenticazione vocale per l’accesso ai conti bancari, politiche per proteggere l’uso delle voci delle persone nell’IA, un maggiore impegno nell’educazione sui deepfake e lo sviluppo di sistemi di tracciamento dei contenuti IA.

About Redazione

Nata l'8 ottobre 2007 da un progetto di tre studenti universitari. Unica Radio vuole raccontare il territorio, la cultura e le attività dell'hinterland attraverso la voce dei protagonisti. Unica Radio racconta la città che cambia

Controlla anche

OpenAI lancia Sora: il futuro del video creativo è qui

Un modello di intelligenza artificiale per creare video da testo: la rivoluzione del settore creativo …