Scopri VALL-E: un’intelligenza artificiale in grado di riprodurre la tua voce in soli 3 secondi.
➡️ ACCEDI A CHATGPT IN ITALIANO CLICCANDO QUI ! ⬅️
Microsoft sviluppa un modello di intelligenza artificiale capace di riprodurre la tua voce
Microsoft ha annunciato la creazione di VALL E, un nuovo modello di intelligenza artificiale in grado di generare un messaggio audio con la tua voce. La tecnologia funziona utilizzando due input: un testo scritto e una registrazione vocale che dice qualsiasi testo. Con soli tre secondi di registrazione, VALL E può riprodurre la tua voce su qualsiasi testo.
Come funziona VALL E
VALL-E è un modello di sintesi testo-voce (text-to-speech synthesis o TTS in inglese). Il modello opera convertendo il testo scritto e l’audio in un formato matematico adeguato. Grazie al suo addestramento, VALL E sa come trasformare il messaggio audio di ingresso in quello che si desidera farlo dire con la voce dell’oratore originale. Alla fine, il modello deve produrre un file audio comprensibile al pubblico, ovvero un messaggio audio.
Le prestazioni
I ricercatori di Microsoft dichiarano che VALL E supera le attuali prestazioni in termini di realismo e somiglianza alla voce della persona. Le prestazioni sono state confrontate con quelle di uno degli ultimi modelli di generazione vocale, YourTTS. In termini di naturalezza o tasso di errore rispetto allo script, VALL-E ha ottenuto risultati migliori.
VALL-E funziona solo in inglese
Anche se VALL-E è stato addestrato su un corpus di 60.000 ore di registrazioni in inglese con 7.000 persone diverse, non è ancora pronto per essere utilizzato in altre lingue. Il modello è anche meno efficace con gli accenti che non erano rappresentati nella base di dati di addestramento.
I pericoli dei deepfake vocali
Queste tecnologie, che consentono la generazione automatica di contenuti audio e visivi, fanno temere la diffusione di deepfake sui social media. È facile correggere un messaggio in cui una parola è stata pronunciata male o creare automaticamente la traduzione di un discorso. Tuttavia, ciò potrebbe avvenire a scapito della qualità.
Fonte : fastweb.it