OpenAI: Clonare la tua voce con pochi input e vogliono parlarne con te

news

OpenAI: Clonare la tua voce con pochi input e vogliono parlarne con te

OpenAI si trova di fronte a un grande dilemma. Ha creato un potente modello AI per il clonare la voce, tuttavia, funziona così bene che l’azienda teme il gigantesco potenziale per il suo abuso.

Ecco perché OpenAI esita a rilasciare il modello al pubblico. Invece, l’azienda ha presentato solo un’anteprima che dimostra le capacità di un modello chiamato Voice Engine. Ed è davvero impressionante.

Essenzialmente, la tecnologia di clonazione vocale basata su AI è molto semplice. Il modello ha bisogno solo di due cose: un campione audio della voce originale e un testo che la voce sintetica deve leggere. Alimenta lo strumento con abbastanza campioni e il risultato, sperabilmente, suonerà abbastanza realistico.

Questo è il punto in cui le cose diventano interessanti, e un po’ spaventose. A differenza di altri modelli già disponibili pubblicamente, Voice Engine ha bisogno solo di un audio di 15 secondi del relatore originale. Nonostante l’input molto limitato, le espressioni vocali risultanti sono incredibilmente realistiche.

Questo è anche il motivo esatto per cui OpenAI sta prendendo tempo per decidere cosa fare dopo, citando il suo impegno nello sviluppo di AI sicure e ampiamente benefiche. Uno strumento così potente potrebbe diventare un’arma potentissima nelle mani di attori malintenzionati, specialmente come parte di campagne di disinformazione.

Voice Engine è stato sviluppato per la prima volta alla fine del 2022. Da allora, è stato utilizzato per alimentare le voci preimpostate disponibili nell’API di text-to-speech, così come ChatGPT Voice e Read Aloud. Alla fine dello scorso anno, OpenAI ha iniziato a testare privatamente le sue capacità di clonazione vocale con un piccolo gruppo di partner fidati. L’azienda afferma di essere rimasta impressionata dalle applicazioni sviluppate da questo gruppo.

Uno dei motivi di questi test è capire come le persone e varie industrie possano trarne vantaggio. L’altro motivo è identificare il potenziale del suo abuso e decidere quali misure adottare:

css
"Allo stesso tempo, stiamo adottando un approccio cauto e informato a un rilascio più ampio a causa del potenziale abuso della voce sintetica. Speriamo di avviare un dialogo sulla distribuzione responsabile delle voci sintetiche e su come la società possa adattarsi a queste nuove capacità. Sulla base di queste conversazioni e dei risultati di questi test su piccola scala, prenderemo una decisione più informata su se e come distribuire questa tecnologia su larga scala."

OpenAI ritiene che il rilascio più ampio di questa tecnologia dovrebbe andare di pari passo con politiche e contromisure per prevenirne il suo abuso. Ad esempio, i relatori originali dovrebbero aggiungere la propria voce al servizio consapevolmente, e il servizio dovrebbe essere in grado di verificare questo fatto. Inoltre, i servizi dovrebbero avere “una lista di divieto” di celebrità, politici e altre figure di spicco la cui ricreazione della voce sarebbe vietata.

La dimostrazione di Voice Engine dovrebbe suscitare una conversazione pubblica. L’azienda incoraggia i seguenti passaggi per mitigare possibili problemi:

  • Gradualmente eliminare l’autenticazione basata sulla voce come misura di sicurezza per accedere a conti bancari e altre informazioni sensibili
  • Esplorare politiche per proteggere l’uso delle voci delle persone nell’AI
  • Educare il pubblico a comprendere le capacità e i limiti delle tecnologie AI, compresa la possibilità di contenuti AI ingannevoli
  • Accelerare lo sviluppo e l’adozione di tecniche per tracciare l’origine dei contenuti audiovisivi, in modo che sia sempre chiaro quando si sta interagendo con una persona reale o con un’AI

È utile notare che il modello di OpenAI non sarebbe l’unico strumento di clonazione vocale disponibile pubblicamente. Attualmente, il più popolare è ElevenLabs. Tuttavia, anche con abbastanza campioni audio, i risultati non sono sempre convincenti.

Sembra che Voice Engine sarebbe un grande passo avanti sia per la facilità d’uso che per la qualità risultante della voce clonata.

Fonte della notizia

OpenAI: Clonare la tua voce con pochi input e vogliono parlarne con teultima modifica: 2024-04-02T07:32:50+02:00da puma1973a
Reposta per primo quest’articolo