Microsoft migliora Azure AI Speech con nuove voci e avatar

newsMicrosoft sta costantemente migliorando il proprio servizio Azure AI Speech, offrendo ai clienti un’esperienza sempre più completa e personalizzabile. Oggi, l’azienda ha annunciato diverse novità entusiasmanti per Azure AI Speech, tra cui un’ampia gamma di nuove voci realistiche e avatar di chat.

Nuove voci realistiche con intelligenza artificiale

Microsoft ha aggiunto un numero maggiore di voci multilingua su Azure AI Speech. Queste voci, create a partire da diverse lingue sorgenti, puntano ad arricchire l’interazione con l’utente grazie a una maggiore varietà di timbri e personalità. L’azienda descrive così i vantaggi di queste nuove voci:

“Grazie alle interazioni autentiche e naturali, promettono di trasformare l’esperienza con i chatbot attraverso la nostra tecnologia.”

Tra le nuove voci disponibili troviamo:

  • Inglese (Regno Unito) – Donna (en-GB-AdaMultilingualNeural)
  • Inglese (Regno Unito) – Uomo (en-GB-OllieMultilingualNeural)
  • Portoghese (Brasile) – Donna (pt-BR-ThalitaMultilingualNeural)
  • Spagnolo (Spagna) – Donna (es-ES-IsidoraMultilingualNeural)
  • Spagnolo (Spagna) – Donna (es-ES-ArabellaMultilingualNeural)
  • Italiano (Italia) – Donna (it-IT-IsabellaMultilingualNeural)
  • Italiano (Italia) – Uomo (it-IT-MarcelloMultilingualNeural)
  • Italiano (Italia) – Uomo (it-IT-AlessioMultilingualNeural)

Microsoft ha inoltre aggiunto due nuove voci statunitensi ottimizzate per i call center aziendali:

  • Inglese (Stati Uniti) – Donna (en-US-LunaNeural)
  • Inglese (Stati Uniti) – Uomo (en-US-KaiNeural)

Tutte queste voci sono attualmente disponibili in anteprima pubblica nelle regioni East US, West Europe e South East Asia di Azure.

Nuovi avatar di chat e miglioramenti audio

Oltre alle nuove voci, Microsoft ha introdotto cinque nuovi avatar di chat dall’aspetto umano e molto realistici per gli utenti di Azure AI Speech. L’azienda ha annunciato anche alcuni miglioramenti nella qualità del sonoro degli avatar:

  • Il modello Azure OpenAI GPT-4o è ora integrato nell’applicazione per avatar di chat live in Speech Studio. Ciò consente agli utenti di sperimentare direttamente la funzionalità collaborativa dell’avatar di chat live e di Azure OpenAI GPT-4o. Viene inoltre fornito codice di esempio per facilitare l’integrazione dell’avatar text-to-speech con il modello GPT-4o.

Text Stream API per velocizzare la sintesi vocale

Infine, Microsoft ha presentato una nuova Text Stream API progettata per accelerare le funzioni text-to-speech.

“La Text Stream API rappresenta un significativo passo avanti rispetto alle tradizionali tecnologie TTS non basate su streaming di testo. Accettando l’input in segmenti (al contrario delle risposte intere), riduce notevolmente la latenza che in genere ostacola la sintesi audio fluida. La Text Stream API non solo riduce al minimo la latenza, ma migliora anche la fluidità e la reattività delle uscite vocali in tempo reale, rendendola la scelta ideale per applicazioni interattive, eventi live e dialoghi reattivi basati sull’intelligenza artificiale.”

Le novità introdotte da Microsoft con Azure AI Speech promettono di offrire agli sviluppatori e alle aziende un ventaglio ancora più ampio di strumenti per creare esperienze utente sempre più realistiche e coinvolgenti.

Fonte della notizia

Microsoft migliora Azure AI Speech con nuove voci e avatarultima modifica: 2024-07-03T07:30:27+02:00da puma1973a
Reposta per primo quest’articolo