Google Cloud lança solução que permite converter texto em 32 vozes

28 de março de 2018 Redação 0 comentários

Text-to-Speech chega com base em versão atualizada do WaveNet, executada na infraestrutura Google Cloud TPU, que gera formas de onda brutas 1.000 vezes mais rápidas que o modelo original

O Google Cloud expande seu portfólio de produtos em inteligência artificial e lança o Text-to-Speech, nova ferramenta que permite aos clientes a conversão de fala em texto em mais de 32 vozes em 12 idiomas diferentes, inclusive português. É a primeira vez que a empresa disponibiliza o WaveNet, um produto inovador de pesquisa de síntese de voz da DeepMind, para o público.

“Muitos produtos do Google como, por exemplo, o Google Assistant, Search e Maps, vêm com uma síntese de texto para fala incorporada, de alta qualidade, que produz fala com som natural. Os desenvolvedores nos disseram que gostariam de adicionar texto para voz a seus próprios aplicativos. Por isso, hoje estamos trazendo essa tecnologia para o Google Cloud Platform, com o Cloud Text-to-Speech”, declara Dan Aharon, gerente de produto de Google Cloud AI

Além de permitir que os usuários escolham entre 32 vozes diferentes de 12 idiomas, o Cloud Text-to-Speech também traz pronúncias mais assertivas em textos complexos, como nomes, datas, horários e endereços. O produto, já utilizado por empresas como Cisco e Dolphin ONE, permite a personalização do tom, a taxa de fala e o ganho de volume da voz, além de oferecer suporte a diversos formatos de áudio, incluindo MP3 e WAV.

Com o Cloud Text-to-Speech é possível selecionar vozes de alta fidelidade construídas com base no o WaveNet, um modelo generativo para áudio bruto criado pela DeepMind. O WaveNet traz uma fala mais natural, fazendo com que os usuários prefiram o seu áudio ao invés de outras tecnologias de conversão de texto em voz que já existem no mercado.

noticiasaominuto

Google Cloud lança solução que permite converter texto em 32 vozes

Text-to-Speech chega com base em versão atualizada do WaveNet, executada na infraestrutura Google Cloud TPU, que gera formas de onda brutas 1.000 vezes mais rápidas que o modelo original

Curtir isso:

Deixe uma respostaCancelar resposta

Text-to-Speech chega com base em versão atualizada do WaveNet, executada na infraestrutura Google Cloud TPU, que gera formas de onda brutas 1.000 vezes mais rápidas que o modelo original

Compartilhe isso:

Curtir isso:

Deixe uma respostaCancelar resposta