A Meta, empresa responsável pelo Facebook, expandiu seu sistema de conversão de voz para texto capaz de fazer o contrário também. A novidade foi anunciada pela Meta em seu site, onde é dito que agora o mecanismo de conversão desenvolvido pela empresa suporta agora mais de 1.100 idiomas, que é dez vezes mais do que se tinha antes. Houve também o aprimoramento do modelo de identificação de idiomas, que agora consegue identificar 4000 línguas.

Meta apresenta ferramenta para converter texto em voz

Sistema de transcrição entre textos e vozes em diversos idiomas da Meta é aprimorado e ganha suporte a 1100 línguas. Fonte: Meta
Sistema de transcrição entre textos e vozes em diversos idiomas da Meta é aprimorado e ganha suporte a 1100 línguas. Fonte: Meta

Chamado de Massively Multilingual Speech (MMS), o projeto da Meta tem como objetivo fazer com que dispositivos consigam entender e produzir falas, trazendo uma acessibilidade maior em diversas situações em que o conhecimento de determinado idioma seja um impeditivo para se comunicar ou compreender algo. Anteriormente, o sistema desenvolvido pela empresa suportava somente 100 idiomas, que representa apenas uma fração dos mais de 7 mil idiomas conhecidos no mundo, mas agora houve um grande salto para 1100 línguas.

O MMS possui um bom desempenho comparado aos modelos de linguagem já existentes para transcrição entre textos e vozes em diferentes línguas, segundo a Meta. Felizmente, a empresa anunciou que está compartilhando seus modelos e o código deles para que outros na comunidade de pesquisa possam criar diferentes softwares a partir deste projeto.

Por que criar um modelo de fala disponível para vários idiomas?

Segundo a Meta, diversos idiomas "correm perigo de desaparecer, e as limitações das tecnologias atuais de reconhecimento e geração de fala só irão acelerar essa tendência". Através do Massively Multilingual Speech (MMS), a empresa quer "facilitar o acesso das pessoas às informações e permitir que elas usem dispositivos em seu idioma preferido". De acordo coma companhia, há planos para desenvolver "um único modelo possa resolver diversas tarefas de fala para todos os idiomas".

Hoje a Meta tem diversos modelos de separados para reconhecimento de fala, síntese de fala e identificação de idioma. Porém, a empresa pretende unificar tudo isso em um único modelo, entregando assim um desempenho geral melhor.