O Microsoft Teams ganhou diversos recursos nos últimos 2 anos devido à pandemia que obrigou diversas empresas a fazer com que seus funcionários trabalhassem em suas casas, modelo de trabalho conhecido como home office. Entretanto, até o momento, não havia funcionalidades pensadas para diminuir as interferências que normalmente se tem ao trabalhar em casa. Felizmente isso está mudando agora, pois foram anunciadas funções para o aprimoramento da voz captada utilizando inteligência artificial (IA) como, por exemplo, a de suprimir ecos e ruídos gerais do ambiente.

Através do aprendizado de máquina (machine learning), a Microsoft melhorou a qualidade do som captado na sala do usuário retirando ecos ou mistura de sons da fala com ruídos. Durante entrevista com o site TheVerge, o gerente do programa de conversação inteligente e comunicação em nuvem da Microsoft, Robert Aichner, disse:

Embora tenhamos tentado o nosso melhor com o processamento de sinal digital para fazer um bom trabalho no Teams, agora começamos a usar o aprendizado de máquina pela primeira vez para criar cancelamento de eco, onde você pode realmente reduzir o eco de todos os diferentes dispositivos.

Como foi desenvolvida a IA para melhorar a comunicação no Microsoft Teams

Após mais de 30 mil horas de falas para treinar a inteligência artificial (IA) do Microsoft Teams, foi possível aplicar a metodologia de aprendizado de máquina (machine learning) para reduzir ecos e aumentar a nitidez das vozes das pessoas. Foram utilizados diversos dispositivos para capturar o áudio através de um programa de testes (crowdsourcing), onde usuários do Teams são pagos para gravar suas vozes e reproduzir o áudio em seus dispositivos. Robert relata sobre os testes realizados dizendo:

Também simulamos cerca de 100.000 salas diferentes... a acústica da sala desempenha um papel importante no cancelamento de eco.

Como funciona a IA do Microsoft Teams para aprimorar o áudio

Ao detectar reverberações em uma sala, o Teams processará o áudio para forçar o som a parecer que os participantes da chamada estejam utilizando um microfone condensador ao invés de deixar que o eco surja e deixe a conversa confusa. Outro recurso interessante é a capacidade de fazer com que a sobreposição de vozes (pessoas falando ao mesmo tempo na chamada) não fique confusa e seja possível entender o que cada um está dizendo. Por último, ainda temos o aprimoramento da supressão de ruídos através de IA.

É importante salientar que todo o processamento citado acima é feito localmente ao invés de utilizar a nuvem, proporcionando uma privacidade maior para os usuários.

Lançamento e disponibilidade

Todas as melhorias de fala do Microsoft Teams que foram citadas já estão disponíveis nos EUA e deverão ser disponibilizadas para todos aos poucos.