Até pouco tempo atrás, para quem não era um poliglota, era praticamente impossível ler um texto em outro idioma. E no Brasil, aonde poucas pessoas falam outro idioma além do Português, era quase impossível acompanhar a imprensa internacional por exemplo, sem ajuda de interpretes. Mas isso mudou, e graças a uma ferramenta revolucionária desenvolvida pela gigante das buscas na internet. Sim, estamos falando do Google Tradutor, a salvação dos brasileiros que querem se comunicar com estrangeiros ou apenas ler notícias de sites norte-americanos.

Atualmente, é possível acompanhar em tempo real notícias de outros países ou conversar com os "gringos" através de aplicativos integrados ao Google Tradutor, como o Skype, sem nenhum esforço. Com essa ferramenta maravilhosa podemos traduzir frases, sentenças e até textos grandes apenas copiando e colando no tradutor do Google. Mas muitas pessoas que usam essa ferramenta não sabem como o Google consegue fazer essa mágica de traduzir textos e frases em tempo quase real. Este post é para quem se importa em como isso é feito.

Google Tradutor
Google Tradutor

O Google Tradutor se tornou o recurso obrigatório da internet para traduções curtas e rápidas de idiomas estrangeiros. O serviço foi lançado em abril de 2006, e hoje tem mais de 500 milhões de usuários diários, oferecendo tradução rápida do português do Brasil (ou qualquer outra língua) para seus 103 idiomas suportados.

Como funciona o Google Tradutor?

Originalmente centrado na tradução automática estatística, o Google Translate traduzia textos fazendo referência cruzada à frase em questão, com milhões de documentos retirados das transcrições oficiais das Nações Unidas e do Parlamento Europeu.

Ao contrário do equívoco popular, o Google optou por não contratar especialistas para compilar gramáticas exaustivas para cada língua materna, devido à natureza em constante evolução da linguagem. Qualquer tentativa de fazê-lo se tornaria obsoleta rapidamente.

As traduções originais eram imperfeitas, mas serviam para revelar a intenção ampla da passagem original, mesmo que o Google Translate não pudesse fornecer a tradução fluida e sem falhas esperada de um especialista humano.

Em novembro de 2016, o Google anunciou a transição para uma premissa de tradução automática neural - uma prática de "aprendizado profundo", onde o serviço comparava sentenças inteiras de uma vez, a partir de uma ampla variedade de fontes linguísticas. Isso garantiu uma precisão bem maior, fornecendo o contexto completo em vez de apenas cláusulas de sentença isoladas.

Ao comparar as traduções de português para inglês, e de espanhol para português, o serviço é capaz de deduzir e mapear o relacionamento entre o inglês e o espanhol, e fazer traduções entre esses dois idiomas, um grande salto no entendimento dos computadores da semântica, um processo ainda confundido por expressões metafóricas e expressões peculiares.

O processamento repetido desses cálculos permite ao Google encontrar padrões recorrentes entre palavras em diferentes idiomas, o que significa que sua chance de obter precisão está constantemente melhorando. O resultado que o uso recebe é finalmente refinado para aproximar a passagem da fala real.

O Google Tradutor pode ser integrado a navegadores como o Chrome (que existe como uma função padrão desde fevereiro de 2010), pronunciar o texto destacado em muitos casos e pode localizar palavras nas imagens, usando o reconhecimento óptico de caracteres e identificar automaticamente idiomas desconhecidos.

O Google Tradutor tem um aplicativo para Android desde janeiro de 2010, e uma versão iOS desde fevereiro de 2011. Ele continua sendo a primeira opção de muitas pessoas na hora de traduzir idiomas estrangeiros.

A tecnologia por trás do Google Tradutor

O Google Tradutor é baseado na tradução automática neural (NMT) e na contribuição humana por meio da sua comunidade do serviço. Compreender completamente o NMT requer um pouco de conhecimento prévio sobre redes neurais e aprendizado profundo. Em poucas palavras, o NMT usa milhões de frases traduzidas anteriormente por seres humanos para estabelecer links como gênero e concordância numérica entre palavras no nível da frase e, em seguida, 'aprende' como traduzir frases de estrutura semelhante no futuro.

O Google anunciou sua própria versão do sistema, a Tradução Automática Neural do Google (GNMT), em setembro de 2016, que marcou um avanço significativo em métodos anteriores, como a tradução automática baseada em estatística.

A Comunidade do Google Tradutor funciona de maneira semelhante aos guias locais do Google, que fornecem avaliações e informações, como horários e preços de cafés, restaurantes e atrações no Google. A Comunidade do Google Tradutor é composta por voluntários que revisam as traduções e oferecem traduções curtas de algumas frases. Porém, o GNMT ainda está aprendendo e não capta sutilezas linguísticas perceptíveis ao ouvido humano.

Redes Neurais Recorrentes

Aqui é onde as redes de memória de curto prazo (LSTMs) entram em cena. Os LSTMs são um tipo especial de rede neural recorrente (RNN), capaz de aprender dependências de longo prazo. Todos os RNNs parecem uma cadeia de módulos repetidos. O LSTM transmite dados de módulo para módulo.

RNNs bidirecionais

As redes neurais recorrentes bidirecionais (BRNNs) dividem os neurônios de um RNN regular em duas direções. Uma direção é para o tempo positivo, ou estados avançados. A outra direção é para o tempo negativo, ou para trás. A saída desses dois estados não está conectada às entradas dos estados de direção oposta.

Para entender por que os BRNNs podem funcionar melhor do que um simples RNN, imagine que temos uma sentença de 9 palavras, e queremos prever a quinta palavra. Ela pode conhecer apenas as 4 primeiras palavras, ou as 4 primeiras e as 4 últimas, para uma melhor tradução.

Sequência para sequência

Os modelos de sequência para sequência (também chamados de seq2seq) consiste em dois RNNs: uma rede de codificadores que processa a entrada, e uma rede de decodificadores que gera a saída.

No momento, o Google Tradutor suporta 103 idiomas, portanto, devemos ter 103x102 modelos diferentes para cada par de idiomas. Obviamente, a qualidade desses modelos varia de acordo com a popularidade dos idiomas e a quantidade de documentos necessários para o treinamento dessa rede. A melhor maneira possível é criar um NN para receber qualquer idioma como entrada, e traduzir para qualquer outro idioma.

Dicas para usar melhor o Google Tradutor

Escreva manuscritamente

Digamos que você queira ver uma tradução alemã de uma frase em português. Toque no nome do idioma atual no canto superior esquerdo da tela, e selecione português como idioma de entrada. Em seguida, toque no nome do idioma no canto superior direito da tela e selecione alemão como idioma de saída.

Toque no símbolo de uma caneta (manuscrito) e escreva uma frase ou palavra em português, usando o dedo ou uma caneta. Conforme você escreve os caracteres na tela, o aplicativo tenta prever o que você planeja escrever na íntegra, mostrando possíveis combinações de palavras e letras. Você pode continuar escrevendo ou pode selecionar uma das palavras, se corresponder à que deseja escrever.

Manuscrito no Google Tradutor
Manuscrito no Google Tradutor

O Google Translate mostra a palavra ou frase em alemão, ou qualquer outro idioma que você selecionou. Você pode tocar no botão de seta para a direita ao lado da tradução, e depois tocar no ícone de alto-falante ao lado da frase em alemão para ouvir a pronúncia da palavra ou frase.

Voz para texto

Toque no ícone do microfone na parte superior da tela e fale uma palavra ou frase no aplicativo. O Google Tradutor traduz e emite suas palavras em no idioma selecionado.

Voz - Google Tradutor
Voz - Google Tradutor

Traduzir imagens

Outro recurso interessante é a capacidade do aplicativo de traduzir texto em uma imagem através da câmera do seu dispositivo móvel.

  1. Escolha os idiomas de origem e destino.
  2. Toque no ícone da câmera.
    Para alguns idiomas, você precisará baixar um pacote de idiomas.
  3. Aponte a câmera do seu dispositivo para um sinal, documento ou outro pedaço de texto escrito no idioma de origem.
    O idioma de origem é traduzido para o idioma de destino, visível na tela do seu dispositivo móvel.
  4. Se você não tiver espaço suficiente no dispositivo para baixar um pacote de idiomas, poderá descartar essa opção para obter uma tradução mais manual. Aponte sua câmera para o texto que deseja traduzir, até você ver as palavras "Alinhar texto".
  5. Mantenha o smartphone fixo até a mensagem de texto "Alinhar" desaparecer e o texto ser traduzido.
  6. Pressione o botão do obturador no seu dispositivo.
  7. O aplicativo solicitará que você destaque o texto que deseja traduzir com o dedo, e oferecerá sua melhor estimativa.

Quais são as línguas no Google Tradutor?

  • Africâner
  • Albanês
  • Alemão
  • Amárico
  • Árabe
  • Armênio
  • Azerbaijano
  • Basco
  • Bengali
  • Bielo-russo
  • Birmanês
  • Bósnio
  • Búlgaro
  • Canarês
  • Catalão
  • Cazaque
  • Cebuano
  • Chicheua
  • Chinês
  • Chona
  • Cingalês
  • Coreano
  • Corso
  • Crioulo haitiano
  • Croata
  • Curdo
  • Dinamarquês
  • Eslovaco
  • Esloveno
  • Espanhol
  • Esperanto
  • Estoniano
  • Filipino
  • Finlandês
  • Francês
  • Frísio
  • Gaélico escocês
  • Galego
  • Galês
  • Georgiano
  • Grego
  • Guzerate
  • Hauçá
  • Havaiano
  • Hebraico
  • Hindi
  • Hmong
  • Holandês
  • Húngaro
  • Igbo
  • Iídiche
  • Indonésio
  • Inglês
  • Ioruba
  • Irlandês
  • Islandês
  • Italiano
  • Japonês
  • Javanês
  • Khmer
  • Kinyarwanda
  • Laosiano
  • Latim
  • Letão
  • Lituano
  • Luxemburguês
  • Macedônio
  • Malaiala
  • Malaio
  • Malgaxe
  • Maltês
  • Maori
  • Marata
  • Mongol
  • Nepalês
  • Norueguês
  • Oriá
  • Pachto
  • Persa
  • Polonês
  • Português
  • Punjabi
  • Quirguiz
  • Romeno
  • Russo
  • Samoano
  • Sérvio
  • Sessoto
  • Sindi
  • Somali
  • Suaíle
  • Sueco
  • Sundanês
  • Tadjique
  • Tailandês
  • Tâmil
  • Tártaro
  • Tcheco
  • Telugo
  • Turco
  • Turcomano
  • Ucraniano
  • Uigur
  • Urdu
  • Uzbeque
  • Vietnamita
  • Xhosa
  • Zulu