Pesquisadores da Meta, dona do Facebook, Instagram e WhatsApp, desenvolveram um sistema de inteligência artificial que traduz de forma quase instantânea comunicações por voz ou texto em até 101 idiomas.
O modelo de aprendizado de máquina chamado SEAMLESSM4T, cujos resultados foram descritos em publicação na revista Nature na quarta-feira (15), superou sistemas de última geração semelhantes em 23% na avaliação linguística Bleu (Bilingual Evaluation Understudy) em tarefas de fala para fala.
O ganho de agilidade se deve à abordagem de ponta a ponta do modelo, com a qual, por exemplo, o inglês falado é traduzido diretamente para o alemão falado, sem a necessidade de transcrição e tradução do texto escrito, como geralmente ocorre em aplicações mais populares.
Inspirada no Peixe Babel, espécie de tradutor universal do livro “O Guia do Mochileiro das Galáxias”, a IA consegue reconhecer a fala de 101 idiomas, o texto de 96 e gerar fala traduzida com voz sintética em 36.
Como modelos de aprendizado de máquina são treinados com grandes bases de dados, seus resultados serão reflexo do que estiver contido nelas. No caso da tradução automática, o conteúdo em inglês disponível na internet é muito maior do que a maioria das outras línguas, o que limita as possibilidades.
Ao todo, o modelo de tradução da fala usou 4,5 milhões de horas de gravação em diversas línguas, o equivalente a 513 anos.
Segundo o artigo da Nature, os pesquisadores da Meta concluíram que desenvolver sistemas multilíngues pode levar a um desempenho maior mesmo na tradução de idiomas com menos dados disponíveis.
Marta Costa-jussà, cientista da computação da Meta e coautora do artigo, diz que o desempenho foi melhorado não só por esse aumento do número de idiomas, mas também pela integração de diferentes combinações de texto e fala, facilitando a tarefa associativa da IA.
“Esses são fatores-chave para a melhoria”, disse ela à publicação. Segundo Costa-jussà, o tempo de resposta do tradutor automático é geralmente de alguns segundos, comparável ao desempenho de profissionais da área.
O artigo afirma que o sistema foi ajustado para limitar a ocorrência de viés de gênero e “toxicidade”, evitando que ele traduza termos neutros em uma língua, como “nurse” em inglês (enfermeiro ou enfermeira) para equivalente com gênero em outros idiomas.
Sabine Braun, pesquisadora em estudos de tradução na Universidade de Surrey em Guildford, no Reino Unido, disse à Nature que o projeto é interessante e importante, mas que deveria haver uma análise maior sobre tradução automática antes que ela possa ser adotada em contextos médicos e jurídicos.
É também o argumento da pesquisadora Allison Koenecke, da Universidade Cornell, que alerta para as limitações destes sistemas de tradução em ambientes onde a precisão é essencial.
“Embora as tecnologias de fala possam ser mais eficientes e econômicas na transcrição e tradução do que os humanos (que também estão sujeitos a preconceitos e erros), é imperativo entender as maneiras pelas quais essas tecnologias falham —de forma desproporcional para alguns grupos demográficos”, escreveu Koenecke.
A Meta disponibilizou o SEAMLESSM4T no formato open-source (de código aberto) para usos não comerciais, seguindo o sucesso do modelo de linguagem Llama entre pesquisadores e entusiastas.