O que acabou de acontecer? O Google Translate adicionou suporte para 110 novos idiomas no que a empresa alega ser sua maior expansão até agora. Os novos idiomas suportados, que incluem Afar, Cantonês, Manx, Nko, Punjabi (Shahmukhi), Tamazight (Amazigh) e Tok Pisin, representam mais de 614 milhões de falantes, ou cerca de 8% da população mundial.
O Google está usando IA para expandir o número de idiomas suportados como parte de sua “Iniciativa dos 1.000 Idiomas”, anunciada em 2022. A empresa afirma estar comprometida em construir modelos de IA que darão suporte aos 1.000 idiomas mais falados ao redor do mundo.
Para adicionar suporte para os novos idiomas, o Google usou seu modelo de idioma grande PaLM 2, que também potencializa recursos de IA generativa, como resumo de e-mail no Gmail e reescrita no Google Docs. O PaLM 2 é treinado em texto multilíngue paralelo e, de acordo com o Google, ajuda seu serviço de tradução a aprender idiomas que são intimamente relacionados entre si de forma mais eficiente.
Estamos usando IA para adicionar mais de 100 novos idiomas ao Google Tradutor, nossa maior expansão de todos os tempos. Saiba mais ↓ https://t.co/jLGouceAIG
– Google (@Google) 27 de junho de 2024
Os idiomas recém-adicionados incluem alguns dos principais que são usados por mais de 100 milhões de pessoas, enquanto outros são falados por pequenas comunidades indígenas. Alguns dos idiomas quase não têm falantes nativos, mas o Google espera que esta atualização ajude seus esforços de revitalização.
Esta também é a maior expansão de línguas africanas do Google Tradutor até o momento, com quase um quarto das novas línguas, como afar, fon, kikongo, luo, ga, swati, venda e wolof, vindas do continente.
Na outra ponta do espectro, está o cantonês, que é uma língua massiva com milhões de falantes na China, Hong Kong e Macau. No entanto, ele não fazia parte do Google Translate até agora, apesar de ser um dos idiomas mais solicitados, pois frequentemente se sobrepõe ao mandarim na escrita, dificultando encontrar dados e treinar modelos.
A atualização marca a expansão mais significativa do Google Translate desde 2022, quando o serviço adicionou suporte para 24 novos idiomas usando Zero-Shot Machine Translation. Acrescentou línguas como o Mizo, nativo de cerca de 800 mil pessoas no nordeste da Índia, e o Lingala, usado por mais de 45 milhões de pessoas em toda a África Central. Também introduziu suporte para várias línguas indígenas das Américas, como quíchua, guarani e aimará, bem como um dialeto inglês da Serra Leoa chamado Krio.