Hadlee Simons / Autoridade Android
TL;DR
- O Google publicou uma postagem no blog detalhando o que aconteceu na criação do novo recurso Speaker Labels em Pixels com Tensor.
- O Google também revelou que está trabalhando para tornar o recurso menos consumidor de energia.
O Google adicionou recentemente rótulos de alto-falante ao super útil aplicativo Pixel Recorder. O recurso reconhece automaticamente diferentes falantes em uma gravação e atribui a eles rótulos exclusivos na transcrição. Os usuários podem atribuir nomes de alto-falante a esses rótulos. Parece tão simples. Mas a solução no dispositivo do Recorder para rotular alto-falantes teve muito pensamento e trabalho.
O Google explica em uma postagem de blog que os rótulos de alto-falante são alimentados por seu novo sistema de diarização de alto-falante chamado Turn-to-Diarize. Ele aproveita vários modelos e algoritmos de aprendizado de máquina altamente otimizados para permitir o registro de horas de áudio em tempo real enquanto usa recursos computacionais limitados em telefones Pixel.
O sistema pode detectar alterações de alto-falante usando um modelo de codificador que extrai características de voz de cada alto-falante. Um algoritmo de agrupamento de vários estágios anota rótulos de alto-falante para cada alto-falante.
O Google explica que as gravações de áudio do aplicativo Recorder podem durar apenas alguns segundos ou até 18 horas. À medida que o modelo consome mais áudio, ele se torna mais confiante na previsão dos rótulos dos alto-falantes. Ocasionalmente, ele também faz correções em rótulos de alto-falantes de baixa confiança previstos anteriormente. O aplicativo Recorder atualiza automaticamente os rótulos dos alto-falantes na tela durante a gravação para refletir as previsões mais recentes e precisas.
Parece bastante mágico que seu telefone possa fazer tudo isso, certo?
O Google diz que, no futuro, o recurso Speaker Labels consumirá menos energia graças às mudanças que está fazendo. Atualmente, o sistema funciona no bloco de CPU dos chips Tensor do Google. A empresa agora está trabalhando para delegar mais tarefas computacionais ao bloco TPU, tornando o sistema de diarização mais eficiente em termos de energia.