Hadlee Simons / Autoridade Android
Prefiro fortemente assistir a conteúdo de vídeo com legendas e parece que não estou sozinho. Uma pesquisa recente do YouGov descobriu que 38% dos americanos preferem assistir conteúdo com legendas habilitadas, com 63% dos adultos com menos de 30 anos assistindo conteúdo com legendas habilitadas.
Fiquei extremamente feliz quando o Google anunciou seu recurso Live Caption em 2019, inicialmente como um recurso exclusivo do Pixel antes de chegar a outros telefones Android importantes. Infelizmente, com o passar dos anos, percebi que adoro a ideia do recurso, mas na verdade não o uso.
A legenda ao vivo foi inovadora, mas parei de usá-la
Simplificando, Live Caption é um sistema de legendagem em nível de sistema para conteúdo relacionado a áudio em dispositivos Android. Esse recurso de acessibilidade gera legendas automaticamente para quase qualquer tipo de conteúdo com áudio, como vídeos, notas de voz, podcasts e clipes de mídia social.
Talvez a melhor coisa sobre o Live Caption seja que ele é executado localmente e offline, o que significa que você não precisa de nenhum tipo de conexão com a Internet para usá-lo. Isso também traz alguns benefícios de privacidade, já que o Google não envia seus dados aos servidores para obter as legendas. Tudo parece ótimo no papel, mas a prática é outra história.
Live Caption é uma ótima ferramenta de acessibilidade, mas é lenta demais para o meu gosto.
Meu problema com o Live Caption se resume ao fato de que ele é simplesmente muito lento, uma reminiscência das legendas ocultas (CC) ao vivo que você veria nos canais de TV dos EUA. Geralmente descobri que as legendas ficam cerca de dois a três segundos atrás do áudio ao usar a ferramenta para notas de voz ou conteúdo de vídeo. Este não é o pior atraso do mundo e é definitivamente essencial para fins de acessibilidade, mas como alguém sem problemas auditivos, acho irritante assistir conteúdo.
Também é importante notar que a precisão do Live Caption também me deixa em dúvida. Eu poderia ignorar alguns dos problemas de precisão se a velocidade existisse, mas, infelizmente, aqui estamos. Pode-se argumentar que o Google deseja que o recurso esteja mais alinhado com as legendas ocultas tradicionais, em vez de com um mecanismo de legendas em tempo real. Mas, novamente, o termo “Live Caption” contém “Live”.
Minha pequena lista de desejos de legenda ao vivo
Ryan Haines / Autoridade Android
A solução ideal seria que o Google simplesmente acelerasse as coisas, mas é quase desnecessário dizer que é muito mais fácil falar do que fazer. Uma abordagem possível seria o Google aproveitar seus processadores Tensor semipersonalizados vistos em sua linha Pixel para dar um impulso ao Live Caption.
Vimos o Google trazer a digitação por voz offline para seus telefones Pixel recentes, alegando que esse recurso foi habilitado pelo silício TPU no Tensor. Portanto, é lógico que a empresa poderia oferecer um aumento de velocidade e precisão semelhante ao Live Caption, aproveitando seu hardware.
O Google poderia, teoricamente, fornecer uma grande atualização do Live Caption aproveitando as vantagens dos processadores Tensor.
Também não está claro se o Google realmente refinou o modelo de treinamento do Live Caption de forma significativa desde seu lançamento, há quatro anos. Caso contrário, a empresa poderia trazer uma grande atualização de velocidade e/ou precisão com um modelo mais recente para dispositivos não Pixel.
Outra solução potencial para velocidade seria a capacidade de alimentar arquivos de áudio e/ou vídeo em Live Caption. A partir daqui, o Live Caption geraria dados de legenda e usaria esses dados para reprodução posterior desses arquivos. Dessa forma, a empresa seria capaz de dar a ilusão de legendagem em tempo real quando simplesmente se referisse aos dados de legenda existentes e os sincronizasse corretamente.
Na verdade, eu também quero a opção de alimentar arquivos no Live Caption e fazer com que ele gere um arquivo de legenda que possa ser usado em outro lugar. Isso seria ótimo se você deseja reproduzir seus clipes gravados ou vídeos baixados em um dispositivo diferente.
Você está satisfeito com o Live Caption no seu telefone?
2 votos
Está claro que o Live Caption é uma ótima ferramenta para deficientes auditivos. O facto de a Apple e a Microsoft terem copiado esta funcionalidade mostra que a Google teve uma ideia fantástica.
No entanto, é cada vez mais evidente que, embora o Android 14 traga algumas adições de acessibilidade muito necessárias, o Live Caption precisa de melhorias significativas de velocidade e precisão. Portanto, esperamos que o Google traga essas atualizações para a mesa, especialmente agora que um número crescente de pessoas está usando legendas.