DR
- Os pesquisadores estão trabalhando em algoritmos de aprendizagem profunda que permitirão aos usuários de fones de ouvido selecionar quais sons ouvirão.
- Os usuários poderão escolher entre 20 classes de sons, incluindo sirenes, choros de bebês, cantos de pássaros e muito mais.
- Os pesquisadores planejam criar uma versão comercial da tecnologia.
O cancelamento de ruído nos fones de ouvido é ótimo quando você deseja bloquear todo o ruído ao seu redor. Mas e quando você quiser ouvir certos sons? Modos como Ambient Sound no WF-1000XM5 da Sony permitem que você ouça o que está ao seu redor, mas também permite que tudo entre. Uma nova tecnologia projetada para fones de ouvido poderá em breve permitir que você escolha quais sons você pode ouvir em seu ambiente.
Pesquisadores da Universidade de Washington estão atualmente trabalhando em algoritmos de aprendizagem profunda que permitirão aos usuários de fones de ouvido selecionar quais sons ouvirão em tempo real, de acordo com Explorar tecnologia. Apelidada de “audição semântica”, a tecnologia de fone de ouvido irá capturar o áudio e enviá-lo ao telefone conectado para cancelar todos os sons ambientais, exceto aqueles que você escolheu.
Parece que o recurso funcionará por comando de voz ou por aplicativo de smartphone. Quando ativado, os usuários poderão escolher entre 20 classes de sons, alguns dos quais incluem choro de bebê, sirenes, fala, chilrear de pássaros e muito mais.
Criar uma IA que possa classificar esses sons com rapidez e precisão não é fácil. Como explica o autor sênior e professor da UW na Escola Paul G. Allen de Ciência da Computação e Engenharia, Shyam Gollakota:
O desafio é que os sons que os usuários de fones de ouvido ouvem precisam ser sincronizados com seus sentidos visuais. Você não pode ouvir a voz de alguém dois segundos depois de falar com você. Isso significa que os algoritmos neurais devem processar sons em menos de um centésimo de segundo.
A velocidade com que esse processamento precisa ocorrer também significa que a audição semântica não pode ser feita através da nuvem. Para que o recurso funcione conforme o esperado, o processamento deve ser feito em um dispositivo, como o telefone conectado. A agência ressalta ainda que, como os sons chegam ao seu ouvido em momentos diferentes, a tecnologia também precisa levar em conta os atrasos.
Até agora, a audição semântica foi testada em escritórios, ruas e parques. No geral, o recurso foi um sucesso, mas supostamente teve dificuldades com sons que compartilham certas propriedades. Por exemplo, a IA teve dificuldade em separar a música vocal da fala. No entanto, mais formação sobre dados do mundo real poderia melhorar esta situação.
Os pesquisadores apresentaram suas descobertas e planejam criar uma versão comercializada do recurso no futuro. No entanto, parece que não há um cronograma para quando esse dia chegará. O que você acha da possibilidade de audição semântica chegar aos futuros fones de ouvido ANC? Deixe-nos saber nos comentários abaixo.