Adam Molina / Autoridade Android
Você provavelmente já ouviu falar que quanto maior é melhor, mais é mais e que o áudio de 24 bits é melhor que o áudio de 16 bits. Mas o que é áudio de alta resolução e é melhor do que outros tipos de áudio? Veremos o que, se houver, muda à medida que você sobe a escada da taxa de bits.
O que nossos ouvidos podem ouvir
Rita El Khoury / Autoridade Android
Minha orelha
Quase qualquer discussão sobre áudio tem que começar com o ouvido humano. Sabemos que a faixa de frequências que podemos ouvir é de 20Hz a 20kHz, que cai com a idade. Isso significa que qualquer coisa acima ou abaixo disso é inaudível, mas outros fatores estão em jogo além disso. Há também o conceito de mascaramento auditivo. Isso significa que sons altos mascaram os silenciosos. Você não pode ouvir outra pessoa sussurrando em uma festa barulhenta, mesmo que ela esteja por perto, por exemplo. Mesmo o par de fones de ouvido mais sofisticado não mudará esses fatos básicos.
Como resultado, há um limite para o que podemos ouvir em uma determinada gravação. Teoricamente, poderíamos capturar uma faixa mais ampla de frequências e salvá-las, mas isso não nos faria muito bem. As tecnologias de gravação de som, então, usam esses fatos para criar reproduções de alta qualidade de praticamente qualquer coisa.
Alguns conceitos básicos de áudio digital
Ao salvar o áudio em um computador, celular ou qualquer outro dispositivo, o dispositivo deve convertê-lo de um sinal analógico para um digital. Isso é feito usando um conversor analógico-digital (ADC), que pega as ondas sonoras e as representa como uma série de números. Isso é uma simplificação excessiva, mas é a ideia básica que precisamos aqui.
Para que o áudio digital funcione, precisamos de um método para realmente fazer essa conversão. Se pegarmos o valor de uma onda sonora em um determinado momento e anotá-lo, chamado de “amostragem”, podemos usar esses valores para recriar a onda mais tarde. Mas quantas vezes devemos fazer isso? Que intervalos de tempo devemos usar para garantir a captura de todos os detalhes? É aí que entra a matemática conhecida como teorema de amostragem de Nyquist-Shannon.
Os cálculos e algoritmos por trás de Nyquist-Shannon são complexos. Ainda assim, sabemos que amostrar uma onda sonora em uma faixa de frequência limitada duas vezes em um determinado período é suficiente para reproduzi-la perfeitamente. Vamos um pouco acima do alcance da audição humana, só por segurança. Algumas matemáticas básicas nos mostram que 2 x 22.000Hz = 44.000Hz. Mantenha esse número em mente; surge novamente mais tarde.
Mas lembre-se, toda a magia digital do mundo não pode mudar o que o ouvido humano é capaz.
A outra peça desse quebra-cabeça é a taxa de bits. São os números que você vê flutuando, sendo 16 bits ou 24 bits os mais comuns. A maioria das trombetas em torno do áudio de alta resolução tende a enfatizar esse número. Mas o que é um pouco? Na sua forma mais básica, um pouco (abreviação de binary digit) é o que os computadores usam para representar dois valores possíveis: 0 ou 1. Quanto mais bits você tiver, mais dados poderá inserir.
Em relação ao áudio, 16 bits é mais que suficiente para capturar os detalhes para reconstruir as ondas sonoras posteriormente. Por causa de algumas tecnologias históricas, incluindo fitas de áudio digital antigas e discos compactos, obtemos um padrão de 16 bits, 441,1 kHz. Você notará que é um pouco mais alto que os 44kHz que precisamos, então temos todas as peças necessárias para recriar áudio de alta qualidade. Se você não acredita em nós, pode conferir o quanto a própria indústria fonográfica entrou em pânico com o áudio digital dessa qualidade. Se os consumidores pudessem gravar áudio em padrões tão altos, eles se preocupavam, a pirataria seria desenfreada.
Isso realmente não aconteceu, mas é verdade que 16 bits, 44,1kHz é de excelente qualidade. Então, por que a alta resolução aconteceu, é melhor e como funciona?
O áudio de alta resolução diz olá
Quando o CD decolou no final da década de 1980 e durante a década de 1990, ele representava uma tecnologia de ponta. Parece trivial hoje, mas os componentes e o poder de computação gravados para realizar a conversão digital-analógica (DAC) necessária em produtos de áudio doméstico já foram caros e complexos. No entanto, não importava muito, pois os preços caíram rapidamente e a experiência de qualidade de áudio foi realmente excelente.
A década de 1990 também viu a ascensão do formato de arquivo de áudio MP3 e, na década de 2000, tivemos iPods e iTunes e, ainda mais tarde, serviços de streaming de áudio como o Spotify fizeram sucesso. Mas à medida que o poder de computação se tornou mais barato e mais acessível, o áudio de alta resolução também surgiu de empresas como Deezer, Qobuz, Tidal e muito mais. Essa é a versão curta de como chegamos ao cenário de mídia em que estamos hoje.
O áudio de alta resolução também é chamado de áudio “Ultra-HD”, com áudio de 16 bits e 44,1 kHz chamado “HD” ou “qualidade de CD”. Arquivos de alta resolução podem atingir 24 bits e faixas de frequência de 192kHz ou mais. O que isso significa para sua experiência auditiva?
Faixas de frequência mais altas não importam muito
Vamos começar com as faixas de frequência. Sabemos que a audição humana atinge o máximo de 20 kHz, e a faixa de frequência limitada de Nyquist-Shannon correspondente é, portanto, de 44 kHz, portanto, 16 bits, 44,1 kHz é mais que suficiente para cobrir essa faixa.
Em 192kHz, por exemplo, poderíamos ir até 96kHz! Mas nossos ouvidos não podem ouvir frequências tão altas, então isso não significa muito no final do dia. Mesmo que você reproduza perfeitamente essas frequências de qualquer maneira, nunca chegará perto de ouvi-las.
Mas os defensores do áudio de alta resolução alegarão que fazer mais amostras significa mais pontos de dados e menos curvas “degrau” ou “mais suaves” são os resultados. A resposta curta para isso é que Nyquist-Shannon já produz curvas de áudio perfeitamente suaves, mas vamos analisar essa afirmação um pouco mais profundamente.
Nyquist-Shannon já nos permite recriar ondas sonoras suaves.
Sim, um ADC produz uma série de números com valores finitos, não as curvas inclinadas suaves que você encontrará em um disco de vinil. No entanto, o DAC correspondente não produz nada como um gráfico de barras ou uma escada. Se você quiser ver por si mesmo, conecte a saída de um em um osciloscópio. O resultado: ondas sonoras suaves e bonitas. Apenas o DAC mais barato faria um mapeamento um-para-um dos pontos de dados discretos para valores sonoros específicos. Em contraste, qualquer DAC de nível de consumidor fará a matemática de Nyquist-Shannon necessária para reproduzir perfeitamente a onda sonora conforme foi gravada. Você pode incluir ainda mais pontos de dados, mas eles acabarão na mesma curva de som recriada de qualquer maneira. Não fará diferença no final do dia.
Então, por que tantos serviços de áudio de alta resolução nos mostram gráficos de representações digitais supostamente “melhores”? Bem, por um lado, é ótimo para o marketing. Demorou muito tempo para descrever todas as nuances do áudio digital acima. É muito mais rápido vender a ideia de mais é mais do que explicar a realidade por trás de tudo.
Mais bits não significam som maior
Adam Molina / Autoridade Android
É justo, faixas de frequência mais altas não fazem diferença, mas certamente ter mais bits disponíveis deve ser bom, certo? Sim, mas na verdade não. É tecnicamente verdade que capturar mais dados por amostra leva a uma faixa dinâmica mais ampla – a diferença entre sons baixos e altos em uma determinada faixa – mas temos que considerar novamente o incômodo ouvido humano.
Como mencionado, sons mais altos abafam os mais baixos, então mesmo que um arquivo contivesse dados para sons em uma variedade de volumes, apenas os mais altos seriam discerníveis aos nossos ouvidos. Isso é ainda mais verdadeiro se eles estiverem próximos em frequência.
Mais bits não significam muito para seus ouvidos, mesmo se você aumentar o volume.
E se aumentarmos o volume? É aí que mais bits certamente brilharão, certo? Vamos amplificar os sons silenciosos, e eles chegarão aos nossos ouvidos. Exceto que os sons altos também ficarão mais altos. Além disso, há um limite para o quão alto podemos ouvir música antes de literalmente danificar nossa audição permanentemente. Mesmo que você tenha aumentado o botão para 11, de alguma forma você tem que aguentar ouvir música tão alta por um minuto inteiro e ter ouvidos perfeitos como microfones. É o seu cérebro que faz muitas máscaras também, então mesmo que seus ouvidos captassem o som das asas de um mosquito ao mesmo tempo em que um canhão disparou em uma determinada peça, por exemplo, você nunca acabaria percebendo. E agora, sua audição está arruinada.
Então, teoricamente, sim, um arquivo de alta resolução de 24 bits pode ter mais alcance dinâmico do que um de 16 bits, mas você nunca ouvirá a diferença.
A alta resolução vale o alto custo?
Apesar de todas as limitações matemáticas, físicas e psicológicas que nos mostram que o áudio de alta resolução não vale muito, por que cada vez mais serviços de streaming o oferecem? Em suma, porque eles podem cobrar mais por isso.
Uma resposta um pouco mais justa pode ser porque os serviços de streaming estão legitimamente abaixo da qualidade do CD há algum tempo. Isso faz sentido. O tipo de formato de arquivo grande e sem perdas necessário para enviar áudio com qualidade de CD pela Internet consome muita largura de banda e consome muito espaço de armazenamento. Mas como ambos ficam mais baratos, é mais fácil realizar a tarefa. Então, por que não dizer que são melhores que os CDs, que já são velhos?
No entanto, como exploramos acima, a qualidade do CD é boa o suficiente, e a indústria fonográfica sabe disso (e já entrou em pânico com isso antes). Em suma, o áudio de alta resolução não prejudicará nada – exceto talvez sua carteira – mas não ajuda exatamente.