Lily Katz / Autoridade Android
Quando o MP3 player decolou no final da década de 1990, o formato em si entrou na consciência pública de uma forma que muitos outros não fizeram – com talvez o documento do Word sendo uma exceção. Mas o que é um formato de áudio, afinal, e por que você deveria se importar?
Este guia abordará alguns dos formatos mais populares usados pelos serviços de streaming de áudio atualmente e explicará suas diferenças.
O que é um formato de arquivo de áudio?
Um arquivo de áudio digital é como o conteúdo gravado é salvo em um computador, media player, smartphone ou outro dispositivo. O áudio digital é, em seu nível mais básico, uma série de números que um dispositivo pode usar para recriar as ondas sonoras. Existem várias maneiras de fazer isso e compactar (ou não) os dados resultantes. Sabemos que ao amostrar uma onda sonora no processo de conversão analógica para digital com pelo menos 16 bits a 44,1kHz podemos reproduzir perfeitamente o sinal capturado novamente mais tarde. Isso se deve a uma matemática chamada teorema de amostragem de Nyquist-Shannon. Podemos alcançar taxas de bits e faixas de frequência mais altas, mas se alguém pode ouvir a diferença – mesmo que os melhores fones de ouvido – seja discutível na melhor das hipóteses.
Se apenas salvarmos esses dados como estão (conhecido como modulação por código de pulso ou PCM), o arquivo ocupará muito espaço. É por isso que as formas de compressão de áudio com e sem perdas foram desenvolvidas. O áudio com perdas lança frequências de áudio que nossos ouvidos não conseguem ouvir, enquanto o sem perdas preserva todas elas. Formatos de áudio com perdas também podem usar outros truques para comprimir ainda mais o áudio, que abordaremos um pouco mais tarde.
Como a maioria das pessoas hoje em dia acessa suas músicas por meio de serviços de streaming, os formatos de arquivo compactados e com perdas são a forma predominante de distribuição de conteúdo. Tudo bem se você estiver ouvindo casualmente, mas algumas pessoas exigem o máximo em qualidade. Como resultado, um número crescente de opções de streaming de alta qualidade e até mesmo sem perdas está agora disponível. Mas não há como contornar o fato de que os formatos com perdas ocupam menos espaço e consomem menos dados móveis, como o gráfico abaixo deixa claro.
Tamanhos de arquivo estéreo (16 bits 44,1 kHZ) | WAV | AIFF | FLAC (típico) | MP3 (320Kbps) | MP3 (192 Kbps) |
---|---|---|---|---|---|
Tamanhos de arquivo estéreo (16 bits 44,1 kHZ)
1 minuto |
WAV
10,6 MB |
AIFF
10,6 MB |
FLAC (típico)
6,4 MB |
MP3 (320Kbps)
2,4 MB |
MP3 (192 Kbps)
1,4 MB |
Tamanhos de arquivo estéreo (16 bits 44,1 kHZ)
4 minutos |
WAV
41,6 MB |
AIFF
41,6 MB |
FLAC (típico)
24,9 MB |
MP3 (320Kbps)
9,6 MB |
MP3 (192 Kbps)
5,6 MB |
Tamanhos de arquivo estéreo (16 bits 44,1 kHZ)
1 hora |
WAV
635 MB |
AIFF
635 MB |
FLAC (típico)
381 MB |
MP3 (320Kbps)
144 MB |
MP3 (192 Kbps)
84 MB |
MP3
O formato de arquivo de áudio MP3 já reinou supremo quando se tratava de baixar músicas. Na verdade, o formato é tão sinônimo de soluções de música móvel que “MP3 player” agora é genérico para um dispositivo de reprodução de áudio. No entanto, hoje em dia é menos proeminente por várias razões. Ainda está pendurado, no entanto. Compreender os arquivos MP3 também pode nos ajudar a entender outros formatos com mais facilidade, então vamos começar por aqui.
Um arquivo MP3 é um arquivo de áudio com perdas, o que significa que descarta dados que nossos ouvidos não podem ouvir. Quase todo ser humano tem um alcance de audição em algum lugar na faixa de 2oHz a 20kHz. O limite superior na verdade diminui com a idade, mas em geral esse é o intervalo dentro de cada ruído que você ouvirá mentiras. Como sabemos que outras frequências são supérfluas, o MP3 descarta todas as frequências fora dessa faixa.
Para economizar ainda mais espaço, os arquivos MP3 usam ainda mais truques. Os engenheiros de áudio usam algoritmos de modelagem de ruído baseados em efeitos psicoacústicos do ouvido e do cérebro humanos para remover partes da música que não deveríamos ouvir. Por exemplo, o cérebro não consegue diferenciar entre duas frequências que estão próximas uma da outra. Além disso, o ouvido humano adulto luta para identificar a direção dos sons de alta frequência. Também começa a perder sensibilidade acima de 16kHz. Além disso, sons altos podem mascarar os mais silenciosos. Tudo isso pode ser removido com pouca ou nenhuma diferença perceptível para o ouvinte final.
Basicamente, os arquivos MP3 removem frequências que não podemos ouvir e frequências que podemos ouvir isoladamente, mas não por causa da maneira como são combinadas em uma música específica.
Um MP3 divide uma trilha em 576 quadros de amostra e as Transformadas Rápidas de Fourier (FFT) são usadas para obter dados de frequência desses quadros. Os dados de frequência são então analisados para ver se existem oportunidades para aplicar as regras de compressão com base na audição humana, conforme descrito acima. Nesse caso, essas porções são arredondadas para baixo (quantizadas) para taxas de bits mais baixas, o que ajuda a economizar espaço. Os dados sobre como restaurar cada quadro para sua representação de onda sonora completa são salvos em um cabeçalho de 32 bits.
A taxa de bits determina o tamanho máximo de arquivo permitido para cada quadro. Quanto mais agressiva a compressão, maior a probabilidade do algoritmo remover algo que é audível. Além disso, esse tipo de filtragem e corte não é perfeito e a quantização pode deixar artefatos que algumas pessoas podem ouvir. Essa compressão psicoacústica com perdas é seguida por uma compressão de codificação Huffman sem perdas que é semelhante ao arquivo .zip para economizar mais espaço.
Se isso soa muito complicado, a conclusão é que os arquivos MP3 removem frequências que não podemos ouvir e que teoricamente poderíamos ouvir isoladamente, mas não em uma música específica devido ao mascaramento auditivo. Isso pode levar a tamanhos de arquivo muito pequenos. Se for feito de forma muito agressiva ou com uma taxa de bits muito baixa, a qualidade pode sofrer. Como resultado, o MP3 não é mais tão popular para streaming.
Formatos de áudio AAC, M4A e OGG Vorbis
Zak Khan / Autoridade Android
A compressão de áudio pode assumir muitas formas, e outros formatos foram desenvolvidos. Eles usam algoritmos e técnicas ligeiramente diferentes para realizar a tarefa, então não podemos compará-los com base apenas na taxa de bits.
OGG Vorbis é uma alternativa de código aberto ao MP3. Ele ainda usa FFT e métodos semelhantes para analisar e quantizar informações de frequência mascaráveis, mas emprega um algoritmo diferente. O Vorbis também leva em consideração o piso de ruído para melhorar o desempenho de baixa taxa de bits. O Spotify usa esse formato a 320kbps.
Há também o AAC, usado pela Apple Music, Tidal, Pandora e YouTube Music. É uma evolução do formato MPEG (MP3) e permite taxas de amostragem mais altas de até 96kHz. Além disso, ele pode alternar dinamicamente comprimentos de quadro entre 1024/960 ou 128/120 amostras para melhor resolução quando necessário. Ele funciona melhor em tamanhos de arquivo menores do que MP3s, para inicializar.
Outro tipo de arquivo que você pode encontrar é o arquivo M4A. Esses arquivos são codificados usando o formato AAC e, em seguida, armazenados em um contêiner MPEG-4, daí a extensão do arquivo .m4a. A Apple criou esse tipo como resposta ao MP3. Embora não seja tão universalmente suportado, não é raro de forma alguma.
Por esses motivos, você não pode comparar diretamente as taxas de bits e afirmar que uma taxa de bits mais alta seria um arquivo com melhor som entre AAC e MP3, por exemplo. Arquivos AAC e M4A com taxas de bits mais baixas ainda podem soar bem enquanto ocupam menos espaço.
Isso torna formatos como OGG Vorbis e AAC atraentes para serviços de streaming. Eles podem fornecer som de alta qualidade enquanto consomem menos dados móveis.
FLAC
Se você não deseja descartar nenhuma frequência, mas ainda deseja um arquivo menor que dados brutos, é aí que entra o FLAC. O FLAC não descarta nenhuma parte de uma gravação e, portanto, é chamado de sem perdas. A versão da Apple de um codec sem perdas é chamada ALAC. Ambos os codecs funcionam como um arquivo .zip. Se você já comprimiu e descompactou uma coleção de arquivos, entenderá a ideia básica. Nada é removido, o arquivo FLAC apenas procura maneiras de consolidar padrões e dados repetidos e esses são reconstruídos na reprodução.
Ainda assim, os arquivos FLAC nunca serão tão pequenos quanto os arquivos MP3 ou AAC. Mas à medida que a largura de banda fica mais barata e acessível, um número crescente de serviços de streaming oferece a capacidade de transmitir usando FLAC. Geralmente, são assinaturas “HD”, “Ultra HD” ou “HiFi”. Amazon Music Unlimited, Tidal HiFi e HiFi Plus, Deezer Premium e Qobuz oferecem streaming FLAC.
Esteja ciente de que os arquivos FLAC são maiores que os formatos com perdas e podem consumir muitos dados. Se você salvá-los em um dispositivo, eles também começarão a ocupar espaço de armazenamento rapidamente.
Formatos de áudio WAV e AIFF
As gravações de áudio podem ser apenas PCM puro salvo em um dispositivo, que é essencialmente o que são WAV (no Windows) e AIFF (no Mac). Eles representam algumas das primeiras formas de armazenamento de música digital. Esses arquivos não têm compactação ou qualquer outra coisa aplicada a eles. Na verdade, você pode descobrir o tamanho do arquivo com bastante facilidade com a seguinte equação:
Tamanho do PCM = taxa de amostragem X (bits por amostra /8) X tempo em segundos X número de canais
Como resultado, esses formatos podem levar a tamanhos de arquivo incrivelmente grandes. Isso significa que eles são bastante raros para streaming e download, embora serviços como HDtracks os ofereçam. O que esses arquivos são realmente úteis é na mixagem e edição de áudio. Como nenhuma conversão, compactação ou qualquer outra coisa ocorreu, é fácil e rápido editar faixas, salvá-las e editá-las novamente conforme necessário.