Calvin Wankhede / Autoridade Android
Você já desejou poder criar música sem nenhum conhecimento de teoria musical ou instrumentos? Agora isso é possível, graças a um novo experimento de IA do Google. Apelidado de MusicLM, é um novo tipo de IA generativa que pode criar novas músicas. É muito parecido com os geradores de imagens de IA, onde você simplesmente digita algumas linhas de texto e obtém uma bela arte em troca. Então, quão bem o novo MusicLM do Google funciona e como você pode experimentá-lo? Aqui está tudo o que você precisa saber.
O que é o MusicLM?
MusicLM é um modelo de linguagem capaz de gerar música com base em uma descrição baseada em texto. Por exemplo, o prompt “Música calma e suave que eu possa estudar” gerará uma faixa lo-fi. Da mesma forma, um prompt na linha de “faixa orquestral épica que cria tensão em uma cena de filme de ação e aventura” produz música com um senso distinto de urgência que se sentiria em casa em O Exterminador do Futuro ou Missão Impossível.
Embora seu lançamento atual seja limitado, o MusicLM pode fazer muito mais do que apenas transformar texto em música. Em um trabalho acadêmico, os pesquisadores do Google demonstraram que ele pode gerar áudio adaptado a imagens e pinturas. E no futuro, você pode até converter um clipe gravado de seu cantarolar em uma faixa de música completa.
O MusicLM agora pode transformar descrições de texto em áudio. O Google também está trabalhando para adicionar suporte para entradas de imagem e melodia.
O Google treinou o MusicLM em mais de 200.000 horas de música abrangendo mais de 5.500 clipes. Estes foram categorizados manualmente por especialistas humanos, ajudando o modelo de aprendizado de máquina a distinguir jazz de techno e até épocas e estilos específicos (pop dos anos 90) (música de dança afro-cubana). A empresa lançou o conjunto de dados de áudio rotulado com legendas no Kaggle, permitindo que outros desenvolvedores de IA desenvolvam suas próprias ferramentas de IA.
Não, o Google lançou o MusicLM gratuitamente, mas você precisará entrar em uma lista de espera para obter acesso, conforme descrito em uma seção posterior deste artigo.
Quão bem o MusicLM funciona?
Calvin Wankhede / Autoridade Android
Vou orientá-lo sobre como se inscrever no MusicLM na próxima seção, mas deixe-me primeiro explicar como é usá-lo. No estado atual do MusicLM, você só pode digitar uma descrição e clicar no botão gerar. Pense nisso como Midjourney, mas em vez de quatro imagens geradas por IA, você obtém duas faixas de música de 20 segundos.
O MusicLM apresenta três sugestões abaixo da caixa de entrada, incluindo algumas bizarras no meu caso, como “Música de festa cibernética borbulhante e otimista no fliperama subaquático”. Cliquei em gerar por curiosidade e o resultado foi uma mixagem eletrônica otimista. Não é exatamente o que eu esperaria de uma “festa da pizza cibernética”, mas certamente foi animada e otimista.
Achei o MusicLM um pouco imprevisível na prática, mas ainda é uma primeira impressão promissora.
Seguindo em frente, digitei o prompt “Música assustadora e lenta que você ouviria em uma floresta assombrada” e a faixa resultante se encaixou muito bem na descrição. No entanto, não demorou muito para ver por que o Google considera o MusicLM um projeto experimental.
Simplesmente inserir “música rap” produziu uma faixa com sons estridentes e penetrantes e uma faixa vocal de fundo com som sintético. O último parecia que o MusicLM estava reproduzindo algo diretamente de seus dados de treinamento.
Portanto, embora o MusicLM não exija nenhuma habilidade musical, também não é exatamente um músico. Os resultados podem ou não impressioná-lo, semelhante aos chatbots antes do ChatGPT interromper esse cenário. Ainda assim, o MusicLM representa a primeira IA generativa do mundo para música e isso é impressionante por si só. Aqui estão mais alguns fatos sobre isso:
- Você não pode pedir música no estilo de um artista específico. MusicLM também não pode gerar vocais de forma confiável neste momento.
- Em muitos casos, MusicLM gerou música com vocais ininteligíveis. Mesmo quando pedi especificamente faixas instrumentais, a IA ignorou meu pedido.
- A iteração atual do MusicLM gera apenas faixas de 20 segundos, embora o modelo subjacente seja capaz de gerações muito mais longas.
- Você obtém dois clipes de áudio por geração, que sempre foram semelhantes entre si. Ainda assim, o Google permite que você vote no seu favorito por meio de um botão de troféu.
- De acordo com o Google, MusicLM pode reproduzir instrumentos eletrônicos e clássicos melhor do que outros tipos de música. No entanto, funcionou decentemente bem quando tentei gerar música folclórica indiana e trilhas sonoras de 8 bits no estilo de videogames antigos.
Como se inscrever no MusicLM
Calvin Wankhede / Autoridade Android
O Google ainda não lançou o MusicLM publicamente, optando por limitar o acesso por meio de uma lista de espera. Vimos a Microsoft e o Google adotarem uma estratégia semelhante quando lançaram seus chatbots no início de 2023. Mas talvez porque o MusicLM não seja tão popular, só tive que esperar alguns dias para receber um convite. No entanto, isso pode mudar a qualquer momento, portanto, não espere acesso imediato.
Aqui está um guia rápido sobre como se inscrever na lista de espera do MusicLM:
- Navegue até a página inicial do AI Test Kitchen do Google e clique no botão iniciar botão.
- Clique em Registre seu interesse.
- Preencha o formulário. Ele basicamente pergunta seu país de residência, profissão, o motivo para usar o AI Test Kitchen e se você participará de pesquisas voluntárias.
- Na próxima etapa, faça login usando sua conta do Google.
- Depois de fazer login, você verá uma mensagem de sucesso confirmando que foi adicionado à lista de espera.
O AI Test Kitchen do Google não está disponível em todo o mundo no momento. Portanto, se você não receber um e-mail de convite dentro de algumas semanas, esse pode ser o motivo.
Quanto ao lançamento público, pode acontecer no final de 2023 ou no início de 2024 se o Google se comprometer a melhorar o MusicLM. Um dos maiores obstáculos continua sendo a violação de direitos autorais. Os pesquisadores da empresa descobriram que a IA replicaria o trabalho existente em cerca de um por cento dos casos, o que poderia levar a ações judiciais de gravadoras e artistas.
Além disso, praticamente sem grande concorrência no espaço da música generativa, resta saber se continua sendo uma prioridade para o gigante das buscas. É perfeitamente possível que o Google priorize todos os seus recursos de IA em seu chatbot Bard e no próximo modelo de linguagem Gemini.
perguntas frequentes
Não está claro se você pode usar clipes de áudio do MusicLM comercialmente neste momento. Portanto, na ausência de uma licença, é melhor presumir que você não possui direitos sobre a música gerada por IA do Google.