Calvin Wankhede / Autoridade Android
DR
- OpenAI está lançando novos recursos para ChatGPT.
- Os usuários agora poderão avisar o chatbot com sua voz ou imagem.
- Os recursos estarão inicialmente disponíveis apenas para usuários que pagam pelo ChatGPT.
Desde a sua estreia, a OpenAI vem atualizando constantemente seu chatbot — ChatGPT — com novos recursos. A atualização mais recente trará duas novas maneiras de avisar o ChatGPT: por voz ou por imagem.
Hoje, a OpenAI anunciou alguns novos recursos que chegarão ao ChatGPT nas próximas duas semanas. Um dos novos recursos permitirá que os usuários enviem solicitações com sua voz e façam com que o bot de IA responda.
Em vez de digitar algo no campo, você poderá tocar em um botão e fazer sua pergunta verbalmente. O ChatGPT irá então converter o que você diz, transformando-o em texto e alimentando esse texto em seu modelo de linguagem grande (LLM). Quando ele responder, ele converterá a resposta baseada em texto novamente em fala que você pode ouvir. Não é tão diferente de como você usaria um assistente virtual como o Google Assistant ou Alexa.
Use sua voz para conversar com o ChatGPT. Fale com ele em qualquer lugar, solicite uma história para dormir ou resolva um debate à mesa de jantar.
A OpenAI já possui um sistema de reconhecimento de fala para conversão de fala em texto chamado Whisper. Mas a empresa está agora lançando um novo modelo que é “capaz de criar vozes sintéticas realistas a partir de apenas alguns segundos de fala real”.
A empresa vê potencial nesta tecnologia além dos comandos de voz, pois destaca que está trabalhando com o Spotify para o piloto de seu recurso de tradução de voz. Como explica a OpenAI, isso permitiria que os podcasts fossem traduzidos para outros idiomas na voz do podcastor.
Existe um perigo inerente a essa tecnologia, como um ator mal-intencionado que usa a tecnologia para se passar por outras pessoas e cometer fraudes. No blog da OpenAI, a empresa reconhece o risco e afirma que a tecnologia só será usada para casos de uso e parcerias específicas.
A pesquisa subjacente – geração de voz e compreensão de imagens – oferece uma ideia do que uma IA muito mais avançada será capaz de fazer no futuro. Saiba mais sobre esta atualização e nossas medidas de segurança: https://t.co/uNZjgbR5Bm
O outro novo recurso é algo que o chatbot Bard do Google recebeu meses atrás – prompts de imagem. Assim como usar o Google Lens, que potencializa os recursos de prompt de imagem do Bard, você poderá enviar uma imagem e o ChatGPT tentará descobrir o que você está pedindo. Se quiser esclarecer o que procura, o app conta com uma ferramenta de desenho para te ajudar a identificar algo específico. Você também terá a opção de falar ou digitar perguntas para acompanhar a imagem.
Assim como o outro recurso, esse recurso apresenta riscos. Por exemplo, você não gostaria que alguém pudesse inserir uma foto sua e que o chatbot fornecesse detalhes sobre você. Para isso, a empresa afirma:
Também tomamos medidas técnicas para limitar significativamente a capacidade do ChatGPT de analisar e fazer declarações diretas sobre pessoas, uma vez que o ChatGPT nem sempre é preciso e estes sistemas devem respeitar a privacidade dos indivíduos.
Embora esses recursos devam tornar o ChatGPT muito mais funcional e fácil de usar, há desvantagens claras na tecnologia. A empresa implementou proteções, mas não se sabe se serão suficientes para evitar que malfeitores abusem dessas ferramentas.