Kaitlyn Cimino / Autoridade Android
Quando assistentes digitais como o Siri e o Google Assistant foram lançados na década de 2010, sua capacidade de compreender a linguagem natural foi considerada revolucionária. Quase uma década depois, no entanto, seu brilho desapareceu e plataformas de IA de conversação como o ChatGPT tomaram conta. Eles podem entender a linguagem geral, incluindo gírias, sem exigir que você repita comandos rígidos todas as vezes. Mas o que significa exatamente IA conversacional e como funciona a tecnologia subjacente? Vamos decompô-lo.
O que é IA conversacional?
A IA conversacional é o mais recente avanço na tecnologia de processamento de linguagem natural (PNL), auxiliada por novos avanços em aprendizado de máquina de empresas como Google e OpenAI. Embora os investigadores tenham tentado ensinar aos computadores como replicar a linguagem humana durante décadas, esses esforços aceleraram significativamente nos últimos anos. Por exemplo, um chatbot moderno como o ChatGPT pode compreender e falar sobre uma variedade de tópicos em diferentes estilos de linguagem.
No coração da IA conversacional moderna estão grandes modelos de linguagem de última geração. Esses são modelos de aprendizado de máquina que foram treinados em grandes conjuntos de dados, incluindo textos de livros, Wikipedia e até mesmo plataformas de mídia social. À medida que o treinamento avança, o modelo identifica padrões no texto e forma relações entre palavras e frases. Isso não apenas permite que o modelo entenda as conversas, mas também gera textos inteiramente novos que ele nunca encontrou antes.
IA conversacional refere-se a modelos avançados que podem compreender e responder ao diálogo humano diferenciado.
A IA de conversação também não se limita apenas à palavra escrita. Agora temos motores de voz convincentes que podem ler texto gerado por IA com entonação, tom e emoção quase perfeitos. Escrevi recentemente sobre o modo de bate-papo por voz do ChatGPT, por exemplo, e sua capacidade de soar humano adicionando pausas e sons de hesitação.
Mencionei o ChatGPT algumas vezes até agora, principalmente porque é a IA de conversação mais reconhecida atualmente. ChatGPT usa uma versão ligeiramente diferente do GPT-3.5 ou GPT-4 que é especificamente ajustada para imitar o diálogo humano. Em outras palavras, o próprio ChatGPT é um exemplo de IA conversacional, mas seu modelo de linguagem subjacente não merece necessariamente o mesmo título.
Como funciona a IA conversacional?
Em 2017, um grupo de pesquisadores do Google publicou um artigo intitulado “Atenção é tudo que você precisa”. Nele, eles propuseram uma nova arquitetura de rede neural chamada Transformer, que permite que modelos de linguagem natural se concentrem seletivamente nas partes principais de uma frase para compreender o contexto, o sentimento e o significado maior de uma amostra de texto. As arquiteturas anteriores não conseguiam vincular palavras e frases da mesma maneira, e é por isso que não conseguiam compreender ou replicar muito bem a fala humana.
Hoje, a arquitetura do Transformer forma a espinha dorsal da maioria dos grandes modelos de linguagem (LLMs). Esses modelos são treinados em gigabytes de texto, extraídos de todos os cantos da Internet para entender como os humanos formam frases.
O criador do ChatGPT, OpenAI, levou a arquitetura do Transformer um passo adiante e empregou uma técnica conhecida como Aprendizado por Reforço com Feedback Humano (foto acima). Envolveu essencialmente a contratação de humanos para avaliar milhares de amostras de texto, o que eventualmente treinou a IA para parecer mais natural. Você também pode participar deste processo de classificação se votar positivamente ou negativamente nas respostas ao usar o ChatGPT.
A maior parte da IA conversacional dependia de humanos para avaliar suas respostas em algum momento durante o processo de treinamento.
O Google usou uma abordagem humana semelhante para treinar seus produtos de IA conversacional, como o Bard. No seu relatório sobre o modelo de linguagem PaLM 2, a empresa afirmou: “As taxas horárias para os trabalhadores dependem da rapidez com que os julgamentos foram concluídos. A maioria dos avaliadores terá ganho entre US$ 0,90/hora (com um comentário por minuto) e US$ 5,40/hora (com 6 comentários por minuto), o que se alinha com o pagamento típico por hora nas regiões geográficas onde a maioria dos avaliadores está localizada.” Recomendo a leitura do relatório completo se você quiser entender como os sistemas modernos de IA são treinados e alinhados para parecerem mais humanos.
IA conversacional vs IA generativa vs chatbots: Qual é a diferença?
Robert Triggs / Autoridade Android
Além da IA conversacional, você também pode ter encontrado termos como chatbots e IA generativa. Não há limites claramente definidos entre esses termos e você pode até notar um bom grau de sobreposição.
Vamos começar com chatbots, que é o termo mais antigo dos três. Os primeiros chatbots funcionavam em um mecanismo muito rudimentar baseado em regras. Basicamente, você digitaria algumas respostas pré-programadas e tentaria capturar todos os comandos possíveis. No entanto, os chatbots tradicionais quase sempre falham quando são apresentados a uma pergunta única ou a um comando invisível. Você pode ter experimentado essa frustração ao interagir com um Google Assistant ou um alto-falante inteligente com Alexa.
Passando para a IA conversacional, é um termo usado para descrever chatbots de última geração que podem responder a praticamente qualquer diálogo humano. Não precisa de pré-programação para simular uma conversa, pois aprendeu a compreender o contexto e a responder de maneira realista.
A IA generativa constitui a espinha dorsal de muitas plataformas de IA conversacional, mas também é capaz de muito mais.
Finalmente, temos IA generativa. É a tecnologia que sustenta muitos serviços modernos de IA conversacional. O termo descreve IA que pode gerar diferentes tipos de conteúdo, desde texto até imagens e até vozes. Midjourney e Bing Image Creator são exemplos de IA generativa, pois podem criar imagens inteiras que nunca existiram antes.
Simplificando, a IA conversacional como o ChatGPT pode se enquadrar na categoria de chatbots e IA generativa. No entanto, chatbots mais rudimentares como Alexa não possuem nenhum recurso generativo integrado e também podem não merecer o título de IA conversacional.
Benefícios e desvantagens da IA conversacional
Como qualquer tecnologia emergente, a IA conversacional tem seus prós e contras. Aqui estão alguns deles:
- Eficiência: Imagine transferir tarefas como resumo de documentos ou reuniões para um chatbot. Usando IA conversacional e generativa, todos poderíamos liberar tempo para trabalhar em tarefas que realmente importam.
- Ajuda sob demanda: a IA de conversação pode ajudar em tarefas rotineiras, como escrever códigos padronizados ou até mesmo em trabalhos do mundo real. Imagine pedir ajuda para trocar o pneu do seu carro quando você estiver preso no meio do nada. Uma IA de conversação pode orientar você pelas etapas em inglês simples e responder a quaisquer perguntas inesperadas que você possa ter ao longo do caminho.
- Vieses: Dependendo do conjunto de dados, a IA conversacional pode amplificar preconceitos raciais ou de gênero ao repetir estereótipos ou apoiar certas ideologias. Muitas vezes, isso não é intencional, mas é inevitável em qualquer sistema de IA treinado em uma variedade de tópicos.
- Desinformação: Nas primeiras semanas de lançamento, o ChatGPT e o Bing Chat responderam com informações inventadas. Este fenômeno é conhecido como alucinação e é um desafio constante no espaço generativo da IA.
Exemplos de IA conversacional
Calvin Wankhede / Autoridade Android
Ultimamente, testemunhamos uma explosão na IA conversacional, o que significa que agora temos muitos serviços para escolher. Alguns se especializam na resolução de problemas e na descoberta de fatos, como um ser humano faria, enquanto outros se limitam a servir como companheiros criativos. Com essa diversidade em mente, aqui estão alguns exemplos de serviços de IA conversacional que você pode usar hoje:
- Bate-papoGPT: A OpenAI provavelmente deu início ao entusiasmo em torno da IA conversacional com ChatGPT quando lançou acesso aberto ao chatbot no final de 2022. A maioria dos serviços abaixo só foram abertos ao público em resposta ao ChatGPT.
- Google Bardo: O Google agiu rapidamente após o lançamento do ChatGPT e, no início de 2023, a empresa revelou Bard ao mundo. Ele usa o modelo de linguagem Gemini do próprio gigante das buscas em vez do GPT, que foi igualmente ajustado para o diálogo. Pessoalmente, descobri que Bard tem um bom desempenho em tarefas criativas, mas tende a cometer erros factuais quando questionado sobre tópicos complexos.
- Personagem.AI: Ao contrário de outros serviços de IA conversacional desta lista, Character.AI permite simular bate-papos com personalidades famosas. Isso significa que você pode conversar com personificações de celebridades do mundo real, como Elon Musk, ou dar vida a personagens de quadrinhos.
- Cláudio: Construído por ex-pesquisadores da OpenAI, Claude é um assistente de IA que prioriza respostas seguras e honestas acima de tudo. Ele foi treinado em um conjunto de dados menor e verificado para reduzir as chances de preconceitos e respostas inseguras.
- Copiloto da Microsoft: Construído na mesma base do ChatGPT, você encontrará o Copilot integrado a uma variedade de produtos da Microsoft, como Windows 11 e Bing. Também é capaz de pesquisar novas informações na internet e gerar ou analisar imagens.
Sem dúvida veremos ainda mais serviços de IA conversacional nos próximos meses e anos. O Assistente do Google com Bard, por exemplo, combina a experiência tradicional do chatbot com inteligência artificial generativa. E com o ritmo atual de inovação, a tecnologia poderá em breve tornar-se parte integrante da nossa vida quotidiana.
Perguntas frequentes
Sim, ChatGPT é um exemplo de IA conversacional – ele pode compreender nuances em frases complexas e responder de maneira humana.
A IA de conversação é importante para muitos porque é como ter um assistente pessoal adaptado às suas necessidades e tarefas específicas. Você pode equiparar o impacto cultural da IA conversacional às primeiras calculadoras, que automatizaram cálculos simples e nos liberaram para lidar com outras tarefas.
Os serviços de IA conversacional são normalmente treinados em conjuntos de dados muito grandes, que podem incluir milhares de livros, sites inteiros como a Wikipedia e até mesmo feeds de mídias sociais como Twitter e Reddit. Isso permite que a IA tenha conhecimento sobre diferentes assuntos e responda em tons variados.