Inteligência artificial, ou IA, é um termo muito usado atualmente. Seja em um smartphone Android, um serviço de streaming recomendando seu próximo filme ou uma plataforma de música selecionando uma playlist, a IA parece estar em todo lugar. Mas como a definição de IA evoluiu e o que alguns dos termos mais técnicos de IA realmente significam? Abaixo, mergulhamos nos principais termos e conceitos que definem a IA moderna, ajudando você a navegar neste campo complexo e em rápida evolução.
O que é IA realmente?
Historicamente, IA se referia à inteligência de nível humano obtida artificialmente por meio de máquinas. No entanto, o termo foi diluído ao longo dos anos e agora é frequentemente usado como um termo amplo de marketing. Hoje, qualquer coisa que exiba características de inteligência, de recomendações de comércio eletrônico a sistemas de reconhecimento de voz, é rotulada como IA.
Para entender melhor as nuances, precisamos explorar termos específicos de IA que façam a distinção entre propaganda enganosa e avanços tecnológicos.
Aprendizado de máquina (ML)
Aprendizado de máquina é uma subcategoria de IA na qual os sistemas aprendem com dados e experiências para tomar decisões ou realizar ações. Por exemplo, se você alimentar um algoritmo com milhares de fotos de gatos, ele aprenderá a identificar um gato. Você pode então fornecer fotos de gatos, cachorros e outros animais. O sistema deve então ser capaz de escolher as imagens de gatos com base no que ele “aprendeu”.
Esse processo de aprendizagem envolve duas fases principais: treinamento e inferência.
Treinamento
A fase de treinamento é um longo estágio de aprendizado de máquina em que o sistema é alimentado com grandes quantidades de dados para aprender — por exemplo, imagens de gatos. No entanto, os dados usados podem ser itens específicos, como flores, ou incluir amostras maiores, como a internet como um todo. Treinar sistemas modernos de IA como o ChatGPT pode custar milhões e exigir imensos recursos de computação.
Inferência
Calvin Wankhede / Autoridade Android
Após o treinamento, o sistema aplica seu conhecimento aprendido a novos dados. Esta fase é onde o usuário final entra, permitindo-nos interagir com aplicativos de IA. Por exemplo, agora que o sistema sabe o que é um gato, podemos alimentá-lo com uma imagem, e ele o identificará. Pergunte ao Google Gemini ou ao Microsoft Copilot qual é a capital da Inglaterra, e eles fornecerão uma resposta. Nesta fase, o sistema se baseia em seus aprendizados estabelecidos. Esta fase requer significativamente menos poder de computação.
Inteligência Geral Artificial (AGI)
AGI se refere a máquinas com inteligência de nível humano, capazes de tomar decisões, planejar e entender o mundo em um contexto mais amplo. Diferentemente dos sistemas de IA atuais, a AGI possuiria uma compreensão e consciência mais profundas, semelhantes ao que vemos na ficção científica. Embora estejamos longe de atingir a AGI, já que decifrar esse código exigiria muitas questões técnicas, filosóficas e morais, é uma área significativa de pesquisa.
No vídeo acima, cobrimos as implicações da AGI, incluindo as noções de inteligência artificial “fraca” e “forte”. É um tópico amplo e vale a pena se aprofundar nele.
IA Generativa
Andy Walker / Autoridade Android
Tradicionalmente, a IA tem sido excelente em classificação e reconhecimento, mas a IA generativa vai além dessas ideias para criar novos conteúdos, como texto, imagens e música. Esse avanço revolucionário abriu novas possibilidades na IA, permitindo que os sistemas gerem saídas criativas com base em dados de entrada. Esse também é o lado da IA que está gerando os benefícios mais tangíveis para usuários comuns, especialmente se você já usou o ChatGPT para redigir um e-mail ou usou o Midjourney para gerar uma imagem de um gato.
Redes neurais
Redes neurais são os blocos de construção fundamentais e a espinha dorsal da IA moderna. Elas existem há décadas e são modeladas no cérebro humano. Elas consistem em neurônios interconectados que processam dados por várias camadas, produzindo, por fim, uma saída. Treinar uma rede neural envolve ajustar as conexões entre neurônios para melhorar a precisão.
Redes de transformadores
Calvin Wankhede / Autoridade Android
Um tipo especial de rede neural, as redes transformadoras, permitiu o desenvolvimento de grandes modelos de linguagem (LLMs) como o ChatGPT. Essas redes se destacam na compreensão do contexto e dos relacionamentos dentro dos dados, tornando-as ideais para tarefas de processamento de linguagem.
Grandes Modelos de Linguagem (LLMs)
Quando redes neurais, transformadores e treinamento para uma rede neural muito grande são combinados, grandes modelos de linguagem nascem.
Os LLMs são treinados em grandes quantidades de dados de texto, permitindo que eles gerem respostas semelhantes às humanas. Pense em ChatGPT, Claude, LLaMA e Grok. Eles funcionam prevendo a próxima palavra em uma sequência, criando saídas coerentes e contextualmente relevantes. No entanto, essa natureza preditiva pode levar a problemas como alucinações, onde o modelo gera informações plausíveis, mas incorretas. Abordaremos isso na próxima seção.
Alucinações
C. Scott Brown / Autoridade Android
Alucinações ocorrem quando a IA gera informações incorretas devido à sua dependência de modelagem preditiva. Este é um desafio significativo para LLMs, pois eles podem produzir resultados convincentes, mas falsos.
Um exemplo clássico de alucinação foi a resposta ao resultado da pesquisa do Google, “Como você impede que o queijo escorregue da sua pizza?”, que incluía a resposta aprimorada por IA, “Bem, você deveria usar supercola. Cole-a na sua pizza.” O LLM pegou a resposta de uma postagem do Reddit e acreditou que ela estava correta.
Parâmetros e tamanho do modelo
A eficácia dos modelos de IA é frequentemente medida por seus parâmetros totais, representando as conexões dentro da rede neural. Modelos maiores com mais parâmetros geralmente têm melhor desempenho, mas exigem mais recursos. Modelos menores são teoricamente menos precisos, mas podem ser executados em hardware mais econômico.
Por exemplo, o enorme modelo baseado em nuvem LLaMA 3.1 tem 405 bilhões de parâmetros, enquanto os modelos que rodam nativamente em smartphones consistem apenas em alguns bilhões de parâmetros.
Modelos de difusão
Rita El Khoury / Autoridade Android
Usados para geração de imagens, os modelos de difusão revertem o processo de adição de ruído às imagens durante o treinamento. Isso permite que eles criem novas imagens a partir de ruído aleatório, guiados por padrões aprendidos.
Recuperação de Geração Aumentada (RAG)
O RAG combina IA generativa com fontes de dados externas para produzir resultados precisos e contextualmente relevantes. Ao recuperar dados adicionais, esses modelos podem aprimorar suas saídas, tornando-as mais confiáveis e úteis.
Entender termos e conceitos de IA pode ser particularmente complicado. Mas, à medida que o campo evolui, manter-se informado ajudará você a navegar no mundo emocionante e às vezes desafiador da inteligência artificial. Seja você um entusiasta de tecnologia ou um profissional da área, este guia fornece uma base sólida para explorar o futuro da IA.