Calvin Wankhede / Autoridade Android
Na semana passada, o OpenAI lançou o que pode ser a atualização mais ambiciosa (e potencialmente controversa) para o ChatGPT desde o seu lançamento: o modo agente. Ao contrário da interface de conversação padrão, o modo agente fornece controle de chatgpt sobre uma máquina virtual executando o Chrome, permitindo que ele interaja com sites como um humano faria. Ele pode identificar elementos em sites, rolar, clicar em botões, preencher formulários e, se conceder credenciais, até mesmo fazer login em suas contas on -line.
Pela primeira vez desde o lançamento da IA, ele pode executar tarefas em vez de cuspir algum texto sobre como fazê -lo. Na superfície, o potencial parece interminável. O chatbot pode responder aos seus e -mails, comprar mantimentos, reservar um voo ou executar tarefas ainda mais complexas, abrangendo vários sites. A melhor parte é que você pode assistir ao Chatgpt “Mover” seu cursor do mouse em torno do navegador da Web virtual e navegar na Internet (como você pode ver no vídeo abaixo). É certo que é muito parecido com uma criança lutando para andar às vezes, mas é infinitamente fascinante.
Então, o que o modo de agente do ChatGPT pode realmente fazer com todos esses recursos? Para responder a essa pergunta, testei o recurso com algumas tarefas do mundo real-do tipo que você pode realmente querer descarregar para um assistente de IA. Veja como lidou com eles, e o que o ChatGPT fez quando encontrou um obstáculo.
Colocando o agente ChatGPT para trabalhar: uma corrida de supermercado
O Alexa da Amazon pode adicionar papel higiênico ao seu carrinho com um comando de voz, mas o modo de agente do ChatGPT pode ser confiado para fazer muito mais. Especificamente, ele pode comprar toda a sua lista de compras em qualquer plataforma de sua escolha. Caso em questão: dei ao agente uma tarefa simples: compre tudo o que eu precisaria para uma pizza caseira do Walmart. Não ofereci ingredientes, itens ou até orientações específicos sobre o preço apenas para ver o que escolheria.
O agente inicializou um computador virtual e navegou para o Walmart em pouco tempo. Mas ele encontrou um obstáculo quase imediatamente-o Walmart lançou uma tela de verificação anti-Bot exigindo que um humano pressione e segure um botão. Surpreendentemente, o agente reconheceu essa tela e me pediu para assumir brevemente o controle do navegador e concluir a tarefa. Eu assumi o controle e cerca de dez segundos depois, estávamos. Devolvi o controle e o agente imediatamente começou a trabalhar. Parece que o Captchas precisará evoluir mais uma vez se quiserem manter os bots fora no futuro.
Chatgpt me convocou quando precisava de um toque humano, o que acaba sendo apenas resolver o Captchas.
Seguindo em frente, eu assisti o agente procurar metodicamente “massa de pizza”, “molho de pizza”, “queijo mussarela” e “pepperoni”. Mas, para minha surpresa, o agente não conseguiu apenas o primeiro resultado. Em vez disso, priorizou alternativas familiares e com preços bem preços, como eu pessoalmente. Em mais de uma instância, eu o assisti escolher o terceiro ou quarto item nos resultados ou chamar um produto concorrente exagerado. O agente também passou corretamente pelos resultados de pesquisa imprecisos, como uma pizza de pepperoni congelada totalmente pré -fabricada quando estava comprando apenas pepperoni, o ingrediente.
Em quatro minutos, meu carrinho virtual estava cheio de tudo o que eu precisava para fazer uma pizza. O agente navegou para a página de check -out e, em seguida, entregou o controle de volta para mim para concluir outro Captcha, fazer login e inserir meus detalhes de pagamento com segurança. O ChatGPT diz que não pode ver suas entradas quando você estiver no controle de sua máquina virtual, presumivelmente significando que não pode armazenar suas informações de login ou cartão de crédito. Apesar disso, não optei por entrar em meus detalhes de login e, portanto, passei a noite sem nenhuma pizza.
Escusado será dizer que essa foi uma exibição muito impressionante, mesmo que fosse uma tarefa bastante direta com uma sequência clara de ações. Mas o agente pode lidar com algo mais ambíguo? Decidi dar um desafio mais difícil: encontre uma lista de candidatos a carros usados no mercado do Facebook.
O chatgpt pode encontrar o carro usado perfeito?
Adoro o Facebook Marketplace porque sempre há muita coisa ao virar da esquina, mas eu teme percorrer as centenas de listagens para encontrar a certa. Então, eu coloquei o modo de agente do ChatGPT na tarefa, esperando que ela tropeça em algum momento. Especificamente, pedi para fazer login na minha conta do Facebook, navegar para a guia Marketplace e compilar uma lista de espécimes de ajuste da Honda usados. Como se isso não fosse difícil, pedi para procurar apenas modelos de 2015 a 2020 dentro de um raio de 50 quilômetros de Toronto.
Para minha surpresa, o agente começou forte e entrou na minha conta do Facebook sem soluço. Eu tive que intervir para fornecer um código de autenticação de dois fatores, mas fora isso, era um processo totalmente indolor. O chatgpt navegou para a seção de mercado, mudou o local para a cidade que eu forneci e até ajustei o filtro de distância máxima. Em seguida, começou a passar por listagens individuais e registrou detalhes importantes sobre cada carro que encontrou.
Para ser justo, o modo de agente do ChatGPT não é mais rápido que um humano – eu provavelmente poderia passar por listagens individuais mais rápidas que o agente, pelo menos em seu estado atual. Mas, como qualquer computador, o chatgpt é teimosamente persistente. Depois de assistir as listagens por alguns minutos, me afastei do meu computador para tomar um café. Quando voltei cerca de dez minutos depois, o agente ainda estava meticulosamente clicando em listagens individuais.
O ChatGPT é teimosamente persistente e rolado por mais de cem listagens no mercado do Facebook.
O resultado final foi um relatório abrangente de duas a três dúzias de carros que atenderam aos meus critérios. Como mostra a imagem acima, o agente compilou um resumo detalhado para cada veículo encontrado. Organizou os principais detalhes das colunas: ano e modelo, preço e quilometragem, transmissão e localização. Ele até criou uma seção de notas em que resumiu a descrição do vendedor, retirando informações cruciais como “listagem de revendedores”, “título de salvamento” ou “aberto à negociação”. Finalmente, cada item de linha tinha uma captura de tela da lista do mercado para eu ler se eu estivesse interessado nesse veículo específico.
Se isso parece impressionante, é absolutamente. Juntando uma lista como essa manualmente teria me levado pelo menos algumas horas. E a melhor parte é que eu provavelmente poderia dar um passo adiante e pedir ao agente do ChatGPT que entre em contato com os vendedores selecionados em meu nome. Não é a coisa responsável a fazer, mas certamente é uma possibilidade.
Não é perfeito, mas impressionante … e assustador
Calvin Wankhede / Autoridade Android
O modo de agente do ChatGPT não é perfeito de forma alguma; Eu assisti isso ir em um loop sem fim, até que fui forçado a intervir. Também pode seguir as instruções muito de perto, quase para uma falha. Por exemplo, ele se recusou a aceitar um raio de pesquisa de 51 km em vez dos 50 km que prescrevi em um site de automóveis usado diferente. O resultado? O agente usou seu mouse virtual para “arrastar” um controle deslizante para frente e para trás por vários segundos até que ele aterrisse precisamente nos 50 km necessário. O senso comum não vem naturalmente para a IA, mesmo no modo de agente.
Também notei um grande atraso entre o ChatGPT executando uma ação como clicar em um link ou pressionar o botão traseiro do navegador. Isso faz com que a IA tente novamente a ação, o que é um grande problema, porque inevitavelmente acaba na página errada. Às vezes, o agente clicava no botão traseiro duas vezes e acabava na página inicial. Em seguida, reiniciaria toda a pesquisa novamente, perdendo vários minutos no processo.
O agente do ChatGPT às vezes pode ser um idiota, mas só vai melhorar.
Mas, apesar de todos os seus momentos desajeitados, o verdadeiro significado do modo de agente não está em sua velocidade ou capacidade atual. O fato de eu poder ir embora para fazer um café enquanto uma IA compilou autonomamente um relatório detalhado sobre carros usados é a principal proposta de valor aqui. O potencial de aumento da produtividade é enorme. Mas, ao mesmo tempo, não tenho certeza de como me sinto sobre uma IA tomando decisões em meu nome. Portanto, a pergunta agora é: quanto mais autonomia estamos dispostos a entregar a IA?
Se você quiser usar o modo agente, lembre -se de que precisará de uma assinatura ChatGPT Plus. Isso custará US $ 20 mensalmente, e o recurso está atualmente limitado a apenas 40 mensagens por mês. Mas se você é paciente, tenho certeza de que acabará chegando ao nível gratuito, assim como outros novos recursos do ChatGPT no passado.
Obrigado por fazer parte da nossa comunidade. Leia nossa política de comentários antes de postar.

