
Os agentes de IA podem se conectar, mas não podem pensar juntos. Essa é uma enorme diferença e um gargalo para os sistemas de próxima geração, afirma Outshift, do vice-presidente sênior e gerente geral da Cisco, Vijoy Pandey.
Conforme ele descreve o estado atual da IA: Os agentes podem ser unidos em um fluxo de trabalho ou conectados a um modelo de supervisor — mas não há alinhamento semântico, nem contexto compartilhado. Eles estão essencialmente trabalhando do zero a cada tentativa.
Isto exige infra-estruturas de próximo nível, ou o que Pandey descreve como o "internet da cognição."
“Os agentes não conseguem pensar juntos porque conexão não é cognição”, disse ele. “Precisamos chegar a um ponto em que você compartilhe a cognição. Esse é o desbloqueio maior.”
Criação de novos protocolos para oferecer suporte à comunicação de agente de próxima geração
Então, o que é cognição compartilhada? É quando agentes ou entidades de IA podem trabalhar juntos de forma significativa para resolver algo novo para o qual não foram treinados, e fazer isso “100% sem intervenção humana”, disse Pandey no último episódio de Além do piloto.
O executivo da Cisco faz uma analogia com a inteligência humana. Os seres humanos evoluíram ao longo de centenas de milhares de anos, primeiro tornando-se inteligentes individualmente e depois comunicando-se num nível básico (com gestos ou desenhos). Essa comunicação melhorou ao longo do tempo, acabando por desbloquear uma “revolução cognitiva” e uma inteligência colectiva que permitiu a intenção partilhada e a capacidade de coordenar, negociar, fundamentar e descobrir informações.
“Intenção compartilhada, contexto compartilhado, inovação coletiva: essa é exatamente a trajetória que está acontecendo no silício hoje”, disse Pandey.
Sua equipe vê isso como um “problema de assistência distribuída horizontalmente”. Estão a perseguir uma “superinteligência distribuída”, codificando a intenção, o contexto e a inovação colectiva como um conjunto de regras, APIs e capacidades dentro da própria infra-estrutura.
A sua abordagem é um conjunto de novos protocolos: Protocolo de Transferência de Estado Semântico (SSTP); Protocolo de Transferência Espacial Latente (LSTP); e Protocolo de Transferência de Estado Comprimido (CSTP).
O SSTP opera no nível da linguagem, analisando a comunicação semântica para que os sistemas possam inferir a ferramenta ou tarefa certa. A equipe de Pandey colaborou recentemente com o MIT em uma peça relacionada chamada Protocolo de Efeito Ripple.
O LSTP pode ser usado para transferir “todo o espaço latente” de um agente para outro, explicou Pandey. “Podemos simplesmente pegar o cache KV e enviá-lo como exemplo?” ele disse. “Porque essa seria a maneira mais eficiente: em vez de passar pela taxa de tokenização, ir para uma linguagem natural e depois voltar a pilha do outro lado.”
O CSTP lida com a compactação – ancorando apenas as variantes alvo enquanto compacta todo o resto. Pandey diz que é particularmente adequado para implantações de borda onde você precisa enviar grandes quantidades de estado com precisão.
Em última análise, a equipe de Pandey está construindo uma estrutura para ampliar a inteligência e garantir que os estados de cognição sejam sincronizados entre os terminais. Além disso, estão a desenvolver o que chamam de “motores de cognição” que fornecem barreiras de proteção e sistemas de aceleração.
“Protocolos, estrutura, motores de cognição: essas são as três camadas que estamos construindo na busca por superinteligência distribuída”, disse Pandey.
Como a Cisco resolveu um grande problema
Afastando-se desses sistemas avançados e de próximo nível, a Cisco alcançou resultados tangíveis com os recursos de IA existentes. Pandey descreveu um ponto problemático específico com a equipe de engenharia de confiabilidade do site (SRE) da empresa.
Embora produzissem cada vez mais produtos e códigos, a equipe em si não crescia e sentia pressão para melhorar a eficiência. Pandey introduziu agentes de IA que automatizaram mais de uma dúzia de fluxos de trabalho ponta a ponta, incluindo pipelines de CI/CD de integração/entrega contínua, spin-ups de instâncias EC2 e implantações de cluster Kubernetes.
Agora, mais de 20 agentes – alguns criados internamente, outros de terceiros – têm acesso a mais de 100 ferramentas por meio de estruturas como o Model Context Protocol (MCP), ao mesmo tempo que se conectam às plataformas de segurança da Cisco.
O resultado: uma diminuição de “horas e horas para segundos” com determinadas implantações; além disso, os agentes reduziram 80% dos problemas que a equipe SRE via nos fluxos de trabalho do Kubernetes.
Ainda assim, como observou Pandey, a IA é uma ferramenta como qualquer outra. “Isso não significa que eu tenha um martelo novo e que vou apenas sair por aí procurando pregos”, disse ele. “Você ainda tem um código determinístico. Você precisa casar esses dois mundos para obter o melhor resultado para o problema que está resolvendo.”
Ouça o podcast para saber mais sobre:
-
Como estamos agora possibilitando um novo paradigma de computação não determinística.
-
Como a Cisco aumentou os recursos de detecção de erros em grandes redes de 10% para 100%.
-
Como Pandey nomeou seu próprio agente de IA "Arnold Layne" depois de uma das primeiras músicas do Pink Floyd.
-
Por que o "internet da cognição" deve ser um esforço aberto e interoperável.
-
Como funciona o projeto de código aberto da Cisco Agntcy aborda descoberta, gerenciamento de identidade e acesso (IAM), observabilidade e avaliação.
Você também pode ouvir e assinar Além do piloto sobre Spotify, Maçã ou onde quer que você obtenha seus podcasts.

