Close Menu
    What's Hot

    Um vazamento da UI 9 revela novos visuais para Now Bar, widgets e muito mais

    março 25, 2026

    O novo algoritmo TurboQuant do Google acelera a memória AI em 8x, reduzindo custos em 50% ou mais

    março 25, 2026

    O júri responsabiliza YouTube e Meta em processo de aplicativo viciante

    março 25, 2026
    Facebook X (Twitter) Instagram
    Rafas Geek
    • Tech

      Este rival do Kindle Scribe é melhor em todos os níveis, exceto em um

      março 25, 2026

      Os próximos telefones Galaxy da Samsung confirmados com atualizações inteligentes a um preço mais baixo

      março 25, 2026

      Não compre uma Ring Doorbell antes de ver esta atualização impressionante da Amazon

      março 25, 2026

      Argos acaba de tornar o mais recente Galaxy Watch da Samsung mais barato do que nunca

      março 25, 2026

      O excelente laptop rival Macbook da Samsung agora é muito mais acessível

      março 25, 2026
    • News

      Um vazamento da UI 9 revela novos visuais para Now Bar, widgets e muito mais

      março 25, 2026

      O júri responsabiliza YouTube e Meta em processo de aplicativo viciante

      março 25, 2026

      Déjà vu do Google TV Streamer? A próxima caixa Onn do Walmart parece suspeitamente familiar

      março 25, 2026

      OpenAI está fechando Sora, e o momento é difícil de ignorar

      março 25, 2026

      Devolver um telefone para a T-Mobile agora custa mais US$ 5

      março 25, 2026
    • Negócios

      Regras de atraso de pagamento incluirão juros obrigatórios e limite de pagamento de 60 dias

      março 25, 2026

      Melhores ofertas para criação de software de contabilidade fiscal digital

      março 23, 2026

      Por que ‘meu negócio é minha aposentadoria’ pode ser o plano mais arriscado de todos

      março 19, 2026

      como evitar taxas mais altas

      março 17, 2026

      Subsídio de £ 3.000 para empregos juvenis para empresas que contratam jovens

      março 16, 2026
    • Mundo

      O Galaxy Z TriFold está pronto para o mercado dos EUA com essas ofertas

      dezembro 2, 2025

      Os telefones Samsung em um grande mercado receberão muitos utilitários de sistema

      novembro 14, 2025

      O Google Chrome é o pior navegador para quem não é técnico – eis o porquê

      outubro 25, 2025

      O Galaxy Z Flip 8 poderia usar um chip especial da Qualcomm com um pouco de molho extra da Samsung

      outubro 10, 2025

      Um dos melhores telefones de câmera de 2025 é obter uma sequência

      setembro 2, 2025
    • Contato
    Facebook X (Twitter) Instagram
    Rafas Geek
    Featured Markets

    Xiaomi surpreende com o novo MiMo-V2-Pro LLM próximo do GPT-5.2, desempenho do Opus 4.6 por uma fração do custo

    rafasgeekBy rafasgeekmarço 19, 2026Nenhum comentário9 Mins Read
    Facebook Twitter Pinterest LinkedIn Tumblr Email
    Share
    Facebook Twitter LinkedIn Pinterest Email





    A fabricante chinesa de eletrônicos e automóveis Xiaomi surpreendeu hoje a comunidade global de IA com o lançamento do MiMo-V2-Proum novo modelo básico de 1 trilhão de parâmetros com benchmarks que se aproximam dos gigantes de IA dos EUA, OpenAI e Anthropic, mas com cerca de um sétimo ou sexto do custo quando acessado por meio de API proprietária – e, mais importante, enviando menos de 256.000 tokens de informações de um lado para outro.

    Liderado por Fuli Luo, um veterano do projeto disruptivo DeepSeek R1, o lançamento representa o que Luo caracteriza como um "emboscada silenciosa" na fronteira global. Além disso, Luo afirmou em um X postagem que a empresa planeja abrir o código-fonte de uma variante do modelo desta versão mais recente, " quando os modelos são estáveis ​​o suficiente para merecê-lo."

    Ao focar no "espaço de ação" de inteligência – passando da geração de código para a operação autônoma de digital "garras"—Xiaomi está tentando ultrapassar totalmente o paradigma conversacional.

    Antes desta incursão na IA de fronteira, a Xiaomi, com sede em Pequim, estabeleceu-se como um titã da "A Internet das Coisas" e hardware de consumo.

    Globalmente reconhecida como o terceiro maior fabricante mundial de smartphones, a Xiaomi passou o início da década de 2020 a executar uma entrada de alto risco no setor automóvel. Os seus veículos eléctricos (EV), como o SU7 e o recentemente lançado SUV YU7, transformaram a empresa numa potência verticalmente integrada, capaz de fundir hardware, software e, agora, raciocínio avançado.

    Este pedigree em engenharia do mundo físico informa a arquitetura do MiMo-V2-Pro; foi construído para ser o "cérebro" de sistemas complexos, quer esses sistemas estejam gerenciando cadeias de suprimentos globais ou navegando nas intrincadas estruturas de um agente de codificação autônomo.

    Tecnologia: A arquitetura da agência

    O desafio central do "Era do Agente" está mantendo um raciocínio de alta fidelidade sobre grandes extensões de dados sem incorrer em custos proibitivos. "imposto de inteligência" em latência ou custo. O MiMo-V2-Pro aborda isso por meio de uma arquitetura esparsa: embora abrigue parâmetros totais de 1T, apenas 42B estão ativos durante qualquer passagem de avanço único, tornando-o aproximadamente três vezes o tamanho de seu antecessor, MiMo-V2-Flash.

    A eficiência do modelo está enraizada em um mecanismo evoluído de Atenção Híbrida. Os transformadores padrão normalmente enfrentam um aumento quadrático nos requisitos de computação à medida que o contexto cresce; MiMo-V2-Pro utiliza uma proporção híbrida de 7:1 (aumentada de 5:1 na versão Flash) para gerenciar sua enorme janela de contexto de 1 milhão de tokens. Esta escolha arquitetônica permite que o modelo mantenha uma profunda "memória" de tarefas de longa duração sem a degradação de desempenho normalmente vista em modelos de fronteira.

    A analogia: pense no modelo não como um estudante lendo um livro página por página, mas como um pesquisador especialista em uma vasta biblioteca. A proporção de 7:1 permite que o modelo "desnatar" 85% dos dados para contexto, aplicando atenção de alta densidade aos 15% mais relevantes para a tarefa em questão.

    Isso é combinado com uma camada leve de Multi-Token Prediction (MTP), que permite ao modelo antecipar e gerar vários tokens simultaneamente, reduzindo drasticamente a latência necessária para o "pensamento" fases dos fluxos de trabalho de agente. Segundo Luo, estas decisões estruturais foram tomadas com meses de antecedência, especificamente para proporcionar uma "vantagem estrutural" pela velocidade inesperada com que a indústria mudou para agentes.

    Produto e benchmarking: uma verificação da realidade de terceiros

    Os dados internos da Xiaomi mostram um modelo que se destaca em "mundo real" tarefas sobre benchmarks sintéticos. No GDPval-AA, um benchmark que mede o desempenho em tarefas de trabalho do mundo real, o MiMo-V2-Pro alcançou um Elo de 1426, colocando-o à frente dos principais pares chineses como GLM-5 (1406) e Kimi K2.5 (1283).

    Embora ainda siga o caminho ocidental "esforço máximo" modelos como Claude Sonnet 4.6 (1633) em Elo bruto, representa o desempenho mais alto registrado para um modelo de origem chinesa nesta categoria.

    A organização de benchmarking terceirizada A Análise Artificial verificou essas afirmaçõescolocando o MiMo-V2-Pro em 10º lugar em seu Índice de Inteligência global com uma pontuação de 49. Isso o coloca no mesmo nível do Codex GPT-5.2 e à frente do Grok 4.20 Beta. Estes resultados sugerem que a Xiaomi construiu com sucesso um modelo capaz de raciocínio de alto nível necessário para tarefas de engenharia e produção.

    As principais métricas da Análise Artificial destacam um salto significativo em relação à versão anterior de pesos abertos, MiMo-V2-Flash (que obteve 41 pontos):

    • Taxa de alucinação: O modelo Pro reduziu as taxas de alucinação para 30%, uma melhoria acentuada em relação aos 48% do modelo Flash.

    • Índice de onisciência: Ele marcou +5, colocando-o à frente do GLM-5 (+2) e do Kimi K2.5 (-8).

    • Eficiência do token: Para executar todo o Índice de Inteligência, o MiMo-V2-Pro exigiu apenas 77 milhões de tokens de saída, significativamente menos que o GLM-5 (109 milhões) ou o Kimi K2.5 (89 milhões), indicando um processo de raciocínio mais conciso e eficiente.

    Os próprios gráficos da Xiaomi enfatizam ainda mais sua "Agente Geral" e "Agente de codificação" capacidades. No ClawEval, uma referência para andaimes de agentes, o modelo obteve pontuação de 61,5, aproximando-se do desempenho de Claude Opus 4,6 (66,3) e superando significativamente o GPT-5,2 (50,0). Em ambientes específicos de codificação como Terminal-Bench 2.0, alcançou 86,7, sugerindo alta confiabilidade ao executar comandos em um ambiente de terminal ativo.

    Como as empresas devem avaliar o uso do MiMo-V2-Pro

    Para as personas delineadas nas organizações contemporâneas de IA – da infraestrutura à segurança – o MiMo-V2-Pro representa uma mudança de paradigma no "Preço-Qualidade" curva.

    Os tomadores de decisão de infraestrutura considerarão o MiMo-V2-Pro um candidato atraente para a fronteira Pareto de inteligência versus custo. A Artificial Analysis relatou que a execução de seu índice custou apenas US$ 348 para o MiMo-V2-Pro, em comparação com US$ 2.304 para o GPT-5.2 e US$ 2.486 para o Claude Opus 4.6.

    Para organizações que gerenciam clusters de GPU ou compras, a capacidade de acessar as 10 principais informações globais por aproximadamente 1/7 do custo dos operadores históricos ocidentais é um incentivo poderoso para testes em escala de produção.

    Os tomadores de decisão de dados podem aproveitar a janela de contexto de 1 milhão para arquiteturas prontas para RAG, permitindo-lhes alimentar bases de código empresariais inteiras ou conjuntos de documentação em um único prompt, sem a fragmentação exigida por modelos de contexto menores.

    Um tomador de decisão de sistemas/orquestração deve avaliar o MiMo-V2-Pro como principal "cérebro" para coordenação multiagente. Como o modelo é otimizado para OpenClaw e Claude Code, ele pode lidar com o planejamento de longo prazo e o uso preciso de ferramentas sem a constante intervenção humana que assola os modelos anteriores.

    Sua alta classificação no GDPval-AA sugere que ele é particularmente adequado para o fluxo de trabalho e a camada de orquestração necessária para dimensionar a IA em toda a empresa. Ele permite a criação de sistemas que podem ir além da simples automação para a solução de problemas complexos e em várias etapas.

    Contudo, os decisores de segurança devem ter cautela. O muito "agente" A natureza que torna o modelo poderoso – sua capacidade de usar terminais e manipular arquivos – aumenta a área de superfície para injeção imediata e acesso não autorizado ao modelo.

    Embora a sua baixa taxa de alucinações (30%) seja uma vantagem defensiva, a falta de pesos públicos (ao contrário da versão Flash) significa que as equipas de segurança interna não podem realizar o trabalho profundo. "nível de modelo" auditorias às vezes são necessárias para implantações altamente confidenciais. Qualquer implementação empresarial deve ser acompanhada por protocolos robustos de monitorização e auditabilidade.

    Preço, disponibilidade e o caminho a seguir

    A Xiaomi fixou o preço do MiMo-V2-Pro para dominar o mercado de desenvolvedores. O preço é escalonado com base no uso do contexto, com taxas competitivas de armazenamento em cache para dar suporte a tarefas de raciocínio de alta frequência.

    • MiMo-V2-Pro (até 256K): US$ 1 por 1 milhão de tokens de entrada e US$ 3 por 1 milhão de tokens de saída

    • MiMo-V2-Pro (256K-1M): US$ 2 por 1 milhão de tokens de entrada e US$ 6 por 1 milhão de tokens de saída

    • Leitura de cache: US$ 0,20 por 1 milhão de tokens para o nível inferior e US$ 0,40 para o nível superior

    • Escrita em cache: Temporariamente gratuito ($0)

    Veja como ele se compara a outros modelos de fronteira líderes em todo o mundo:

    Modelo

    Entrada

    Saída

    Custo total

    Fonte

    Grok 4.1 Rápido

    US$ 0,20

    US$ 0,50

    US$ 0,70

    xAI

    MiniMax M2.7

    US$ 0,30

    US$ 1,20

    US$ 1,50

    MiniMax

    Gêmeos 3 Flash

    US$ 0,50

    US$ 3,00

    US$ 3,50

    Google

    Kimi-K2.5

    US$ 0,60

    US$ 3,00

    US$ 3,60

    Tiro lunar

    MiMo-V2-Pro (≤256K)

    US$ 1,00

    US$ 3,00

    US$ 4,00

    Xiaomi MiMo

    GLM-5-Turbo

    US$ 0,96

    US$ 3,20

    US$ 4,16

    OpenRouter

    GLM-5

    US$ 1,00

    US$ 3,20

    US$ 4,20

    Z.ai

    Claude Haiku 4.5

    US$ 1,00

    US$ 5,00

    US$ 6,00

    Antrópico

    Qwen3-Max

    US$ 1,20

    US$ 6,00

    US$ 7,20

    Nuvem Alibaba

    Gêmeos 3 Pró

    US$ 2,00

    US$ 12,00

    US$ 14,00

    Google

    GPT-5.2

    US$ 1,75

    US$ 14,00

    US$ 15,75

    OpenAI

    GPT-5.4

    US$ 2,50

    US$ 15,00

    US$ 17,50

    OpenAI

    Soneto de Claude 4.5

    US$ 3,00

    US$ 15,00

    US$ 18,00

    Antrópico

    Fechar Trabalho 4.6

    US$ 5,00

    US$ 25,00

    US$ 30,00

    Antrópico

    GPT-5.4 Pró

    US$ 30,00

    US$ 180,00

    US$ 210,00

    OpenAI

    Esse posicionamento agressivo foi projetado para incentivar os fluxos de aplicativos de alta intensidade que definem a próxima geração de software. O modelo está atualmente disponível apenas através da API original da Xiaomi, sem suporte atual para imagem ou entrada multimodal – uma omissão notável em uma era de "Omni" modelos, embora a Xiaomi tenha lançado um MiMo-V2-Omni separado para essas necessidades.

    O "Caçador Alfa" período no OpenRouter provou que o mercado tem um grande apetite por esta combinação específica de eficiência e raciocínio. A filosofia de Fuli Luo – que a velocidade da pesquisa é alimentada por um "amor genuíno pelo mundo para o qual você está construindo"—resultou num modelo que ocupa o 2º lugar na China e o 8º a nível mundial nos índices de inteligência estabelecidos.

    Quer continue a ser um "quieto" emboscar ou se tornar a base para um realinhamento global do poder da IA ​​depende da rapidez com que os desenvolvedores adotam o "espaço de ação" sobre o "janela de bate-papo". Por enquanto, a Xiaomi mudou as traves: a questão não é mais apenas "pode falar?" mas "pode agir?"



    custo desempenho fração GPT5.2 LLM MiMoV2Pro novo Opus por próximo surpreendê uma Xiaomi
    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    rafasgeek
    • Website

    Related Posts

    O novo algoritmo TurboQuant do Google acelera a memória AI em 8x, reduzindo custos em 50% ou mais

    março 25, 2026

    As renderizações do Galaxy Z Fold 8 Wide mostram o novo formato ousado da Samsung

    março 25, 2026

    Android Canary abençoa o terminal Linux com uma interface de usuário moderna e novos recursos

    março 25, 2026

    Comments are closed.

    Economy News
    News

    Um vazamento da UI 9 revela novos visuais para Now Bar, widgets e muito mais

    By rafasgeekmarço 25, 20260

    Aamir Siddiqui / Autoridade AndroidDR Um vazamento do One UI 9 revelou alterações na Now…

    O novo algoritmo TurboQuant do Google acelera a memória AI em 8x, reduzindo custos em 50% ou mais

    março 25, 2026

    O júri responsabiliza YouTube e Meta em processo de aplicativo viciante

    março 25, 2026
    Top Trending
    News

    Um vazamento da UI 9 revela novos visuais para Now Bar, widgets e muito mais

    By rafasgeekmarço 25, 20260

    Aamir Siddiqui / Autoridade AndroidDR Um vazamento do One UI 9 revelou…

    Featured Markets

    O novo algoritmo TurboQuant do Google acelera a memória AI em 8x, reduzindo custos em 50% ou mais

    By rafasgeekmarço 25, 20260

    À medida que os Large Language Models (LLMs) expandem suas janelas de…

    Meta

    O júri responsabiliza YouTube e Meta em processo de aplicativo viciante

    By rafasgeekmarço 25, 20260

    Andy Walker / Autoridade AndroidDR Um júri acabou de considerar o YouTube…

    Subscribe to News

    Receba as últimas notícias esportivas do NewsSite sobre o mundo, esportes e política.

    Advertisement

    Todos os dias, uma nova tecnologia é lançada, e eu Rafas Geek, estou aqui para divulgar para o mundo, o que à de novo!

    Siga-nos nas redes sociais:

    Facebook X (Twitter) Instagram YouTube

    Subscribe to Updates

    Receba as últimas notícias criativas do FooBar sobre arte, design e negócios.

    Facebook X (Twitter) Instagram Pinterest
    • Home
    • Tecnologia
    • Entretenimento
    • News
    © 2026 Rafas Geek - Tudo sobre tecnologia 👨🏻‍💻 Rafas Geek.

    Type above and press Enter to search. Press Esc to cancel.