Close Menu
    What's Hot

    O mais recente tablet Android colorido E Ink está chegando para o seu laptop

    janeiro 30, 2026

    Economize $ 300 neste impressionante Smart Monitor M8 de 32 polegadas da Samsung

    janeiro 30, 2026

    Economize $ 300 neste impressionante Smart Monitor M8 de 32 polegadas da Samsung

    janeiro 30, 2026
    Facebook X (Twitter) Instagram
    Rafas Geek
    • Tech

      A oferta mais barata do Samsung Galaxy Watch não está na Argos ou na Amazon

      janeiro 30, 2026

      A Sky acaba de tornar a posse de um iPhone mais acessível com o preço “mais baixo de todos” confirmado

      janeiro 30, 2026

      Primeiro, olhe para dentro do novo Mercedes inteligente, onde os melhores assentos estão na parte de trás

      janeiro 29, 2026

      Redes móveis do Reino Unido avaliadas com um vencedor claro vencendo o campo

      janeiro 29, 2026

      O novo telefone Galaxy da Samsung parece incrível, mas custa mais que um MacBook Pro

      janeiro 29, 2026
    • News

      O mais recente tablet Android colorido E Ink está chegando para o seu laptop

      janeiro 30, 2026

      Economize $ 300 neste impressionante Smart Monitor M8 de 32 polegadas da Samsung

      janeiro 30, 2026

      Economize $ 300 neste impressionante Smart Monitor M8 de 32 polegadas da Samsung

      janeiro 30, 2026

      O Galaxy S26 Ultra pode ter esse recurso Android que o S25 perdeu

      janeiro 30, 2026

      O Galaxy S26 Ultra pode ter esse recurso Android que o S25 perdeu

      janeiro 30, 2026
    • Negócios

      Melhor software de folha de pagamento para pequenas empresas

      janeiro 30, 2026

      Pubs terão desconto de 15% nas tarifas comerciais

      janeiro 27, 2026

      Como iniciar um negócio

      janeiro 20, 2026

      Enviando sua primeira autoavaliação como novo empresário individual

      janeiro 15, 2026

      Um guia para marketing por e-mail de sucesso

      janeiro 13, 2026
    • Mundo

      O Galaxy Z TriFold está pronto para o mercado dos EUA com essas ofertas

      dezembro 2, 2025

      Os telefones Samsung em um grande mercado receberão muitos utilitários de sistema

      novembro 14, 2025

      O Google Chrome é o pior navegador para quem não é técnico – eis o porquê

      outubro 25, 2025

      O Galaxy Z Flip 8 poderia usar um chip especial da Qualcomm com um pouco de molho extra da Samsung

      outubro 10, 2025

      Um dos melhores telefones de câmera de 2025 é obter uma sequência

      setembro 2, 2025
    • Contato
    Facebook X (Twitter) Instagram
    Rafas Geek
    Graphics Cards

    NVIDIA RTX 5090 supera AMD e Apple executando modelos locais de linguagem OpenAI

    rafasgeekBy rafasgeekoutubro 20, 2025Nenhum comentário4 Mins Read
    Facebook Twitter Pinterest LinkedIn Tumblr Email
    Share
    Facebook Twitter LinkedIn Pinterest Email




    Desenvolvedores e criativos que buscam maior controle e privacidade com sua IA estão cada vez mais recorrendo a modelos executados localmente, como a nova família de modelos gpt-oss da OpenAI, que são leves e incrivelmente funcionais no hardware do usuário final. Na verdade, você pode executá-lo em GPUs de consumo com apenas 16 GB de memória. Isso torna possível usar uma ampla variedade de hardware – com as GPUs NVIDIA emergindo como a melhor maneira de executar esses tipos de modelos de peso aberto.

    Enquanto nações e empresas correm para desenvolver suas próprias soluções de IA sob medida para uma série de tarefas, modelos de código aberto e de peso aberto, como o novo gpt-oss-20b da OpenAI, estão encontrando muito mais adoção. Este último lançamento é aproximadamente comparável ao mini modelo GPT-4o, que teve tanto sucesso no ano passado. Ele também introduz raciocínio em cadeia de pensamento para refletir profundamente sobre os problemas, níveis de raciocínio ajustáveis ​​para ajustar as capacidades de pensamento em tempo real, extensão de contexto expandida e ajustes de eficiência para ajudá-lo a funcionar em hardware local, como as GPUs GeForce RTX série 50 da NVIDIA.

    Mas você precisará da placa gráfica certa se quiser obter o melhor desempenho. A GeForce RTX 5090 da NVIDIA é sua principal placa super rápida para jogos e uma variedade de cargas de trabalho profissionais. Com sua arquitetura Blackwell, dezenas de milhares de núcleos CUDA e 32 GB de memória, é ideal para executar IA local.

    Llama.cpp é uma estrutura de código aberto que permite executar LLMs (modelos de linguagem grande) com ótimo desempenho, especialmente em GPUs RTX, graças às otimizações feitas em colaboração com a NVIDIA. Llama.cpp oferece muita flexibilidade para ajustar técnicas de quantização e descarregamento de CPU.

    Llama.cpp publicou seus próprios testes de gpt-oss-20b, onde a GeForce RTX 5090 liderou as paradas com impressionantes 282 tok/s. Isso é comparado ao Mac M3 Ultra (116 tok/s) e ao 7900 XTX da AMD (102 tok/s). A GeForce RTX 5090 inclui Tensor Cores integrados projetados para acelerar tarefas de IA, maximizando o desempenho executando gpt-oss-20b localmente.

    Observação: Tok/s, ou tokens por segundo, mede tokens, um pedaço de texto que o modelo lê ou gera em uma única etapa, e a rapidez com que eles podem ser processados.

    Nvidia 2

    NVIDIA

    Para entusiastas de IA que desejam apenas usar LLMs locais com essas otimizações NVIDIA, considere o aplicativo LM Studio, desenvolvido com base em Llama.cpp. O LM Studio adiciona suporte para RAG (geração aumentada de recuperação) e foi projetado para facilitar a execução e a experimentação de grandes LLMs, sem a necessidade de lidar com ferramentas de linha de comando ou configurações técnicas profundas.

    NVIDIA RTX 5090 artigo 2

    NVIDIA

    Outra estrutura de código aberto popular para testes e experimentação de IA é o Ollama. É ótimo para testar diferentes modelos de IA, incluindo os modelos OpenAI gpt-oss, e a NVIDIA trabalhou em estreita colaboração para otimizar o desempenho, para que você obtenha ótimos resultados executando-o em uma GPU NVIDIA GeForce RTX série 50. Ele gerencia downloads de modelos, configuração de ambiente e aceleração de GPU automaticamente, bem como gerenciamento de modelos integrado para suportar vários modelos simultaneamente, integrando-se facilmente com aplicativos e fluxos de trabalho locais.

    Ollama também oferece uma maneira fácil para os usuários finais testarem o modelo gpt-oss mais recente. E de forma semelhante ao llama.cpp, outros aplicativos também utilizam o Ollama para executar LLMs. Um exemplo é AnythingLLM, com sua interface local simples, tornando-o excelente para aqueles que estão apenas começando com o benchmarking LLM.

    NVIDIA RTX 5090 artigo 3

    NVIDIA

    Se você possui uma das GPUs NVIDIA mais recentes (ou mesmo se não tiver, mas não se importe com o impacto no desempenho), você pode experimentar o gpt-oss-20b em uma variedade de plataformas. O LM Studio é ótimo se você deseja uma interface elegante e intuitiva que permite pegar qualquer modelo que você deseja experimentar e funciona igualmente bem no Windows, macOS e Linux.

    AnythingLLM é outra opção fácil de usar para executar gpt-oss-20b e funciona tanto no Windows x64 quanto no Windows em ARM. Há também o Ollama, que não é tão elegante de se ver, mas é ótimo se você sabe o que está fazendo e deseja configurar rapidamente.

    Qualquer que seja o aplicativo que você use para brincar com o gpt-oss-20b, as GPUs NVIDIA Blackwell mais recentes parecem oferecer o melhor desempenho.



    AMD Apple executando linguagem locais modelos Nvidia Openai RTX supera
    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    rafasgeek
    • Website

    Related Posts

    O Windows 11 está perto de retomar seus aplicativos Android como o Apple Handoff

    janeiro 28, 2026

    Google e Apple hospedaram dezenas de aplicativos de “nudificação” de IA

    janeiro 28, 2026

    O novo gadget da Apple só funcionará em modelos de iPhone com software mais recente

    janeiro 28, 2026

    Comments are closed.

    Economy News
    Android

    O mais recente tablet Android colorido E Ink está chegando para o seu laptop

    By rafasgeekjaneiro 30, 20260

    DR Bigme anunciou o B10, um tablet E Ink colorido de 10,3 polegadas para leitura,…

    Economize $ 300 neste impressionante Smart Monitor M8 de 32 polegadas da Samsung

    janeiro 30, 2026

    Economize $ 300 neste impressionante Smart Monitor M8 de 32 polegadas da Samsung

    janeiro 30, 2026
    Top Trending
    Android

    O mais recente tablet Android colorido E Ink está chegando para o seu laptop

    By rafasgeekjaneiro 30, 20260

    DR Bigme anunciou o B10, um tablet E Ink colorido de 10,3…

    Deals

    Economize $ 300 neste impressionante Smart Monitor M8 de 32 polegadas da Samsung

    By rafasgeekjaneiro 30, 20260

    Esta oferta está disponível na Amazon como uma “oferta por tempo limitado”.…

    Deals

    Economize $ 300 neste impressionante Smart Monitor M8 de 32 polegadas da Samsung

    By rafasgeekjaneiro 30, 20260

    Esta oferta está disponível na Amazon como uma “oferta por tempo limitado”.…

    Subscribe to News

    Receba as últimas notícias esportivas do NewsSite sobre o mundo, esportes e política.

    Advertisement

    Todos os dias, uma nova tecnologia é lançada, e eu Rafas Geek, estou aqui para divulgar para o mundo, o que à de novo!

    Siga-nos nas redes sociais:

    Facebook X (Twitter) Instagram YouTube

    Subscribe to Updates

    Receba as últimas notícias criativas do FooBar sobre arte, design e negócios.

    Facebook X (Twitter) Instagram Pinterest
    • Home
    • Tecnologia
    • Entretenimento
    • News
    © 2026 Rafas Geek - Tudo sobre tecnologia 👨🏻‍💻 Rafas Geek.

    Type above and press Enter to search. Press Esc to cancel.