Close Menu
    What's Hot

    Oferta: Confira esta câmera instantânea KODAK Memo Shot ERA Kids (SOMENTE HOJE)

    março 26, 2026

    O widget de mídia do Android Auto está funcionando mal

    março 26, 2026

    Google Nest Wi-Fi Pro despenca para o preço mais barato de todos os tempos!

    março 26, 2026
    Facebook X (Twitter) Instagram
    Rafas Geek
    • Tech

      O WhatsApp finalmente adiciona um recurso revolucionário pelo qual os usuários estão clamando

      março 26, 2026

      Samsung confirma grande atualização gratuita do Android se o seu telefone Galaxy estiver nesta lista

      março 26, 2026

      Os fones de ouvido Android acessĂ­veis do Google agora sĂŁo ainda mais baratos

      março 26, 2026

      O Spotify oferece aos seus usuários uma grande atualização de áudio sem nenhum custo extra

      março 26, 2026

      Sky oferece atualização de TV gratuita de grande sucesso, mas você precisa ativá-la

      março 26, 2026
    • News

      Oferta: Confira esta câmera instantânea KODAK Memo Shot ERA Kids (SOMENTE HOJE)

      março 26, 2026

      O widget de mídia do Android Auto está funcionando mal

      março 26, 2026

      Google Nest Wi-Fi Pro despenca para o preço mais barato de todos os tempos!

      março 26, 2026

      Os usuários de VPN baseados nos EUA correm o risco de serem tratados como alvos de vigilância estrangeiros?

      março 26, 2026

      O Anker Nano Charger (45W) cai para novo recorde

      março 26, 2026
    • NegĂłcios

      Estabelecendo limites e cronogramas fiscais digitais

      março 26, 2026

      Regras de atraso de pagamento incluirĂŁo juros obrigatĂłrios e limite de pagamento de 60 dias

      março 25, 2026

      Melhores ofertas para criação de software de contabilidade fiscal digital

      março 23, 2026

      Por que ‘meu negĂłcio Ă© minha aposentadoria’ pode ser o plano mais arriscado de todos

      março 19, 2026

      como evitar taxas mais altas

      março 17, 2026
    • Mundo

      O Galaxy Z TriFold está pronto para o mercado dos EUA com essas ofertas

      dezembro 2, 2025

      Os telefones Samsung em um grande mercado receberão muitos utilitários de sistema

      novembro 14, 2025

      O Google Chrome é o pior navegador para quem não é técnico – eis o porquê

      outubro 25, 2025

      O Galaxy Z Flip 8 poderia usar um chip especial da Qualcomm com um pouco de molho extra da Samsung

      outubro 10, 2025

      Um dos melhores telefones de câmera de 2025 é obter uma sequência

      setembro 2, 2025
    • Contato
    Facebook X (Twitter) Instagram
    Rafas Geek
    Graphics Cards

    NVIDIA RTX 5090 supera AMD e Apple executando modelos locais de linguagem OpenAI

    rafasgeekBy rafasgeekoutubro 20, 2025Nenhum comentário4 Mins Read
    Facebook Twitter Pinterest LinkedIn Tumblr Email
    Share
    Facebook Twitter LinkedIn Pinterest Email




    Desenvolvedores e criativos que buscam maior controle e privacidade com sua IA estão cada vez mais recorrendo a modelos executados localmente, como a nova família de modelos gpt-oss da OpenAI, que são leves e incrivelmente funcionais no hardware do usuário final. Na verdade, você pode executá-lo em GPUs de consumo com apenas 16 GB de memória. Isso torna possível usar uma ampla variedade de hardware – com as GPUs NVIDIA emergindo como a melhor maneira de executar esses tipos de modelos de peso aberto.

    Enquanto nações e empresas correm para desenvolver suas próprias soluções de IA sob medida para uma série de tarefas, modelos de código aberto e de peso aberto, como o novo gpt-oss-20b da OpenAI, estão encontrando muito mais adoção. Este último lançamento é aproximadamente comparável ao mini modelo GPT-4o, que teve tanto sucesso no ano passado. Ele também introduz raciocínio em cadeia de pensamento para refletir profundamente sobre os problemas, níveis de raciocínio ajustáveis ​​para ajustar as capacidades de pensamento em tempo real, extensão de contexto expandida e ajustes de eficiência para ajudá-lo a funcionar em hardware local, como as GPUs GeForce RTX série 50 da NVIDIA.

    Mas você precisará da placa gráfica certa se quiser obter o melhor desempenho. A GeForce RTX 5090 da NVIDIA é sua principal placa super rápida para jogos e uma variedade de cargas de trabalho profissionais. Com sua arquitetura Blackwell, dezenas de milhares de núcleos CUDA e 32 GB de memória, é ideal para executar IA local.

    Llama.cpp é uma estrutura de código aberto que permite executar LLMs (modelos de linguagem grande) com ótimo desempenho, especialmente em GPUs RTX, graças às otimizações feitas em colaboração com a NVIDIA. Llama.cpp oferece muita flexibilidade para ajustar técnicas de quantização e descarregamento de CPU.

    Llama.cpp publicou seus prĂłprios testes de gpt-oss-20b, onde a GeForce RTX 5090 liderou as paradas com impressionantes 282 tok/s. Isso Ă© comparado ao Mac M3 Ultra (116 tok/s) e ao 7900 XTX da AMD (102 tok/s). A GeForce RTX 5090 inclui Tensor Cores integrados projetados para acelerar tarefas de IA, maximizando o desempenho executando gpt-oss-20b localmente.

    Observação: Tok/s, ou tokens por segundo, mede tokens, um pedaço de texto que o modelo lê ou gera em uma única etapa, e a rapidez com que eles podem ser processados.

    Nvidia 2

    NVIDIA

    Para entusiastas de IA que desejam apenas usar LLMs locais com essas otimizações NVIDIA, considere o aplicativo LM Studio, desenvolvido com base em Llama.cpp. O LM Studio adiciona suporte para RAG (geração aumentada de recuperação) e foi projetado para facilitar a execução e a experimentação de grandes LLMs, sem a necessidade de lidar com ferramentas de linha de comando ou configurações técnicas profundas.

    NVIDIA RTX 5090 artigo 2

    NVIDIA

    Outra estrutura de código aberto popular para testes e experimentação de IA é o Ollama. É ótimo para testar diferentes modelos de IA, incluindo os modelos OpenAI gpt-oss, e a NVIDIA trabalhou em estreita colaboração para otimizar o desempenho, para que você obtenha ótimos resultados executando-o em uma GPU NVIDIA GeForce RTX série 50. Ele gerencia downloads de modelos, configuração de ambiente e aceleração de GPU automaticamente, bem como gerenciamento de modelos integrado para suportar vários modelos simultaneamente, integrando-se facilmente com aplicativos e fluxos de trabalho locais.

    Ollama também oferece uma maneira fácil para os usuários finais testarem o modelo gpt-oss mais recente. E de forma semelhante ao llama.cpp, outros aplicativos também utilizam o Ollama para executar LLMs. Um exemplo é AnythingLLM, com sua interface local simples, tornando-o excelente para aqueles que estão apenas começando com o benchmarking LLM.

    NVIDIA RTX 5090 artigo 3

    NVIDIA

    Se vocĂŞ possui uma das GPUs NVIDIA mais recentes (ou mesmo se nĂŁo tiver, mas nĂŁo se importe com o impacto no desempenho), vocĂŞ pode experimentar o gpt-oss-20b em uma variedade de plataformas. O LM Studio Ă© Ăłtimo se vocĂŞ deseja uma interface elegante e intuitiva que permite pegar qualquer modelo que vocĂŞ deseja experimentar e funciona igualmente bem no Windows, macOS e Linux.

    AnythingLLM é outra opção fácil de usar para executar gpt-oss-20b e funciona tanto no Windows x64 quanto no Windows em ARM. Há também o Ollama, que não é tão elegante de se ver, mas é ótimo se você sabe o que está fazendo e deseja configurar rapidamente.

    Qualquer que seja o aplicativo que vocĂŞ use para brincar com o gpt-oss-20b, as GPUs NVIDIA Blackwell mais recentes parecem oferecer o melhor desempenho.



    AMD Apple executando linguagem locais modelos Nvidia Openai RTX supera
    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    rafasgeek
    • Website

    Related Posts

    OpenAI está se retirando de seus planos de chatbot NSFW

    março 26, 2026

    A Apple poderia adotar câmera de 200 MP para iPhone, ultrapassando a Samsung no processo

    março 26, 2026

    Oferta: Apple AirTag 4-Pack cai para um preço nunca visto antes!

    março 26, 2026

    Comments are closed.

    Economy News
    Camera

    Oferta: Confira esta câmera instantânea KODAK Memo Shot ERA Kids (SOMENTE HOJE)

    By rafasgeekmarço 26, 20260

    Câmeras digitais e smartphones sĂŁo Ăłtimos para capturar momentos, mas há algo mágico nas câmeras…

    O widget de mídia do Android Auto está funcionando mal

    março 26, 2026

    Google Nest Wi-Fi Pro despenca para o preço mais barato de todos os tempos!

    março 26, 2026
    Top Trending
    Camera

    Oferta: Confira esta câmera instantânea KODAK Memo Shot ERA Kids (SOMENTE HOJE)

    By rafasgeekmarço 26, 20260

    Câmeras digitais e smartphones sĂŁo Ăłtimos para capturar momentos, mas há algo…

    Android Auto

    O widget de mídia do Android Auto está funcionando mal

    By rafasgeekmarço 26, 20260

    Andy Walker / Autoridade AndroidDR O widget de recomendação de mĂ­dia do…

    Deals

    Google Nest Wi-Fi Pro despenca para o preço mais barato de todos os tempos!

    By rafasgeekmarço 26, 20260

    Kris Carlon / Autoridade AndroidSe sua internet estiver lenta, Ă© provável que…

    Subscribe to News

    Receba as Ăşltimas notĂ­cias esportivas do NewsSite sobre o mundo, esportes e polĂ­tica.

    Advertisement

    Todos os dias, uma nova tecnologia é lançada, e eu Rafas Geek, estou aqui para divulgar para o mundo, o que à de novo!

    Siga-nos nas redes sociais:

    Facebook X (Twitter) Instagram YouTube

    Subscribe to Updates

    Receba as Ăşltimas notĂ­cias criativas do FooBar sobre arte, design e negĂłcios.

    Facebook X (Twitter) Instagram Pinterest
    • Home
    • Tecnologia
    • Entretenimento
    • News
    © 2026 Rafas Geek - Tudo sobre tecnologia 👨🏻‍💻 Rafas Geek.

    Type above and press Enter to search. Press Esc to cancel.