Close Menu
    What's Hot

    A atualização do Google Home corrige erros de rolagem, iluminação e Ask Home

    outubro 26, 2025

    O melhor hack de produtividade do meu navegador estava bem debaixo do meu nariz

    outubro 26, 2025

    Se os vazamentos do Galaxy S26 forem verdadeiros, você deve comprar este telefone

    outubro 26, 2025
    Facebook X (Twitter) Instagram
    Rafas Geek
    • Tech

      A venda surpresa da Amazon reduz o preço do popular tablet Fire para menos de £ 40

      outubro 26, 2025

      Experimentei duas câmeras Fujifilm peculiares com preços muito diferentes

      outubro 26, 2025

      Todos com um roteador Wi-Fi são avisados ​​para seguir 5 novas regras simples

      outubro 24, 2025

      Freeview adiciona dois novos canais à sua TV na última atualização de conteúdo gratuito

      outubro 23, 2025

      Sky torna o novo iPad Pro mais acessível se você precisar de uma atualização da Apple

      outubro 23, 2025
    • News

      A atualização do Google Home corrige erros de rolagem, iluminação e Ask Home

      outubro 26, 2025

      Gemini Canvas agora pode transformar seu documento em uma apresentação de slides em segundos

      outubro 24, 2025

      A cama para smartphone da IKEA pode ser a solução para a rolagem noturna

      outubro 24, 2025

      Nada tenta justificar sua decisão de colocar bloatware em seu próximo telefone

      outubro 24, 2025

      Economize $ 490 no Samsung Galaxy S25 Edge com 512 GB

      outubro 24, 2025
    • Negócios

      Acordos de liquidação no processo de demissão

      outubro 24, 2025

      Um guia completo para financiamento de pequenas empresas

      outubro 22, 2025

      O que é e como obter ou verificar um

      outubro 22, 2025

      Cinco etapas para pequenas empresas Tornando a fiscalidade digital

      outubro 21, 2025

      Vantagens fiscais de uma sociedade anônima ou empresário individual?

      outubro 20, 2025
    • Mundo

      O Google Chrome é o pior navegador para quem não é técnico – eis o porquê

      outubro 25, 2025

      O Galaxy Z Flip 8 poderia usar um chip especial da Qualcomm com um pouco de molho extra da Samsung

      outubro 10, 2025

      Um dos melhores telefones de câmera de 2025 é obter uma sequência

      setembro 2, 2025

      O aplicativo de telefone do Google pode facilitar a retomada das chamadas

      julho 24, 2025

      O Goodwill Shopper descobre US $ 30 PC escondendo um RTX 3080 Ti e Ryzen 7

      junho 27, 2025
    • Contato
    Facebook X (Twitter) Instagram
    Rafas Geek
    Graphics Cards

    NVIDIA RTX 5090 supera AMD e Apple executando modelos locais de linguagem OpenAI

    rafasgeekBy rafasgeekoutubro 20, 2025Nenhum comentário4 Mins Read
    Facebook Twitter Pinterest LinkedIn Tumblr Email
    Share
    Facebook Twitter LinkedIn Pinterest Email




    Desenvolvedores e criativos que buscam maior controle e privacidade com sua IA estão cada vez mais recorrendo a modelos executados localmente, como a nova família de modelos gpt-oss da OpenAI, que são leves e incrivelmente funcionais no hardware do usuário final. Na verdade, você pode executá-lo em GPUs de consumo com apenas 16 GB de memória. Isso torna possível usar uma ampla variedade de hardware – com as GPUs NVIDIA emergindo como a melhor maneira de executar esses tipos de modelos de peso aberto.

    Enquanto nações e empresas correm para desenvolver suas próprias soluções de IA sob medida para uma série de tarefas, modelos de código aberto e de peso aberto, como o novo gpt-oss-20b da OpenAI, estão encontrando muito mais adoção. Este último lançamento é aproximadamente comparável ao mini modelo GPT-4o, que teve tanto sucesso no ano passado. Ele também introduz raciocínio em cadeia de pensamento para refletir profundamente sobre os problemas, níveis de raciocínio ajustáveis ​​para ajustar as capacidades de pensamento em tempo real, extensão de contexto expandida e ajustes de eficiência para ajudá-lo a funcionar em hardware local, como as GPUs GeForce RTX série 50 da NVIDIA.

    Mas você precisará da placa gráfica certa se quiser obter o melhor desempenho. A GeForce RTX 5090 da NVIDIA é sua principal placa super rápida para jogos e uma variedade de cargas de trabalho profissionais. Com sua arquitetura Blackwell, dezenas de milhares de núcleos CUDA e 32 GB de memória, é ideal para executar IA local.

    Llama.cpp é uma estrutura de código aberto que permite executar LLMs (modelos de linguagem grande) com ótimo desempenho, especialmente em GPUs RTX, graças às otimizações feitas em colaboração com a NVIDIA. Llama.cpp oferece muita flexibilidade para ajustar técnicas de quantização e descarregamento de CPU.

    Llama.cpp publicou seus próprios testes de gpt-oss-20b, onde a GeForce RTX 5090 liderou as paradas com impressionantes 282 tok/s. Isso é comparado ao Mac M3 Ultra (116 tok/s) e ao 7900 XTX da AMD (102 tok/s). A GeForce RTX 5090 inclui Tensor Cores integrados projetados para acelerar tarefas de IA, maximizando o desempenho executando gpt-oss-20b localmente.

    Observação: Tok/s, ou tokens por segundo, mede tokens, um pedaço de texto que o modelo lê ou gera em uma única etapa, e a rapidez com que eles podem ser processados.

    Nvidia 2

    NVIDIA

    Para entusiastas de IA que desejam apenas usar LLMs locais com essas otimizações NVIDIA, considere o aplicativo LM Studio, desenvolvido com base em Llama.cpp. O LM Studio adiciona suporte para RAG (geração aumentada de recuperação) e foi projetado para facilitar a execução e a experimentação de grandes LLMs, sem a necessidade de lidar com ferramentas de linha de comando ou configurações técnicas profundas.

    NVIDIA RTX 5090 artigo 2

    NVIDIA

    Outra estrutura de código aberto popular para testes e experimentação de IA é o Ollama. É ótimo para testar diferentes modelos de IA, incluindo os modelos OpenAI gpt-oss, e a NVIDIA trabalhou em estreita colaboração para otimizar o desempenho, para que você obtenha ótimos resultados executando-o em uma GPU NVIDIA GeForce RTX série 50. Ele gerencia downloads de modelos, configuração de ambiente e aceleração de GPU automaticamente, bem como gerenciamento de modelos integrado para suportar vários modelos simultaneamente, integrando-se facilmente com aplicativos e fluxos de trabalho locais.

    Ollama também oferece uma maneira fácil para os usuários finais testarem o modelo gpt-oss mais recente. E de forma semelhante ao llama.cpp, outros aplicativos também utilizam o Ollama para executar LLMs. Um exemplo é AnythingLLM, com sua interface local simples, tornando-o excelente para aqueles que estão apenas começando com o benchmarking LLM.

    NVIDIA RTX 5090 artigo 3

    NVIDIA

    Se você possui uma das GPUs NVIDIA mais recentes (ou mesmo se não tiver, mas não se importe com o impacto no desempenho), você pode experimentar o gpt-oss-20b em uma variedade de plataformas. O LM Studio é ótimo se você deseja uma interface elegante e intuitiva que permite pegar qualquer modelo que você deseja experimentar e funciona igualmente bem no Windows, macOS e Linux.

    AnythingLLM é outra opção fácil de usar para executar gpt-oss-20b e funciona tanto no Windows x64 quanto no Windows em ARM. Há também o Ollama, que não é tão elegante de se ver, mas é ótimo se você sabe o que está fazendo e deseja configurar rapidamente.

    Qualquer que seja o aplicativo que você use para brincar com o gpt-oss-20b, as GPUs NVIDIA Blackwell mais recentes parecem oferecer o melhor desempenho.



    AMD Apple executando linguagem locais modelos Nvidia Openai RTX supera
    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    rafasgeek
    • Website

    Related Posts

    O navegador Atlas da OpenAI tem uma falha de segurança que pode expor suas informações privadas

    outubro 24, 2025

    A nova campainha com vídeo Wyze supera a do Google em mais de US$ 100

    outubro 24, 2025

    Microsoft Edge tem as mesmas ideias do navegador ChatGPT

    outubro 24, 2025

    Comments are closed.

    Economy News
    Google

    A atualização do Google Home corrige erros de rolagem, iluminação e Ask Home

    By rafasgeekoutubro 26, 20250

    Edgar Cervantes / Autoridade AndroidDR O Google está lançando a versão 4.1 do app Google…

    O melhor hack de produtividade do meu navegador estava bem debaixo do meu nariz

    outubro 26, 2025

    Se os vazamentos do Galaxy S26 forem verdadeiros, você deve comprar este telefone

    outubro 26, 2025
    Top Trending
    Google

    A atualização do Google Home corrige erros de rolagem, iluminação e Ask Home

    By rafasgeekoutubro 26, 20250

    Edgar Cervantes / Autoridade AndroidDR O Google está lançando a versão 4.1…

    Browsers

    O melhor hack de produtividade do meu navegador estava bem debaixo do meu nariz

    By rafasgeekoutubro 26, 20250

    Megan Ellis / Autoridade AndroidTenho tentado melhorar minha produtividade em meu navegador…

    Features

    Se os vazamentos do Galaxy S26 forem verdadeiros, você deve comprar este telefone

    By rafasgeekoutubro 26, 20250

    Hadlee Simons / Autoridade AndroidFiquei cautelosamente otimista quando ouvi que a Samsung…

    Subscribe to News

    Receba as últimas notícias esportivas do NewsSite sobre o mundo, esportes e política.

    Advertisement

    Todos os dias, uma nova tecnologia é lançada, e eu Rafas Geek, estou aqui para divulgar para o mundo, o que à de novo!

    Siga-nos nas redes sociais:

    Facebook X (Twitter) Instagram YouTube

    Subscribe to Updates

    Receba as últimas notícias criativas do FooBar sobre arte, design e negócios.

    Facebook X (Twitter) Instagram Pinterest
    • Home
    • Tecnologia
    • Entretenimento
    • News
    © 2025 Rafas Geek - Tudo sobre tecnologia 👨🏻‍💻 Rafas Geek.

    Type above and press Enter to search. Press Esc to cancel.