Setup com PC gamer equipado com GPU NVIDIA GeForce RTX, monitor exibindo interface de chat IA, laptop com fluxo de trabalho de IA e uma placa de vídeo RTX destacada em primeiro plano.
Com a RTX AI Garage, usuários podem executar modelos avançados de IA como os da OpenAI diretamente em seus computadores com GPUs NVIDIA GeForce RTX

NVIDIA e OpenAI trazem modelos GPT para placas GeForce RTX com suporte local a IA

Nova parceria permite rodar modelos avançados de inteligência artificial diretamente em PCs gamers com GPUs RTX, sem depender da nuvem

A NVIDIA anunciou uma colaboração inédita com a OpenAI que promete transformar o uso de inteligência artificial em desktops. Agora, modelos abertos no estilo GPT poderão ser executados localmente em máquinas equipadas com placas de vídeo GeForce RTX e RTX PRO — tecnologia antes restrita a grandes data centers na nuvem.

A novidade marca o início de uma nova geração de IA acelerada por hardware, com desempenho de ponta acessível a gamers, criadores e desenvolvedores diretamente de seus próprios PCs.

Modelos GPT otimizados para rodar em RTX

A nova linha de modelos leva o nome gpt-oss e foi projetada para aproveitar todo o poder das GPUs RTX. São duas variantes:

  • gpt-oss-20b: voltado para usuários com placas RTX e ao menos 16 GB de VRAM, alcançando velocidades impressionantes de até 250 tokens por segundo em uma GPU RTX 5090.
  • gpt-oss-120b: versão mais robusta, voltada para estações de trabalho com placas RTX PRO.

Ambos foram treinados em GPUs NVIDIA H100 e usam a técnica MXFP4, que aumenta a qualidade e precisão da inferência sem comprometer o desempenho. Um destaque é o suporte a contexto de até 131.072 tokens, um dos maiores já disponíveis para IA local.

Esses modelos adotam uma arquitetura mixture-of-experts (MoE) com recursos avançados como chain-of-thought, uso de instruções e integração com ferramentas externas.

Como rodar os novos modelos no seu PC RTX

A NVIDIA também detalhou as formas de acessar os modelos gpt-oss em casa. Veja as principais opções:

  • Ollama: ferramenta com interface amigável que permite testar os modelos de forma simples. Compatível com GPUs RTX e otimizada para alto desempenho.
  • Llama.cpp: biblioteca open source que está recebendo otimizações da NVIDIA, incluindo suporte a CUDA Graphs. O código está disponível no GitHub.
  • Microsoft AI Foundry (Windows): ambiente local para desenvolvedores testarem os modelos diretamente no Windows. Basta rodar o comando Foundry model run gpt-oss-20b no terminal.

Jensen Huang: “IA de ponta nas mãos dos desenvolvedores”

O CEO da NVIDIA, Jensen Huang, comemorou a iniciativa:

“A OpenAI mostrou ao mundo o que poderia ser feito com a IA da NVIDIA. Agora, com os modelos gpt-oss, desenvolvedores do mundo inteiro poderão criar em cima dessa base aberta, elevando ainda mais a inovação em inteligência artificial.”

A parceria entre NVIDIA e OpenAI marca um novo passo na democratização da IA avançada, tornando possível para qualquer entusiasta, gamer ou dev acessar modelos de linguagem poderosos diretamente de casa.

Veja todos os detalhes no Blog da Nvidia!

Fique de olho no Loot Secreto para mais novidades. Aproveite e siga a gente no Facebook Instagram!

Há 10 anos trabalhando com produção de conteúdo, já produzi programas de TV, participei de eventos internacionais e escrevi uma porção de reviews por aí.