Close Menu
    What's Hot

    O editor de fotos do One UI 8.5 poderá em breve permitir que você misture objetos de uma foto para outra

    dezembro 11, 2025

    Vídeos licenciados de IA de personagens da Disney chegarão no início de 2026

    dezembro 11, 2025

    Fim da antena parabólica? A enorme atualização do Sky pode mudar a forma como você assiste TV

    dezembro 11, 2025
    Facebook X (Twitter) Instagram
    Rafas Geek
    • Tech

      Fim da antena parabólica? A enorme atualização do Sky pode mudar a forma como você assiste TV

      dezembro 11, 2025

      Grande venda de LEGO confirmada – melhores ofertas de Natal, incluindo conjuntos populares de F1

      dezembro 11, 2025

      O popular tablet Android Fire da Amazon custa atualmente menos de £ 45 e vende rapidamente

      dezembro 11, 2025

      Dê uma olhada no interior do novo Mercedes GLB com grandes atualizações e impressionante gama de veículos elétricos

      dezembro 11, 2025

      Obtenha o Kindle colorido mais recente por menos de £ 140, mas apenas por tempo limitado

      dezembro 11, 2025
    • News

      O editor de fotos do One UI 8.5 poderá em breve permitir que você misture objetos de uma foto para outra

      dezembro 11, 2025

      Vídeos licenciados de IA de personagens da Disney chegarão no início de 2026

      dezembro 11, 2025

      HUAWEI enfrenta Samsung com lançamento global do Mate X7 dobrável

      dezembro 11, 2025

      A T-Mobile está oferecendo linhas gratuitas novamente, mas nem todos estão convidados

      dezembro 11, 2025

      O Galaxy Z TriFold usa uma solução alternativa inteligente para App Continuity

      dezembro 11, 2025
    • Negócios

      Qual é a definição de empresário individual e autônomo

      dezembro 9, 2025

      7 vantagens de ser empresário individual

      dezembro 9, 2025

      9 maneiras de economizar impostos para empresários individuais

      dezembro 8, 2025

      Sábado para pequenas empresas – como promover o seu negócio

      dezembro 1, 2025

      Quais são as taxas comerciais? Um guia para pequenas empresas

      novembro 27, 2025
    • Mundo

      O Galaxy Z TriFold está pronto para o mercado dos EUA com essas ofertas

      dezembro 2, 2025

      Os telefones Samsung em um grande mercado receberão muitos utilitários de sistema

      novembro 14, 2025

      O Google Chrome é o pior navegador para quem não é técnico – eis o porquê

      outubro 25, 2025

      O Galaxy Z Flip 8 poderia usar um chip especial da Qualcomm com um pouco de molho extra da Samsung

      outubro 10, 2025

      Um dos melhores telefones de câmera de 2025 é obter uma sequência

      setembro 2, 2025
    • Contato
    Facebook X (Twitter) Instagram
    Rafas Geek
    AI

    O modelo de imagem Nano Banana Pro AI atualizado do Google foi aclamado como ‘absolutamente maluco’ para empresas e usuários

    rafasgeekBy rafasgeeknovembro 20, 2025Nenhum comentário10 Mins Read
    Facebook Twitter Pinterest LinkedIn Tumblr Email
    Share
    Facebook Twitter LinkedIn Pinterest Email





    Infográficos renderizados sem um único erro ortográfico. Diagramas complexos extraídos de prompts de parágrafo. Logotipos restaurados a partir de fragmentos. E resultados visuais tão nítidos com tanta densidade e precisão de texto que um desenvolvedor simplesmente chamou de “absolutamente maluco”.

    Google DeepMind recém-lançado Nano Banana Pro– oficialmente Gemini 3 Pro Image – atraiu espanto tanto da comunidade de desenvolvedores quanto dos engenheiros de IA empresariais.

    Mas por trás do elogio viral está algo mais transformador: um modelo construído não apenas para impressionar, mas para integrar profundamente toda a pilha de IA do Google – desde Gemini API e Vertex AI até aplicativos Workspace, Ads e Google AI Studio.

    Ao contrário dos modelos de imagem anteriores, voltados para usuários casuais ou casos de uso artístico, o Gemini 3 Pro Image apresenta geração de imagens multimodais com qualidade de estúdio para fluxos de trabalho estruturados – com alta resolução, precisão multilíngue, consistência de layout e base de conhecimento em tempo real. Ele foi projetado para compradores técnicos, equipes de orquestração e automação em escala empresarial, não apenas para exploração criativa.

    Os benchmarks já mostram que o modelo supera seus pares em qualidade visual geral, geração de infográficos e precisão de renderização de texto. E à medida que os utilizadores do mundo real o levam ao seu limite – desde ilustrações médicas a memes de IA – o modelo revela-se tanto como uma nova ferramenta criativa como como um sistema de raciocínio visual para a pilha empresarial.

    Construído para raciocínio multimodal estruturado

    O Gemini 3 Pro Image não está apenas desenhando imagens bonitas – ele está aproveitando a camada de raciocínio do Gemini 3 Pro para gerar recursos visuais que comunicam estrutura, intenção e fundamentação factual.

    O modelo é capaz de gerar fluxos de UX, diagramas educacionais, storyboards e maquetes a partir de prompts de linguagem e pode incorporar até 14 imagens de origem com identidade consistente e fidelidade de layout entre assuntos.

    O Google descreve o modelo como “um modelo de alta fidelidade construído no Gemini 3 Pro para que os desenvolvedores acessem a geração de imagens com qualidade de estúdio” e confirma que agora está disponível via Gemini API, Google AI Studio e Vertex AI para acesso empresarial.

    No Antigravity, a nova plataforma de codificação de vibração de IA do Google construída pelos ex-co-fundadores do Windsurf contratados no início deste ano, o Gemini 3 Pro Image já está sendo usado para criar protótipos de UI dinâmicos com recursos de imagem renderizados antes que o código seja escrito. Os mesmos recursos estão sendo implementados nos produtos corporativos do Google, como Workspace Vids, Slides e Google Ads, dando às equipes controle preciso sobre o layout dos ativos, iluminação, tipografia e composição de imagens.

    Saída de alta resolução, localização e aterramento em tempo real

    O modelo suporta resoluções de saída de até 2K e 4K e inclui controles de nível de estúdio sobre ângulo da câmera, gradação de cores, foco e iluminação. Ele lida com prompts multilíngues, localização semântica e tradução de texto em imagem, permitindo fluxos de trabalho como:

    • Traduzir embalagens ou sinalização preservando o layout

    • Atualizando modelos de UX para mercados regionais

    • Gerar variantes de anúncios consistentes com nomes de produtos e preços alterados por localidade

    Um dos casos de uso mais claros são os infográficos – tanto técnicos quanto comerciais.

    Derya Unutmaz, imunologista, gerou uma ilustração médica completa descrevendo os estágios da terapia com células CAR-T, do laboratório ao paciente, elogiando o resultado como “perfeito”. O educador de IA Dan Mac criou um guia visual explicando modelos de transformadores “para uma pessoa não técnica” e chamou o resultado de “inacreditável”.

    Até mesmo recursos visuais estruturados complexos, como cardápios completos de restaurantes, recursos visuais de palestras em quadro-negro ou histórias em quadrinhos com vários personagens, foram compartilhados on-line – gerados em um único prompt, com tipografia, layout e continuidade de assunto coerentes.

    Benchmarks sinalizam liderança na geração de imagens composicionais

    Os resultados independentes do GenAI-Bench mostram o Gemini 3 Pro Image como um desempenho de última geração nas principais categorias:

    • Ele ocupa a posição mais alta em preferência geral do usuáriosugerindo forte coerência visual e alinhamento imediato.

    • Isso leva em qualidade visualà frente de concorrentes como GPT-Image 1 e Seedream v4.

    • Mais notavelmente, ele domina em geração de infográficosuperando até mesmo o modelo anterior do Google, Gemini 2.5 Flash.

    Benchmarks adicionais divulgados pelo Google mostram o Gemini 3 Pro Image com taxas de erro de texto mais baixas em vários idiomas, bem como desempenho mais forte na fidelidade de edição de imagens.

    A diferença torna-se especialmente aparente em tarefas de raciocínio estruturado. Onde os modelos anteriores podem aproximar o estilo ou preencher lacunas de layout, o Gemini 3 Pro Image demonstra consistência entre painéis, relações espaciais precisas e preservação de detalhes conscientes do contexto – crucial para sistemas que geram diagramas, documentação ou treinamento visual em escala.

    O preço é competitivo para a qualidade

    Para desenvolvedores e equipes empresariais que acessam o Gemini 3 Pro Image por meio da API Gemini ou do Google AI Studio, o preço é escalonado por resolução e uso.

    Os tokens de entrada para imagens custam US$ 0,0011 por imagem (equivalente a 560 tokens ou US$ 0,067 por imagem), enquanto o preço de saída depende da resolução: imagens padrão de 1K e 2K custam aproximadamente US$ 0,134 cada (1.120 tokens) e imagens 4K de alta resolução custam US$ 0,24 (2.000 tokens).

    A entrada e a saída de texto têm preços alinhados com o Gemini 3 Pro: US$ 2,00 por milhão de tokens de entrada e US$ 12,00 por milhão de tokens de saída ao usar os recursos de raciocínio do modelo.

    O nível gratuito atualmente não inclui acesso ao Nano Banana Pro e, diferentemente dos modelos de nível gratuito, as gerações de nível pago não são usadas para treinar os sistemas do Google.

    Aqui está uma tabela de comparação das principais APIs de geração de imagens para desenvolvedores/empresas, seguida por uma discussão sobre como elas se comparam (incluindo os preços diferenciados para Gemini 3 Pro Image / “Nano Banana Pro”).

    Modelo / Serviço

    Preço aproximado por imagem ou unidade de token

    Notas principais/níveis de resolução

    Google – Imagem Gemini 3 Pro (Nano Banana Pro)

    Entrada (imagem): ~$0,067 por imagem (560 tokens). Saída: ~$0,134 por imagem para 1K/2K (1.120 tokens), ~$0,24 por imagem para 4K (2.000 tokens). Texto: US$ 2,00 por milhão de tokens de entrada e US$ 12,00 por milhão de tokens de saída (≤200 mil contexto de token)

    Em camadas por resolução; imagens de nível pago são não usado para treinar os sistemas do Google.

    OpenAI – API DALL-E 3

    ~ US$ 0,04/imagem para padrão 1024×1024; ~$0,08/imagem para maior/resolução/HD.

    Menor custo por imagem; os níveis de resolução e qualidade ajustam os preços.

    OpenAI – GPT-Image-1 (via Azure/OpenAI)

    Nível baixo ~$0,01/imagem; Médio ~$0,04/imagem; Alta ~$0,17/imagem.

    Preços baseados em token – solicitações mais complexas ou resolução mais alta aumentam o custo.

    Google – Imagem Flash Gemini 2.5 (Nano Banana)

    ~$0,039 por imagem para resolução 1024×1024 (1290 tokens) na saída.

    Modelo “flash” de menor custo para uso em alto volume e menor latência.

    Outras/APIs menores (por exemplo, por meio de sistemas de crédito de terceiros)

    Exemplos: US$ 0,02–US$ 0,03 por imagem em alguns casos para resolução mais baixa ou modelos mais simples.

    Frequentemente usado para casos de uso de produção menos exigentes ou rascunhos de conteúdo.

    A imagem do Google Gemini 3 Pro / Nano Banana Pro o preço fica no limite superior: ~$0,134 para 1K/2K, ~$0,24 para 4K, significativamente mais alto do que a linha de base de ~$0,04 por imagem para muitas imagens padrão OpenAI/DALL-E 3.

    Mas o custo mais elevado pode ser justificável se: você precisar de resolução 4K; você precisa de governança de nível empresarial (por exemplo, o Google enfatiza que as imagens de nível pago são não usados ​​para treinar seus sistemas); você precisa de um sistema de preços baseado em token alinhado com outros usos de LLM; e você já opera na pilha de nuvem/IA do Google (por exemplo, usando Vertex AI).

    Por outro lado, se você estiver gerando grandes volumes de imagens (milhares a dezenas de milhares) e puder aceitar resolução mais baixa (1K/2K) ou qualidade premium um pouco menos, as alternativas de custo mais baixo (OpenAI, modelos menores) oferecem economias significativas – por exemplo, gerar 10.000 imagens a ~$0,04 cada custa ~$400, enquanto a ~$0,134 cada custa ~$1.340. Com o tempo, esse delta aumenta.

    SynthID e a crescente necessidade de origem empresarial

    Cada imagem gerada pelo Gemini 3 Pro Image inclui SynthID, o sistema imperceptível de marca d’água digital do Google. Embora muitas plataformas estejam apenas começando a explorar a origem da IA, o Google está posicionando o SynthID como uma parte essencial de sua pilha de conformidade empresarial.

    No aplicativo Gemini atualizado, os usuários agora podem fazer upload de uma imagem e perguntar se ela foi gerada por IA pelo Google – um recurso projetado para dar suporte às crescentes demandas regulatórias e de governança interna.

    Uma postagem no blog do Google enfatiza que a proveniência não é mais um “recurso”, mas um requisito operacional, especialmente em domínios de alto risco como saúde, educação e mídia. O SynthID também permite que as equipes criadas no Google Cloud diferenciem o conteúdo gerado por IA e a mídia de terceiros em ativos, usem registros e trilhas de auditoria.

    As primeiras reações dos desenvolvedores variam de admiração a testes de casos extremos

    Apesar do enquadramento empresarial, as primeiras reações dos desenvolvedores transformaram as mídias sociais em um campo de testes em tempo real.

    Designer Travis Davids anunciou um menu de restaurante único com layout e tipografia impecáveis: “O texto longo gerado está oficialmente resolvido”.

    Imunologista Dra. Derya Unutmaz postou seu diagrama CAR-T com a legenda: “O que você fez, Google?!” enquanto Nikunj Kothari converteu um ensaio completo em uma palestra estilizada no quadro-negro de uma só vez, chamando os resultados de “simplesmente sem palavras”.

    Engenheiro Deedy Das elogiou seu desempenho em tarefas de edição e restauração de marca: “Edição semelhante ao Photoshop… Ela acerta tudo… De longe, o melhor modelo de imagem que já vi.”

    Desenvolvedor Parker Ortolani resumiu de forma mais simples: “Nano Banana continua absolutamente maluca”.

    Até os criadores de memes se envolveram. @cto_junior gerou um meme de “mesa de discurso LLM” totalmente estilizado – com logotipos, gráficos, monitores e tudo – em um único prompt, apelidando Gemini 3 Pro Image de “seu novo mecanismo de meme”.

    Mas o escrutínio também se seguiu. Pesquisador de IA Oral e Oculto testei o modelo em um problema de Sudoku com muita lógica, mostrando que ele alucinava tanto com um quebra-cabeça inválido quanto com uma solução sem sentido, observando que o modelo “infelizmente não é AGI”.

    A postagem serviu como um lembrete de que o raciocínio visual tem limites, especialmente em sistemas com restrições de regras, onde a lógica alucinada permanece um modo de falha persistente.

    Uma nova plataforma primitiva, não apenas um modelo

    O Gemini 3 Pro Image agora está presente em toda a pilha de desenvolvedores e empresas do Google: Google Ads, Workspace (Slides, Vids), Vertex AI, Gemini API e Google AI Studio. Também é implantado em ferramentas internas como o Antigravity, onde os agentes de design renderizam rascunhos de layout antes que os elementos da interface sejam codificados.

    Isso o torna um primitivo multimodal de primeira classe dentro do ecossistema de IA do Google, assim como a conclusão de texto ou o reconhecimento de fala.

    Em aplicativos corporativos, os recursos visuais não são decorações: são dados, documentação, design e comunicação. Seja gerando explicadores de integração, protótipos visuais ou materiais localizados, modelos como o Gemini 3 Pro Image permitem que os sistemas criem ativos de forma programática, com controle, escala e consistência.

    Numa altura em que a corrida entre OpenAI, Google e xAI está a ultrapassar os benchmarks e a entrar em plataformas, Nano Banana Pro é a declaração silenciosa do Google: o futuro da IA ​​generativa não será apenas falado ou escrito – será visto.



    absolutamente aclamado atualizado banana Como empresas foi Google imagem maluco modelo Nano para Pro usuários
    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    rafasgeek
    • Website

    Related Posts

    O editor de fotos do One UI 8.5 poderá em breve permitir que você misture objetos de uma foto para outra

    dezembro 11, 2025

    Fim da antena parabólica? A enorme atualização do Sky pode mudar a forma como você assiste TV

    dezembro 11, 2025

    Grande venda de LEGO confirmada – melhores ofertas de Natal, incluindo conjuntos populares de F1

    dezembro 11, 2025

    Comments are closed.

    Economy News
    News

    O editor de fotos do One UI 8.5 poderá em breve permitir que você misture objetos de uma foto para outra

    By rafasgeekdezembro 11, 20250

    Rita El Khoury / Autoridade AndroidDR Uma versão vazada do One UI 8.5 para o…

    Vídeos licenciados de IA de personagens da Disney chegarão no início de 2026

    dezembro 11, 2025

    Fim da antena parabólica? A enorme atualização do Sky pode mudar a forma como você assiste TV

    dezembro 11, 2025
    Top Trending
    News

    O editor de fotos do One UI 8.5 poderá em breve permitir que você misture objetos de uma foto para outra

    By rafasgeekdezembro 11, 20250

    Rita El Khoury / Autoridade AndroidDR Uma versão vazada do One UI…

    ChatGPT

    Vídeos licenciados de IA de personagens da Disney chegarão no início de 2026

    By rafasgeekdezembro 11, 20250

    Taylor Kerns / Autoridade AndroidDR A Disney e a OpenAI estão cooperando…

    Featured Markets

    Fim da antena parabólica? A enorme atualização do Sky pode mudar a forma como você assiste TV

    By rafasgeekdezembro 11, 20250

    A Sky acaba de anunciar uma grande mudança que pode finalmente significar…

    Subscribe to News

    Receba as últimas notícias esportivas do NewsSite sobre o mundo, esportes e política.

    Advertisement

    Todos os dias, uma nova tecnologia é lançada, e eu Rafas Geek, estou aqui para divulgar para o mundo, o que à de novo!

    Siga-nos nas redes sociais:

    Facebook X (Twitter) Instagram YouTube

    Subscribe to Updates

    Receba as últimas notícias criativas do FooBar sobre arte, design e negócios.

    Facebook X (Twitter) Instagram Pinterest
    • Home
    • Tecnologia
    • Entretenimento
    • News
    © 2025 Rafas Geek - Tudo sobre tecnologia 👨🏻‍💻 Rafas Geek.

    Type above and press Enter to search. Press Esc to cancel.