
Edgar Cervantes / Autoridade Android
Tl; Dr
- O Google está expandindo o acesso ao Gemini Nano, seu modelo de IA no dispositivo, por meio de novas APIs do ML Kit Genai.
- Essas novas APIs, provavelmente anunciadas na E/O 2025, permitirão aos desenvolvedores implementar facilmente recursos como resumo de texto, revisão, reescrita e geração de descrição da imagem em seus aplicativos.
- Ao contrário das AIs Experimentais AI Edge SDK, o Genai APIs do ML Kit estará na versão beta, suportará a entrada da imagem e estará disponível em uma gama mais ampla de dispositivos Android além da série Pixel 9.
A tecnologia de IA generativa está mudando a maneira como nos comunicamos e criamos conteúdo online. Muitas pessoas pedem aos chatbots da IA como o Google Gemini para executar tarefas como resumir um artigo, revisar um email ou reescrever uma mensagem. No entanto, algumas pessoas têm cuidado ao usar esses chatbots da IA, especialmente quando essas tarefas envolvem informações altamente pessoais ou sensíveis. Para abordar essas preocupações com a privacidade, o Google oferece o Gemini Nano, uma versão menor e mais otimizada do seu modelo de IA que é executado diretamente no dispositivo em vez de em um servidor em nuvem. Embora o acesso ao Gemini Nano tenha sido limitado até agora a uma única linha de dispositivo e entrada somente de texto, o Google expandirá significativamente sua disponibilidade e introduzirá suporte de entrada de imagem.
No final do mês passado, o Google publicou a lista de sessões para 2025, que inclui uma sessão intitulada “Gemini Nano no Android: Building with Ditice Gen AI”. A descrição da sessão afirma que “introduzirá um novo conjunto de APIs de IA generativas que aproveitam o poder do Nano Gemini. Essas novas APIs facilitam a implementação de casos de uso para resumir, revisar e reescrever o texto, além de gerar descrições de imagens”.
Em outubro, o Google abriu o acesso experimental ao Gemini Nano através do AI Edge SDK, permitindo que desenvolvedores de terceiros experimentem instruções de texto em texto na série Pixel 9. O AI Edge SDK permite recursos baseados em texto, como reformulação, respostas inteligentes, revisão e resumo, mas não inclui suporte para gerar descrições de imagens, um recurso que o Google destacou para a próxima sessão de E/S. Assim, é provável que o “novo conjunto de AIs generativas de AI” mencionado na descrição da sessão se refere a algo totalmente diferente do AI Edge SDK ou a uma versão mais recente dela. Felizmente, não precisamos esperar até a próxima semana para descobrir.
No início desta semana, o Google publicou silenciosamente documentação sobre as novas APIs da Genai do ML Kit. O ML Kit é um SDK que permite aos desenvolvedores aproveitar os recursos de aprendizado de máquina em seus aplicativos sem precisar entender como os modelos subjacentes funcionam. As novas APIs da Genai permitem que os desenvolvedores “aproveitem o poder do Gemini Nano para oferecer desempenho pronta para as tarefas comuns por meio de uma interface simplificada e de alto nível”. Como o AI Edge SDK, ele é “construído no Aicore”, permitindo “Execução no dispositivo de modelos de fundação de IA como Gemini Nano, aprimorando a funcionalidade do aplicativo e a privacidade do usuário mantendo o processamento de dados local.

Autoridade Mishaal Rahman / Android
Em outras palavras, as APIs Genai do ML Kit simplificam para os desenvolvedores usarem o Gemini Nano para vários recursos em seus aplicativos em particular e com alto desempenho. Atualmente, esses recursos incluem resumir, revisar ou reescrever texto, além de gerar descrições de imagens. Todos esses quatro recursos correspondem ao que é mencionado na descrição da sessão de E/S, sugerindo que o Google pretende anunciar formalmente as APIs Genai do ML Kit na próxima semana.
Aqui está um resumo de todos os recursos oferecidos pelas APIs de Genai do ML Kit:
- Resumo: Resuma os artigos ou conversas de bate -papo como uma lista de marcadores.
- Gera até três pontos de bala
- Idiomas: inglês, japonês e coreano
- Revisão: Polonam conteúdo curto, refinando a gramática e corrigindo erros de ortografia.
- Idiomas: inglês, japonês, alemão, francês, italiano, espanhol e coreano
- Reescrever: Reescreva mensagens de bate -papo curtas em diferentes tons ou estilos.
- Estilos: elaborado, emojify, encurtar, amigável, profissional, reformular
- Idiomas: inglês, japonês, alemão, francês, italiano, espanhol e coreano
- Descrição da imagem: Gere uma breve descrição de uma determinada imagem.
Comparado ao AI Edge SDK existente, as APIs Genai do ML Kit serão oferecidas em “beta” em vez de “acesso experimental”. Essa designação ‘beta’ pode significar que o Google permitirá que os aplicativos usem as novas APIs da Genai na produção. Atualmente, os desenvolvedores não podem liberar aplicativos usando o AI Edge SDK, o que significa que nenhum aplicativo de terceiros pode aproveitar o Gemini Nano neste momento. Outra diferença é que o AI Edge SDK é limitado à entrada de texto, enquanto as imagens de suporte do Genai APIs do ML Kit. Esse suporte à imagem permite o recurso de descrição da imagem, permitindo que os aplicativos gerem descrições curtas de qualquer imagem.
A maior diferença entre a versão atual das APIs Genai do AI Edge SDK e ML Kit, no entanto, é o suporte ao dispositivo. Enquanto o AI Edge SDK suporta apenas a série Google Pixel 9, as APIs Genai do ML Kit podem ser usadas em qualquer telefone Android que suporta o modelo multimodal de Nano Gemini. Isso inclui dispositivos como The Honor Magic 7, Motorola Razr 60 Ultra, OnePlus 13, Samsung Galaxy S25, Xiaomi 15 e muito mais.
Os desenvolvedores que estão interessados em experimentar o Gemini Nano em seus aplicativos podem começar lendo a documentação pública para as APIs do ML Kit Genai.