Ryan Haines / Autoridade Android
Motorola Razr (2024)
Resumo
- Em breve, o Gemini permitirá que você ajuste uma imagem gerada anteriormente.
- Você poderá fazer isso por meio de prompts de texto e também circulando manualmente o que deseja alterar especificamente.
- Embora possamos ver esses recursos no aplicativo beta mais recente do Google para Android, ainda não conseguimos fazê-los funcionar.
A geração de imagens é um dos principais recursos de qualquer chatbot de IA, e não há exceção para o Google Gemini nessa frente. Assim como outros chatbots, o Gemini permite que você crie imagens a partir de prompts de texto e, em seguida, use essas imagens para o que quiser. No entanto, uma coisa que falta ao Gemini é a capacidade de ajustar uma imagem depois que ela foi gerada — mas isso pode mudar muito em breve.
Um Desmontagem do APK ajuda a prever recursos que podem chegar a um serviço no futuro com base no código do trabalho em andamento. No entanto, é possível que tais recursos previstos não cheguem a um lançamento público.
No mais recente aplicativo beta do Google para Android (v15.29.34.29 beta), vemos novas ferramentas relacionadas ao ajuste fino de imagens geradas por IA. Isso pode ser incrivelmente útil para situações em que você gosta da imagem que foi criada, mas não gosta de um detalhe específico sobre ela. Hoje, o Gemini não tem como consertar uma imagem — você só precisa criar uma nova por meio de um novo prompt, o que significa que você pode gastar muito tempo indo e voltando com o Gemini tentando obter o resultado certo.
Este novo recurso de ajuste fino, no entanto, tornará isso muito mais fácil por meio de dois métodos diferentes. Primeiro, o Gemini agora poderá manter o núcleo de uma imagem, mas alterar certas coisas por meio de prompts de linguagem natural. No exemplo abaixo (imagem do meio), você pode ver como o Gemini entenderá que você não quer uma nova imagem, você só quer alterar a que já está lá:
O segundo método para fazer isso é usar seu dedo (ou caneta em telefones suportados) para circular um aspecto da imagem que você deseja alterar (captura de tela acima, à direita). Você pode então dizer ao Gemini o que deseja editar sem precisar descrever a parte da imagem à qual está se referindo — o Gemini entenderá que você está ajustando a parte circulada.
Infelizmente, embora tenhamos conseguido ver a evidência desses recursos, não conseguimos fazê-los funcionar corretamente. É provável que o Google precise fazer alguma troca do lado do servidor antes que eles se tornem ativos. Ainda assim, é bom ver que pode haver muito mais controle sobre a geração de imagens em breve no Gemini.