Ryan Haines / Autoridade Android
DR
- O Google está trabalhando na capacidade de editar com precisão imagens geradas por IA criadas com o Google Gemini.
- Ativamos o recurso e temos uma demonstração para mostrar como o recurso de edição precisa funcionará no Google Gemini.
Assim como muitos outros chatbots de IA, o Google Gemini permite a geração de imagens usando prompts de texto. Porém, o processo de edição pós-geração não é muito intuitivo. Você precisa inserir instruções de texto para refinar ainda mais o resultado, mas não há como destacar especificamente qualquer parte da imagem para uma edição precisa. O Google está trabalhando para adicionar a capacidade de fazer seleções para edições precisas, e temos uma demonstração para mostrar como o recurso funcionaria no Android.
Um Desmontagem do APK ajuda a prever recursos que podem chegar a um serviço no futuro com base no código de trabalho em andamento. No entanto, é possível que tais recursos previstos não cheguem ao lançamento público.
O aplicativo beta mais recente do Google para Android (v15.40.31.29 beta) nos permitiu ativar o recurso preciso de edição de imagens no Gemini. O recurso ainda está em andamento, mas funciona melhor do que antes. Confira em ação no vídeo de demonstração abaixo:
Como você pode ver na demonstração, podemos gerar uma imagem usando prompts de texto. Assim como acontece com os geradores de imagens, ser descritivo em seu prompt ajuda a aproximar a imagem do que você deseja. Mas se quiser fazer algumas alterações, você pode usar as instruções de acompanhamento para criar edições. Essas edições podem ser feitas na imagem mais ampla ou você pode selecionar certas partes da imagem e adicionar um prompt de edição com um escopo mais restrito.
No entanto, como a demonstração demonstra claramente, as edições nem sempre são precisas e confiáveis. Edições ainda mais simples para adicionar objetos secundários podem, às vezes, criar uma variação do assunto principal (o cachorro nesta demonstração). Em alguns exemplos, a imagem também é totalmente alterada. Felizmente, você pode retornar a uma imagem gerada anteriormente se não gostar das alterações mais recentes.
Depois de criar e editar a imagem, você poderá ver o processo de edição da imagem como uma conversa normal do chatbot em seu histórico de bate-papo. Você pode retomar a edição tocando em qualquer uma das imagens geradas na conversa.
AssembleDebug/Autoridade Android
Observe que editamos o vídeo para remover os tempos de espera de geração de imagens, que eram superiores a 10 segundos por imagem ao usar o Gemini Advanced. Portanto, leve em consideração que cada edição levará algum tempo para ser executada.
Estamos felizes em ver a geração de imagens no Gemini funcionar bem com o recurso de edição precisa, embora ainda haja espaço para melhorias. Teremos que esperar que o Google lance o recurso para todos os usuários, o que esperamos que aconteça em breve.