Robert Triggs / Autoridade Android
DR
- A Apple co-criou um modelo de IA que pode realizar edições avançadas em imagens com base em instruções de texto.
- MGIE pode alterar completamente uma imagem realizando edições como substituição de planos de fundo, manipulação de assuntos, remoção de objetos e muito mais.
- O modelo de IA foi apresentado em um artigo de pesquisa e não é algo que esperamos ver em um iPhone tão cedo.
A Apple e pesquisadores da Universidade da Califórnia, em Santa Bárbara, criaram em conjunto uma ferramenta de IA capaz de realizar edições de imagens com base em prompts de texto (via Batida de risco).
Chamada de “MGIE”, a IA foi apresentada em um artigo na Conferência Internacional sobre Representações de Aprendizagem de 2024. É um modelo multimodal de linguagem grande, como o Google Gemini, que pode editar imagens da mesma forma que você faria no Photoshop. Somente aqui você pode expressar seus pensamentos em texto e a IA fará todo o trabalho de edição para você.
Digamos que você tenha a imagem de uma Pizza. Você pode dizer ao MGIE para “torná-lo mais saudável” e isso adicionará coberturas mais saudáveis à torta da imagem. O artigo de coautoria da Apple também apresenta outros casos de uso de edição onde você pode remover objetos de imagens, alterar cores e aprimorar a iluminação e outros detalhes de uma imagem. Ele pode até transformar um caminho na floresta em praia, alterar o fundo das fotos, criar esboços artísticos e muito mais. Pense no Magic Editor do Google com esteróides. Você pode ver exemplos dos recursos de edição do MGIE aqui.
“MGIE consiste em um MLLM (Multimodal Large Language Model) e um modelo de difusão. O MLLM aprende a derivar instruções concisas e expressivas e oferece orientação visual explícita. O modelo de difusão é atualizado em conjunto e realiza edição de imagens”, explica o artigo.
Não há como dizer como a Apple planeja usar esses aprendizados em ferramentas reais de edição de imagens voltadas para o consumidor. Sabemos que a empresa está trabalhando em recursos generativos de IA para suas plataformas. É possível que vejamos ferramentas de edição baseadas em IA na nova série do iPhone 16. Embora presumamos que os extensos recursos de edição do MGIE possam precisar de uma boa quantidade de processamento, a Apple poderá introduzir uma versão atenuada da IA se e quando for aplicada em iPhones.
Se estiver interessado em experimentar o MGIE, você pode conferir uma demonstração hospedada aqui.