C. Scott Brown / Autoridade Android
DR
- O Google pode estar trabalhando em um novo projeto de IA chamado “Projeto Ellmann”.
- O Projeto Ellmann usaria os dados telefônicos de uma pessoa para fornecer uma “visão panorâmica” da vida dessa pessoa.
- O Projeto Ellmann seria capaz de descrever as fotos de um usuário mais profundamente usando biografias, momentos anteriores e fotos subsequentes como contexto.
Na semana passada, o Google lançou seu modelo de linguagem grande (LLM) de próxima geração, conhecido como Gemini. Um novo relatório afirma que uma das maneiras pelas quais o Google pode usar o Gemini é potencializar um novo recurso de IA que pode “responder a perguntas anteriormente impossíveis” sobre sua vida usando dados do telefone, como fotos e pesquisas.
De acordo com um relatório de CNBC, o Google está trabalhando em uma experiência de IA chamada “Projeto Ellmann”. Nomeado em homenagem ao biógrafo Richard David Ellmann, o Projeto Ellmann usaria LLMs para obter consciência do que está acontecendo em uma foto. O Google supostamente quer que o Projeto Ellmann se torne “Your Life Story Teller”.
Não está claro se a gigante da tecnologia incluiria o chatbot no Google Fotos ou em qualquer um de seus outros produtos. No entanto, um porta-voz disse ao canal:
O Google Fotos sempre usou IA para ajudar as pessoas a pesquisar suas fotos e vídeos, e estamos entusiasmados com o potencial dos LLMs para desbloquear experiências ainda mais úteis. Esta foi uma exploração interna inicial e, como sempre, caso decidíssemos lançar novos recursos, dedicaríamos o tempo necessário para garantir que fossem úteis para as pessoas e projetados para proteger a privacidade e a segurança dos usuários como nossa principal prioridade.
Parece que o recurso funcionaria coletando dados de resultados de pesquisa e encontrando padrões em suas fotos. O Projeto Ellmann seria então capaz de descrever as fotos de um usuário mais profundamente usando biografias, momentos anteriores e fotos subsequentes, em vez de usar “apenas pixels com rótulos e metadados”, segundo o veículo.
A apresentação em questão também parece fornecer alguns exemplos, como alguém que participou recentemente de uma reunião escolar. Diz-se que o Projeto Ellmann seria capaz de inferir que já se passaram 10 anos desde que o usuário se formou e que a imagem inclui rostos que eles não viam há uma década, provavelmente tornando a foto uma foto de reunião.
Além disso, o Google também exibiu o “Ellmann Chat”, com a descrição: “Imagine abrir o ChatGPT, mas ele já sabe tudo sobre a sua vida. O que você perguntaria? Em resposta à pergunta “Eu tenho um animal de estimação?” o chatbot foi capaz de responder sim, bem como fornecer detalhes adicionais sobre o que o cachorro estava vestindo, o nome do cachorro e os membros da família com quem ele costuma estar mais próximo.
Atualmente não se sabe quando ou se o Google planeja lançar o recurso.