Autoridade Andy Walker / Android

O Google abriu tantos produtos de IA nos últimos anos que eu precisaria dos meus dedos, dedos dos pés e dígitos de várias outras pessoas para manter a contagem. Sua atração principal atual é Gemini, que também funciona como seu assistente virtual em seus inúmeros produtos. Mas, se você estiver disposto a levantar sua rocha de desenvolvimento para espiar os rastejadores assustadores abaixo, encontrará a Ai Edge Gallery.

Escondido no Github-onde poucos produtos fabricados no Google já residiram-a AI Edge Gallery oferece aos adotantes os primeiros modelos de IA totalmente baixados que podem ser executados inteiramente no telefone. Para descobrir por que o Google baniu esse aplicativo além da Play Store e o que ele realmente pode fazer, peguei meu pixel e o baixei. Aqui está o que eu descobri.

O que é o Google Ai Edge Gallery?

Autoridade Andy Walker / Android

Primeiro, deixe -me fornecer detalhes sobre o que é a galeria Ai Edge. O aplicativo permite que os usuários baixem e executem grandes modelos de idiomas (LLMS) em telefones Android para uso offline. Depois de baixado, o LLMS não exige uma conexão com a Internet para fazer consultas, o que torna a AI Edge Gallery, em teoria, muito útil em situações isoladas. Atualmente, o aplicativo oferece quatro LLMs que variam em tamanho e habilidade. Ele também divide -os em três sugestões para usá -las: pergunte a imagem, laboratório rápido e bate -papo de IA.

A AI Edge Gallery permite que os usuários baixem LLMs que podem ser usados ​​para processamento rápido offline no seu telefone.

Essas categorias são amplamente auto-descritivas, mas explicam o que esperar da AI Edge Gallery. Você pode usar esses modelos para fazer perguntas sobre imagens, se envolver em bate-papos simples, como faria com Gemini ou ChatGPT e usar prompts para “casos de uso de volta única”.

Instalação e configuração são uma dor, mas o aplicativo é liso e suave

Há uma boa razão pela qual a AI Edge Gallery não está na Play Store. A configuração é uma dor absoluta, mesmo que o aplicativo seja agitado e pareça um produto feito no Google.

Depois de pegar o aplicativo no Github e instalá -lo, você precisará instalar os modelos individuais que deseja experimentar. No entanto, antes disso, você precisará criar uma conta de face abraçando – o site que hospeda os modelos – e reconhece vários contratos de usuário. Isso inclui um no próprio aplicativo da AI Edge Gallery, outro em abraçar o rosto e, finalmente, o próprio formulário de solicitação de acesso Gemma do Google.

Finalmente, depois de tudo isso, você precisará tocar várias vezes para voltar ao aplicativo da AI Edge Gallery, onde o download do modelo começará.

Houve várias vezes em que emiti um suspiro alto durante esse processo, e não o culparia se você preferir limpar todos os seus sapatos. No entanto, eu persisti.

O processo de configuração, desde o download do aplicativo até o uso do modelo de sua escolha, é acolchoado por vários reconhecimentos do usuário.

Para aguardar meu paladar, pulei para o trem Gemma-3n-4eb-it-Int4 (vou me referir a ele simplesmente como “gemma” à medida que avançamos). Em 4,4 GB, é o maior modelo disponível na galeria e está disponível nas três categorias. Em teoria, o maior modelo deve oferecer tudo o que preciso para atingir qualquer meta de chatbot offline que eu poderia ter. Na maioria das vezes, seus recursos offline eram impressionantes.

Um planejador de viagens offline, professor de ciências e chef sous

Autoridade Andy Walker / Android

Para testar os recursos desse modelo e, portanto, a utilidade da Galeria Ai Edge, eu queria usar vários avisos que normalmente executaria por ChatGPT e Gemini – produtos que tenham acesso à Internet.

Para meu primeiro truque, perguntei a Gemma sobre uma viagem teórica à Espanha. Usei o aviso: “Estou viajando para a Espanha em algumas semanas. Quais são alguns itens que devo considerar embalar e quais pontos turísticos devo ver?” Eu queria testar seus recursos como companheiro de viagem offline. Após vários segundos de ponderação de uma resposta, Gemma entrou em ação e concluiu a resposta três minutos depois. Isso é muito tardio, mas considerando que ficou totalmente offline e deixou meu Pixel 8 muito quente, fiquei impressionado.

Os tempos de processamento são longos, mas considerando que o LLM está sendo totalmente offline no meu pixel 8, é admirável.

Fiquei ainda mais impressionado ao percorrer a resposta. Considerando que não especifiquei quanto tempo gastaria na Espanha, para onde iria, ou quando sairia, Gemma ofereceu muitas vistas para ver, quantidades exatas de roupas que eu deveria embalar e dicas adicionais de viagem.

Para testar se pode se conectar à Internet, se necessário, perguntei: “Quais são as maiores notícias do dia?” Isso me deu uma resposta de 26 de outubro de 2023, presumivelmente o limite de seu conhecimento global. Isso não é um problema, mas lembre -se de que esse modelo é mais adequado para consultas atemporais.

Ok, voltando às perguntas gerais. Eu queria ver o quão proficiente é o modelo em explicar teorias estabelecidas. Pedi para “explicar a teoria da relatividade e fornecer um exemplo do ELI5”. Novamente, levou um dia e uma idade, mas, eventualmente, produziu uma revisão profunda da teoria de Einstein.

Não espere que os modelos substituam serviços como perplexidade que possam acessar facilmente informações na Internet.

Ele também ofereceu um explicador detalhado sobre a fonte de chocalhos provenientes do compartimento do motor de um carro, receitas para fazer sorvete de baunilha, fatos sobre as montanhas mais altas do mundo e uma explicação da regra de impedimento do futebol. Todas as respostas foram precisas.

Quão bom é o aplicativo para criar coisas?

Na seção de laboratório imediato, você pode usar um modelo para “reescrever o tom, resumir o texto e os trechos de código”. O último caso de uso é bem legal! Para um Noob completo de codificação, pedi a Gemma para “criar código que responda com ‘Hello’ quando eu inserir ‘bom dia.’. Também existem sete idiomas para escolher. Notavelmente, a resposta inclui a integração do código em vários cenários, como um site, tornando -o uma excelente ferramenta educacional ou de verificação.

O aplicativo também permite o resumo dos blocos de texto, e também não é muito ruim. Enfriguei a introdução do artigo da teoria da relatividade da Wikipedia na caixa imediata, e Gemma dividiu com confiança o conteúdo em cinco pontos de bala. A resposta foi rápida o suficiente para considerar o uso da AI Edge Gallery para quebrar PDFs e estudos mais longos, em vez de Chatgpt, especialmente em documentos que não quero compartilhar. Existem várias opções de resposta, incluindo marcadores, parágrafos mais curtos e muito mais.

Que tal a reescrita de tom? Não tenho certeza quando usaria esse recurso na minha vida. Prefiro optar por aplicativos de bate-papo e o ajuste de tom embutido do Gmail. No entanto, dei a Gemma o mesmo trecho usado acima, selecionando a opção de tom entusiasmado. Você pode ver os resultados nas capturas de tela acima.

Autoridade Andy Walker / Android

É importante lembrar que o modelo que você usa determinará as respostas, recursos e velocidade de processamento da AI Edge Gallery. O aplicativo oferece muita flexibilidade nesse sentido. Você pode baixar todos os quatro e usá -los de forma intercambiável, ou pode usar o maior modelo (como eu) e chamá -lo de dia. Você pode até conseguir o menor modelo e desfrutar de uma operação mais rápida, embora com inteligência mais limitada. A escolha é sua.

Identificando tomates, mas monumentos extraviados

E as consultas de imagem? O aplicativo facilita a seleção de uma imagem dos meus álbuns ou captura uma nova foto e faça uma pergunta sobre ela.

Para o meu teste, escolhi uma foto de alguns tomates que crescemos durante a primavera. Perguntei a Gemma: “Como faço para cultivar isso?” Impressionantemente, o modelo os identificou com precisão como tomate uva, ofereceu uma quebra completa de seu habitat e condições preferidas, detalhes sobre como iniciá -los a partir de sementes, incluindo detalhes como desbaste e mistura de solo e sugestões para o plantio de plantio ao ar livre. Essa resposta levou mais de quatro minutos, mas foi uma resposta brilhante e detalhada!

Consultei seu conhecimento dos marcos locais para ver como ele lidava com imagens mais sutis. Escolhi uma imagem de Ng Kerk, de Franschhoek, a igreja mais antiga em uma das cidades mais bonitas da África do Sul. Eu não esperava que soubesse e, bem, não. Ele respondeu com: “Esta é a Igreja de Santa Maria em Stellenbosch”. Ele escolheu uma cidade próxima, mas isso é uma Cruz Vermelha. Talvez soubesse o monumento huguenot mais distinto em Franschhoek? Não. Isso está em Roma, o modelo decidiu.

Claramente, Gemma luta com o reconhecimento de edifícios, mas tem pouco problema com os tomates. Parece que você terá sucesso misto aqui com base na prevalência e familiaridade dos objetos dentro de uma imagem. Isso ainda o torna bastante útil em alguns casos. Vou ter que testar isso um pouco mais em um recurso futuro.

Eu ativei sua lanterna (apenas brincando!)

Autoridade Andy Walker / Android

Por fim, quero discutir onde os modelos da AI Edge Gallery e um assistente virtual real como Gêmeos diferem. Este último tem um controle quase completo do meu Pixel 8 e me permite reproduzir listas de reprodução específicas no Spotify, abrir canais do YouTube, pesquisar na Internet ou acionar minha lanterna com um prompt simples. No entanto, isso não é possível com a AI Edge Gallery.

Embora pedir a Gemma que “ligue a minha lanterna” seja reconhecida e aceita como um rápido, e o modelo responde alegremente “Ok! Eu ativei sua lanterna”, acrescenta que ele não pode realmente fazer isso porque é uma “IA baseada em texto”. Ele entende o que eu quero realizado, mas sua rede não chega tão longe.

A AI Edge Gallery não pode substituir Gemini, pelo menos não como assistente virtual.

Para ser justo, não esperava que esse aplicativo tivesse esse nível de controle sobre o meu dispositivo, mas tive que testar isso de qualquer maneira. Se você esperava substituir o Assistente ou Gêmeos por um produto offline como a AI Edge Gallery, ficará muito desapontado. Também vale a pena notar que a AI Edge Gallery e seus modelos não podem gerar imagens de prompts ou abordar consultas sobre arquivos que não sejam imagens. Felizmente, esses recursos chegarão às iterações futuras do aplicativo.

Há uma razão pela qual Gêmeos é o produto AI voltado para o consumidor do Google

Então, vale a pena tentar a AI Edge? Sem dúvida, sim. Como alguém que adora a idéia de LLMs totalmente offline que se conecta apenas à Internet quando disponível ou necessária, os modelos aqui realmente me excitam, e esse aplicativo possibilita testá -los sem muitos problemas. Tenho certeza de que a trituração de consultas também seria muito mais rápida e eficiente em um smartphone mais rápido. Eu sinto que meu pixel 8 foi o gargalo aqui.

O aplicativo em si parece ótimo e funciona adequadamente na maioria das vezes, mas ainda requer alguns polimento aqui e ali. Deixe-o aberto em segundo plano e você receberá regularmente caixas não respondentes e várias falhas quando retornar ao foco. Ele também tem vários problemas irritantes de UX. Deslizar pela tela esquerda ou direita limpará seu último prompt e você terá que começar tudo de novo. É notavelmente fácil fazer isso por acidente.

A Ai Edge Gallery torna possível o processamento offline privado, mas há uma razão para não estar na Play Store.

No entanto, ainda fico impressionado com os inteligentes de identificação de imagem do aplicativo. Como alguém que usa regularmente o Circle para pesquisar para identificar plantas, animais e pontos de referência, a AI Edge Gallery pode ser útil se eu estiver preso no deserto sem uma conexão e um pássaro não identificado. Você não pode considerar uma ferramenta de IA offline necessária, mas o processamento de dados no seu telefone possui benefícios de privacidade e segurança.

Se você possui um telefone Android, recomendo pegar a AI Edge Gallery, talvez não como um substituto para Gêmeos, mas como um vislumbre do futuro distante, onde grande parte da inteligência de Gêmeos poderia estar disponível localmente.



Share.
Leave A Reply

Exit mobile version