Joe Hindy / Autoridade Android
DR;TL
- A Niantic está construindo um novo tipo de modelo de IA que pode compreender e navegar no mundo físico.
- A empresa está treinando sua IA com base em dados coletados de seus aplicativos móveis, como Pokémon Go e Scaniverse.
- Sugere-se que esta IA possa ser usada para apoiar AR, robótica, criação de conteúdo e muito mais.
A fabricante de jogos AR para dispositivos móveis, Niantic, está atualmente trabalhando em um novo tipo de modelo de IA destinado a ajudar os computadores a entender e navegar melhor em espaços físicos. Como acontece com qualquer IA, este modelo requer dados para treinamento. Parece que a empresa está se apoiando nas grandes quantidades de dados que seus jogadores fornecem para essa tarefa.
Se você tiver um interesse passageiro em Pokémon, poderá reconhecer a Niantic como a empresa por trás do popular jogo de AR Pokémon Go. Ela também criou vários outros jogos e aplicativos de RA, como o aplicativo de digitalização 3D Scaniverse. Esses jogos e aplicativos fazem varreduras do ambiente ao redor para que seus recursos de AR funcionem.
Em uma postagem de blog, vista pela primeira vez por 404 Mídiaa Niantic anunciou que está desenvolvendo o que chama de grande modelo geoespacial (LGM). Fazendo comparações com grandes modelos de linguagem (LLM) – como Gemini e ChatGPT – que treinam em coleções de texto para gerar linguagem escrita, a empresa explica que seu LGM treina em “bilhões de imagens do mundo, todas ancoradas em locais precisos do globo”. permitindo que os computadores “percebam, compreendam e naveguem no mundo físico”. A empresa sugere que a tecnologia poderia ser usada para oferecer suporte a AR, robótica, criação de conteúdo e muito mais.
Quanto aos dados sobre os quais este LGM está treinando, a Niantic revela que está usando as varreduras coletadas por meio de seus jogos para celular e do Scaniverse:
Nos últimos cinco anos, a Niantic se concentrou na construção de nosso Sistema de Posicionamento Visual (VPS), que usa uma única imagem de um telefone para determinar sua posição e orientação usando um mapa 3D construído a partir de pessoas escaneando locais interessantes em nossos jogos e no Scaniverse.
Se você já jogou Pokémon Go, provavelmente já experimentou este VPS por meio do recurso Pokémon Playgrounds. Pokémon Playgrounds permite ao usuário colocar um Pokémon em um local específico. Esses dados conseguem permanecer naquele local, permitindo que outros jogadores interajam com a criatura digital ao entrarem naquela área.
Segundo a empresa, já treinou mais de 50 milhões de redes neurais, cada uma representando um local ou ângulo de visão específico. Estas redes são capazes de comprimir milhares de imagens cartográficas, criando uma representação de um espaço físico. Esta representação pode oferecer posicionamento preciso para um local com “precisão de nível centimétrico” quando dada uma imagem de consulta. Múltiplas redes poderiam combinar esse conhecimento para mapear uma área e compreender qualquer local, mesmo em ângulos desconhecidos.
Um exemplo que a empresa fornece é ficar perto de uma igreja onde apenas um ângulo foi visto. O LGM permitiria que uma IA preenchesse as lacunas de como aquele edifício poderia ser com base em outras imagens semelhantes:
Imagine-se atrás de uma igreja. Suponhamos que o modelo local mais próximo tenha visto apenas a entrada frontal daquela igreja e, portanto, não será capaz de lhe dizer onde você está. A modelo nunca viu a parte de trás daquele prédio. Mas numa escala global, temos visto muitas igrejas, milhares delas, todas capturadas pelos seus respectivos modelos locais noutros lugares do mundo. Nenhuma igreja é igual, mas muitas compartilham características comuns. Um LGM é uma forma de acessar esse conhecimento distribuído.
A escala da operação da Niantic é bastante impressionante, para dizer o mínimo. Ele afirma que recebe mais de um milhão de novas varreduras de lugares do mundo real fornecidas por usuários por semana.
O que você acha do fato de a Niantic usar seus dados para treinar seu LGM? Deixe-nos saber nos comentários abaixo.