Ryan Haines / Autoridade Android
A sabedoria convencional diz que as especificações dos smartphones não importam mais. Esteja você olhando para os melhores carros-chefe ou para um corajoso mid-ranger, todos eles são mais do que capazes de realizar tarefas diárias, jogar os jogos para celular mais recentes e até mesmo tirar fotos incrivelmente boas. É muito difícil encontrar hardware móvel totalmente ruim, a menos que você esteja esgotando o orçamento absoluto do mercado.
Caso em questão, consumidores e especialistas estão apaixonados pela série Pixel 8, embora ela esteja bem atrás do iPhone 15 e de outros rivais do Android. Da mesma forma, os carros-chefe mais recentes da Apple e da Samsung mal mexem no hardware da câmera, mas continuam a ser altamente considerados pela fotografia.
As especificações simplesmente não equivalem mais automaticamente ao melhor smartphone. E, no entanto, a série Pixel 8 do Google e a próxima linha Samsung Galaxy S24 colocaram o pé naquela porta que se fechava. Na verdade, podemos muito bem estar prestes a embarcar em uma nova corrida armamentista de especificações. Estou falando, é claro, da IA e do debate cada vez mais acalorado sobre os prós e os contras do processamento no dispositivo versus o processamento baseado na nuvem.
Os recursos de IA estão tornando nossos telefones ainda melhores rapidamente, mas muitos exigem processamento em nuvem.
Resumindo, a execução de solicitações de IA é bastante diferente das cargas de trabalho tradicionais de CPU e gráficos de uso geral com as quais passamos a associar e fazer benchmark em dispositivos móveis, laptops e outros dispositivos de consumo.
Para começar, os modelos de aprendizado de máquina (ML) são grandes, exigindo grandes conjuntos de memória para serem carregados antes mesmo de executá-los. Mesmo os modelos compactados ocupam vários gigabytes de RAM, o que lhes confere um consumo de memória maior do que muitos jogos para celular. Em segundo lugar, a execução eficiente de um modelo de ML requer mais blocos lógicos aritméticos exclusivos do que uma CPU ou GPU típica, bem como suporte para pequenos formatos de números inteiros, como INT8 e INT4. Em outras palavras, o ideal é que você precise de um processador especializado para executar esses modelos em tempo real.
Por exemplo, tente executar a geração de imagem Stable Diffusion em uma CPU moderna e poderosa para desktop; leva vários minutos para produzir um resultado. OK, mas isso não é útil se você quiser uma imagem com pressa. CPUs mais antigas e de menor consumo de energia, como as encontradas em telefones, simplesmente não são adequadas para esse tipo de trabalho em tempo real. Há uma razão pela qual a NVIDIA está no negócio de vender placas aceleradoras de IA e porque os principais processadores de smartphones promovem cada vez mais seus recursos de IA. No entanto, os smartphones permanecem limitados pelos seus pequenos orçamentos de energia e espaço térmico limitado, o que significa que há um limite sobre o que pode ser feito atualmente no dispositivo.
Damien Wilde / Autoridade Android
Em nenhum lugar isso é mais evidente do que nos smartphones Pixel mais recentes e nos próximos smartphones Galaxy. Ambos contam com novos recursos de IA para distinguir os novos modelos de seus antecessores e possuem processadores acelerados por IA para executar ferramentas úteis, como Call Screening e Magic Eraser, sem a nuvem. No entanto, observe as letras pequenas e você descobrirá que é necessária uma conexão com a Internet para o processamento em nuvem de vários dos recursos de IA mais exigentes. O Video Boost do Google é um excelente exemplo, e a Samsung já esclareceu que alguns dos próximos recursos do Galaxy AI também serão executados na nuvem.
Aproveitar o poder do servidor para executar tarefas que não podem ser realizadas em nossos telefones é obviamente uma ferramenta útil, mas existem algumas limitações. A primeira é que essas ferramentas exigem conexão à Internet (obviamente) e consomem dados, o que pode não ser adequado em conexões lentas, planos de dados limitados ou em roaming. A tradução de idiomas em tempo real, por exemplo, não é boa em uma conexão com latência muito alta.
O processamento local de IA é mais confiável e seguro, mas requer hardware mais avançado.
Em segundo lugar, a transmissão de dados, especialmente informações pessoais, como conversas ou fotos, é um risco à segurança. Os grandes nomes afirmam manter seus dados protegidos contra terceiros, mas isso nunca é uma garantia. Além disso, você terá que ler as letras miúdas para saber se eles estão usando seus uploads para treinar ainda mais seus algoritmos.
Terceiro, esses recursos podem ser revogados a qualquer momento. Se o Google decidir que o Video Boost é muito caro para funcionar a longo prazo ou não é popular o suficiente para ser suportado, ele pode ser desligado e um recurso para o qual você comprou o telefone desaparecerá. É claro que o inverso é verdadeiro: as empresas podem adicionar mais facilmente novos recursos de IA em nuvem aos dispositivos, mesmo aqueles que não possuem hardware de IA forte. Então não é de todo ruim.
Ainda assim, idealmente, é mais rápido, mais barato e mais seguro executar tarefas de IA localmente, sempre que possível. Além disso, você mantém os recursos enquanto o telefone continuar funcionando. No dispositivo é melhor, por isso a capacidade de compactar e executar grandes modelos de linguagem, geração de imagens e outros modelos de aprendizado de máquina em seu telefone é um prêmio que os fornecedores de chips estão correndo para reivindicar. O mais recente carro-chefe da Qualcomm, Snapdragon 8 Gen 3, Dimensity 9300 da MediaTek, Tensor G3 do Google e A17 Pro da Apple, todos apresentam um jogo de IA maior do que os modelos anteriores.
O processamento em nuvem é uma bênção para telefones acessíveis, mas eles podem acabar ficando para trás na corrida armamentista dos dispositivos.
No entanto, todos esses são chips emblemáticos caros. Embora a IA já esteja aqui para os telefones principais mais recentes, os telefones de gama média estão perdendo. Principalmente porque eles não possuem o silício de IA de ponta para executar muitos recursos nos dispositivos, e muitos anos se passarão até que os melhores recursos de IA cheguem aos chips de médio porte.
Felizmente, os dispositivos de médio porte podem aproveitar o processamento em nuvem para contornar esse déficit, mas ainda não vimos uma indicação de que as marcas estejam com pressa para reduzir esses recursos. O Google, por exemplo, incorporou o preço de seus recursos de nuvem ao preço do Pixel 8 Pro, mas o Pixel 8 mais barato fica sem muitas dessas ferramentas (por enquanto). Embora a lacuna entre os telefones de gama média e os principais para as tarefas do dia-a-dia tenha realmente diminuído nos últimos anos, há uma divisão crescente no domínio das capacidades de IA.
O resultado final é que se você deseja que as melhores e mais recentes ferramentas de IA sejam executadas no dispositivo (e você deveria!), Precisamos de um silício para smartphone ainda mais poderoso. Felizmente, os mais recentes chips e smartphones, como a próxima série Samsung Galaxy S24, nos permitem executar uma seleção de ferramentas poderosas de IA no dispositivo. Isso só se tornará mais comum à medida que a corrida armamentista do processador de IA esquentar.