Oliver Cragg / Autoridade Android
DR
- A Apple revelou os modelos que irão potencializar seus próximos recursos de IA no iPhone, iPad e Mac.
- Os modelos básicos vêm em variantes no dispositivo e no servidor, dependendo do caso de uso.
- Os modelos da Apple podem corresponder ao GPT-3.5, mas não são os melhores do setor.
A Apple anunciou uma série de recursos de IA para iPhone, iPad, Mac e Siri na WWDC 2024 ontem, mas em uma reviravolta surpreendente, não detalhou os modelos generativos de IA que usará para alimentá-los. Embora os rumores indicassem que a empresa confiaria no ChatGPT da OpenAI ou no Gemini do Google, eles se revelaram apenas parcialmente verdadeiros. Por exemplo, embora uma integração ChatGPT esteja de fato chegando ao iOS, iPadOS e macOS ainda este ano, ela não alimentará o Siri renovado ou outros recursos do Apple Intelligence.
Mas graças a uma nova postagem no blog de pesquisa de aprendizado de máquina da Apple, agora sabemos mais sobre a estratégia de IA da empresa para 2024 e além. Para começar, a empresa contará com seus próprios grandes modelos de linguagem (LLMs), em vez de licenciar ofertas de terceiros como Google e OpenAI.
A Apple afirma que seus modelos básicos foram “ajustados para experiências do usuário, como escrever e refinar texto, priorizar e resumir notificações, criar imagens divertidas para conversas com familiares e amigos e realizar ações no aplicativo para simplificar as interações entre aplicativos”. A postagem do blog aprofunda alguns dos aspectos técnicos por trás de seus modelos generativos de IA, com foco principal na otimização para baixa latência e desempenho no dispositivo.
A Apple ainda está atrás na corrida pela IA, mas está ganhando terreno significativo.
Mais notavelmente, no entanto, isto marca o nosso primeiro vislumbre do desempenho dos modelos de IA da Apple e como eles se comparam à concorrência.
Em um gráfico, por exemplo, podemos ver que os avaliadores humanos preferiram respostas do modelo de nuvem da Apple em cerca de 50% das vezes em comparação com o GPT-3.5, que é o modelo básico oferecido com a versão gratuita do ChatGPT. Os dois modelos ficaram empatados em 25,3% dos casos, indicando que o GPT-3.5 obteve uma vitória absoluta em apenas 24,7% dos casos de teste.
No entanto, a Apple viu sua liderança diminuir para apenas 28,5% quando o modelo de nuvem foi comparado com o GPT-4 Turbo. No entanto, empatou em mais 29,8% dos casos.
O modelo no dispositivo da Apple também tem um desempenho admirável, superando ou acompanhando modelos como Mistral-7B e Gemma-2B na maioria das respostas testadas.
O modelo no dispositivo da Apple tem aproximadamente três bilhões de parâmetros de tamanho. Usando técnicas típicas de otimização de modelo, como quantização, é compacto o suficiente para rodar em dispositivos como o iPhone 15 Pro e 15 Pro Max com apenas 8 GB de RAM.
O modelo baseado em nuvem, por outro lado, é maior e mais poderoso. Embora a Apple não tenha especificado explicitamente o tamanho do modelo de nuvem, ele foi projetado para funcionar inteiramente em data centers alimentados por Apple Silicon. Esta última é uma importante vitória de privacidade para os leais à Apple, pois a empresa pode garantir que seus dados confidenciais nunca serão entregues a uma empresa terceirizada como a OpenAI.
No que diz respeito à segurança, a Apple afirma que os seus modelos básicos também são muito mais seguros do que os da concorrência. O modelo baseado em nuvem da empresa retornou “respostas violadoras para conteúdo prejudicial, tópicos sensíveis e factualidade” em apenas 6,6% dos casos, muito abaixo dos 15,5% do GPT-3.5 Turbo e dos 20,1% do GPT-4 Turbo.
Este benchmark pode indicar por que a empresa adotou uma abordagem híbrida para Siri, que descarrega seletivamente certas consultas para ChatGPT. Em vez de responder a questões factuais ou potencialmente inflamatórias que podem manchar a marca da empresa, a Apple pode simplesmente oferecer resultados de fontes terceirizadas juntamente com um aviso de isenção de responsabilidade.
Em uma reviravolta interessante, a Apple afirma que ambos os seus modelos fundamentais superam os melhores modelos de IA disponíveis hoje em resumo. E na composição, o GPT-4 Turbo obtém apenas uma pequena vitória.
Embora esses resultados pareçam impressionantes, é importante notar que neste momento são apenas afirmações. Testes independentes podem chegar a uma conclusão diferente que não favorece a gigante de Cupertino. Também não ajuda o fato de a indústria de IA inovar rapidamente, e os recursos de IA da Apple só serão lançados por mais alguns meses. A OpenAI já mudou para o GPT-4o, por exemplo, e pode estar prestes a lançar o GPT-5 quando o iOS 18 chegar à maioria dos usuários do iPhone. Só o tempo dirá se a liderança da Apple se manterá até o final deste ano.