Edgar Cervantes / Autoridade Android
Ícone Siri
DR
- Um novo vazamento expõe a maioria (se não todos) dos novos recursos do Siri com tecnologia de IA que esperamos ver na WWDC 2024.
- A Siri está se tornando mais poderosa e melhor na execução de tarefas complexas por meio de linguagem natural.
- Não está claro se todos esses recursos serão lançados simultaneamente ou serão implementados escalonados.
Ouvimos muitos rumores sobre os supostos planos da Apple de superpoderizar seu assistente digital Siri na Worldwide Developers Conference (WWDC) de 2024. Hoje, através Apple Insider, temos o vazamento mais abrangente até agora. Proveniente de “pessoas familiarizadas com a iniciativa de IA da Apple”, o vazamento contém praticamente tudo o que o Siri será capaz de fazer em mais de uma dúzia de aplicativos originais para iPhone.
Vale a pena dar uma olhada no vazamento completo, especialmente se você for um usuário de iPhone. No entanto, daremos a você a essência geral dos objetivos da Apple com o “novo” Siri e compartilharemos alguns destaques que acreditamos que mais afetarão a vida cotidiana dos usuários do iPhone.
O que a Apple quer do ‘novo’ Siri
O objetivo geral do Siri parece ser torná-lo mais poderoso e melhor na compreensão de comandos de voz entregues em linguagem natural. De acordo com o vazamento, a Apple supostamente treinou a Siri para isso, fazendo com que os técnicos da Apple entregassem comandos propositalmente obtusos. Por exemplo, em vez de perguntar algo como “Ei, Siri, mostre-me fotos do meu gato”, ele está testando comandos mais vagos como “Quero fazer um blog” ou “Estou com saudades agora”. Estes não são comandos específicos que instruem o Siri a fazer uma coisa específica, mas sim comandos que o Siri precisará primeiro interpretar e depois decidir a melhor forma de entregar o que acha que o usuário pode querer/precisar.
A vantagem disso é óbvia: treinar o Siri para ser melhor para usuários que não conhecem (ou não querem usar) a sintaxe adequada necessária para executar um comando. Por exemplo, um usuário que diz: “Ei, Siri, quero um café”, pode ou não ligar a máquina de café inteligente, enquanto diz: “Ei, Siri, ligue a máquina de café”, provavelmente o faria. A primeira é uma afirmação natural, enquanto a última é uma ordem direta. A Apple quer que essa sintaxe bloqueada seja reduzida, tornando o Siri muito mais fácil de usar.
O Apple Insider o vazamento não menciona como isso funciona. Por exemplo, esses recursos do Siri são desenvolvidos com “Ajax”, que é o codinome do modelo interno de linguagem grande (LLM) da Apple? Ou são baseados no ChatGPT, já que a Apple supostamente fez parceria com a OpenAI para alguns de seus sistemas baseados em IA? Pode ser um pouco dos dois, mas ainda não temos certeza.
Novos recursos do Siri: uma lista de destaques
Conforme mencionado, o vazamento completo é exaustivo, abordando nada menos que 18 aplicativos originais para o iPhone e como o Siri poderá trabalhar com cada um deles. Aqui estão alguns que consideramos realmente interessantes:
- Câmera: A Siri poderá controlar a câmera por meio de comandos de voz. Você poderá ativar ou desativar a gravação de vídeo, abrir a câmera em um modo específico (foto, retrato, vídeo, etc.) e, em seguida, iniciar um temporizador de obturador e alternar para a câmera frontal ou traseira. Teoricamente, isso poderia permitir que você configure seu iPhone para uma foto de grupo, saia e use comandos de voz para capturar a foto remotamente.
- Correspondência: O aplicativo Mail está passando por uma reformulação completa. Aparentemente, ele será capaz de classificar e-mails automaticamente usando aprendizado de máquina, algo com o qual os usuários do Gmail provavelmente já estão familiarizados. Além disso, o Siri também poderá executar funções detalhadas apenas por meio de comandos de voz. Isso inclui coisas como redigir um e-mail, enviá-lo, agendá-lo, marcar um e-mail como lixo eletrônico e definir um lembrete para ler um e-mail posteriormente. Também será capaz de resumir e-mails e criar “respostas inteligentes”, um recurso sem dúvida semelhante ao Smart Reply no Android e Help Me Write no Gmail.
- Fotos: É provável que a Apple introduza muitos recursos de edição de fotos baseados em IA generativa. Os usuários do Pixel provavelmente reconhecerão muitos deles, já que até agora só ouvimos falar de recursos que você já pode usar no Pixels com Magic Editor e Google Fotos, como mover/remover um objeto da foto e preencher os espaços em branco com gerador. IA, encontre fotos específicas com pessoas/animais específicos e aplique filtros generativos de IA.
- Safári: O navegador da Apple usará o Siri para resumos de páginas da web, algo que o Google já trouxe para o Android por meio do Gemini. O Safari também poderá criar novos grupos de guias ou abrir uma nova guia Privada por meio de comandos de voz.
- Memorandos de voz: Você poderá usar o Siri com as mãos livres usando Memos de voz. Por exemplo, você pode pedir ao Siri para criar uma nova gravação de voz e começar a falar. Você poderia então interromper a gravação, salvá-la com um nome específico e até mesmo movê-la para uma pasta específica – tudo sem colocar um dedo no iPhone.
Quando serão lançados?
De acordo com o vazador em série da Apple, Mark Gurman, pelo menos alguns recursos do Siri não chegarão à WWDC. A Apple quase certamente anunciará alguns deles, mas nem todos estarão disponíveis em 2024. Gurman afirma que será em 2025 antes que a maioria desses recursos chegue por meio de uma atualização de software.
Claro, isso não significa que a Apple não lançará pelo menos alguns na WWDC ou próximo a ela. No entanto, é provavelmente melhor não esperar que o iOS 18 venha com todos os recursos deste vazamento da Siri, pois é muito mais provável que eles sejam eliminados nos próximos meses.