DR
- O Google lançou oficialmente Gemini, sua arquitetura multimodal de IA.
- O Gemini 1.0 virá em três tamanhos diferentes: Gemini Ultra, Gemini Pro e Gemini Nano.
- Gemini Pro e Nano estão sendo lançados hoje em uma variedade de produtos do Google.
Em maio de 2023, o Google revelou que estava reunindo duas de suas equipes de pesquisa – Brain Team e DeepMind – para criar uma única unidade chamada Google DeepMind. Essa nova equipe seria responsável por trabalhar no modelo de IA de próxima geração do Google, o Gemini. A empresa está lançando agora três versões do Gemini, sendo duas disponibilizadas a partir de hoje.
Em uma postagem no blog, o Google apresentou oficialmente sua nova arquitetura de IA, Gemini. Descrito como tendo desempenho de última geração, o Google afirma que o Gemini foi construído desde o início para ser multimodal. Como a empresa explica:
Até agora, a abordagem padrão para a criação de modelos multimodais envolvia treinar componentes separados para diferentes modalidades e depois juntá-los para imitar aproximadamente algumas dessas funcionalidades. Às vezes, esses modelos podem ser bons na execução de determinadas tarefas, como descrever imagens, mas enfrentam dificuldades com raciocínios mais conceituais e complexos.
Projetamos o Gemini para ser nativamente multimodal, pré-treinado desde o início em diferentes modalidades. Em seguida, aperfeiçoámo-lo com dados multimodais adicionais para refinar ainda mais a sua eficácia. Isso ajuda a Gemini a compreender e raciocinar perfeitamente sobre todos os tipos de informações desde o início, muito melhor do que os modelos multimodais existentes – e suas capacidades são de última geração em quase todos os domínios.
O Gemini virá em três tamanhos diferentes para funcionar com eficiência para diversas necessidades. A versão maior e mais capaz é chamada Gemini Ultra e foi projetada para tarefas altamente complexas. Abaixo está o Gemini Pro, que foi projetado para ser usado em uma variedade de dispositivos. A terceira versão da IA – Gemini Nano – pretende ser o modelo mais eficiente para tarefas no dispositivo. O Google afirma que otimizou três tamanhos diferentes para a primeira versão do Gemini, o que pode significar que outros tamanhos poderão surgir no futuro.
Em termos de desempenho, a organização sediada em Mountain View afirma que o Gemini Ultra excede 30 dos 32 benchmarks acadêmicos para resultados atuais de última geração usados para LLMs. Ele supostamente supera o GPT-4 da OpenAI em todas as categorias fora do raciocínio de bom senso para tarefas diárias em relação ao texto.
Com estas capacidades melhoradas, o Google reconhece a necessidade de mais medidas de segurança. A empresa afirma que está adicionando novas proteções à sua política atual de Princípios de IA. Afirma também que “conduziu novas pesquisas sobre áreas de risco potencial”, aplicou técnicas de testes adversários, trabalhou com “um grupo diversificado de especialistas e parceiros externos” para identificar pontos cegos e “construiu classificadores de segurança dedicados” para filtrar violência e estereótipos negativos. .
Quanto a quando o Gemini 1.0 estará disponível, o Google diz que está lançando a IA agora para vários produtos a partir de hoje. Um dos produtos que está recebendo o LLM hoje é o Bard, que supostamente usará uma versão aprimorada do Gemini Pro. O Pixel 8 Pro também está recebendo IA hoje – Gemini Nano – e irá potencializar o Resumir no aplicativo Gravador e a Resposta Inteligente no Gboard para WhatsApp. E a Experiência Gerativa de Pesquisa do Google também está sendo aprimorada com o Gemini, supostamente reduzindo a latência em 40% em inglês nos EUA.
O Gemini Ultra, por outro lado, não será lançado hoje, pois está passando por “extensas verificações de confiança e segurança”. No entanto, o Google afirma que disponibilizará o Ultra para experimentação inicial para clientes, desenvolvedores e parceiros selecionados no início do próximo ano.