Publicidade
O Google anunciou em coletiva para a imprensa na terça-feira (5) o seu novo modelo de linguagem para inteligência artificial generativa. Batizado Gemini, o LLM (sigla para modelo de linguagem em larga escala, em inglês) substituirá o atual motor da sua IA generativa Bard e será capaz de compreender imagens e vídeos — o uso por desenvolvedores e empresas, no entanto, só será disponibilizado na próxima semana, em versão com menor capacidade para tarefas complexas.
Já nesta quarta-feira (6) o Bard passará a utilizar a versão Pro do Gemini como motor para suas respostas em 170 países, na língua inglesa, substituindo o atual modelo, PalM 2. O Gemini terá ainda duas outras versões, o Nano, focado em dispositivos, e o Ultra, modelo mais amplo e adequado para tarefas mais complexas. Segundo a empresa, ainda no início de 2024 deve ser disponibilizado o Bard Advanced, versão do chat baseada no Gemini Ultra. O Google não confirmou, na apresentação, se a versão será paga ou gratuita. “Vamos explorar como a monetização pode funcionar, mas não temos nada específico para compartilhar agora”, disse Sissie Hsiao, vice-presidente de Assistant e Bard no Google.
No dia 13 de dezembro, a big tech liberará o Gemini Pro para desenvolvedores e empresas que desejem utilizar o modelo, mas a versão Ultra será restrita para parceiros e clientes selecionados apenas no começo do ano que vem.
Segundo a empresa, os testes do modelo na versão Pro superaram o GPT 3.5 em seis de oito benchmarks utilizados pela indústria e bons desempenhos nos testes MMLU, para avaliar o conhecimento adquirido por modelos de IA, e GSM 8K, baseado em problemas de matemática da grade escolar.
Os executivos do Google, no entanto, não demonstraram como a versão Pro se compara ao GPT 4, modelo mais avançado da OpenAI e um dos mais avançados do setor. O documento descritivo enviado à imprensa mostra apenas o desempenho da versão Ultra frente ao concorrente, com desempenho melhor nos benckmarks.
Algumas das exibições de funcionalidade apresentadas pela empresa mostram o Bard, já rodando o modelo Gemini, lendo exercícios de matemática, adivinhando truques de mágica em vídeos, descrevendo desenhos e objetos. Segundo Hsiao, o modelo deve integrar um assistente virtual do Bard com voz própria e novidades serão apresentadas em breve.