OpenAI e Meta estão à beira de lançar novos modelos de inteligência artificial que, segundo eles, serão capazes de raciocinar e planejar. Essas duas atividades são essenciais para as máquinas superarem a capacidade humana.
Nesta semana, executivos da OpenAI e da Meta sinalizaram que se preparam para lançar as próximas versões de seus grandes modelos de linguagem, os sistemas que alimentam aplicações de IA generativa como o ChatGPT.
A Meta disse que começará a lançar o Llama 3 nas próximas semanas, enquanto a OpenAI —apoiada pela Microsoft— indicou que seu próximo modelo, que deve se chamar GPT-5, chega ao público “em breve”.
“Estamos trabalhando duro para descobrir como fazer com que esses modelos não apenas falem, mas realmente raciocinem, planejem, tenham memória”, disse Joelle Pineau, vice-presidente de pesquisa em IA da Meta.
O diretor de operações da OpenAI, Brad Lightcap, disse em entrevista ao Financial Times que a próxima geração do GPT mostrará progresso na resolução de “problemas difíceis” como o raciocínio.
“Vamos começar a ver IA que pode lidar com tarefas mais complexas de uma maneira mais sofisticada”, disse ele. “Acho que estamos apenas começando a arranhar a superfície da capacidade que esses modelos têm de raciocinar.”
Os sistemas de IA de hoje são “realmente bons em tarefas pequenas isoladas”, acrescentou Lightcap, mas ainda eram “bastante limitados” em suas capacidades.
Empresas como Google, Anthropic e Cohere também trabalham neste desafio, o que gera expectativa para uma onda de grandes modelos de linguagem inovadores.
À medida que as empresas de tecnologia correm para criar IA generativa cada vez mais sofisticada —software que pode criar palavras, imagens, código e vídeo humanos de qualidade indistinguível da produção humana—, o ritmo do progresso acelera.
Raciocínio e planejamento são passos-chave em direção ao que os pesquisadores de IA chamam de “inteligência artificial geral” —cognição em nível humano— porque permitem que chatbots e assistentes virtuais completem sequências de tarefas relacionadas e prevejam as consequências de suas ações.
Falando em um evento em Londres nesta terça-feira (9), o cientista-chefe de IA da Meta, Yann LeCun, disse que os sistemas de IA atuais “produzem uma palavra após a outra sem realmente pensar e planejar”.
Isso porque eles têm dificuldade em lidar com perguntas complexas ou reter informações por um longo período, eles ainda “cometem erros estúpidos”, disse ele.
Adicionar raciocínio significaria que um modelo de IA “busca possíveis respostas”, “planeja a sequência de ações” e constrói um “modelo mental do que será o efeito de suas ações”, disse ele.
Esta é uma “grande peça faltante na qual estamos trabalhando para fazer com que as máquinas alcancem o próximo nível de inteligência”, acrescentou.
LeCun disse que estava trabalhando em “agentes” de IA que poderiam, por exemplo, planejar e reservar cada etapa de uma viagem, do escritório de alguém em Paris para outro em Nova York, incluindo chegar ao aeroporto.
A Meta planeja incorporar seu novo modelo de IA no WhatsApp e nos óculos inteligentes Ray-Ban. Está se preparando para lançar o Llama 3 em uma variedade de tamanhos, para diferentes aplicativos e dispositivos, ao longo dos próximos meses.
Lightcap acrescentou que a OpenAI terá “mais a dizer em breve” sobre a próxima versão do GPT.
“Acho que com o tempo veremos os modelos avançarem para tarefas mais longas, mais complexas”, disse ele. “E isso implicitamente requer a melhoria de sua capacidade de raciocínio.”
Em evento em Londres, Chris Cox, diretor de produto da Meta, disse que as câmeras nos óculos Ray-Ban da Meta poderiam ser usadas para olhar, por exemplo, uma máquina de café quebrada, e um assistente de IA —alimentado pelo Llama 3— explicaria ao usuário como consertá-la.
“Estaremos conversando com esses assistentes de IA o tempo todo”, disse LeCun. “Nossa dieta digital inteira será mediada por sistemas de IA.”