Alibaba lança modelo de IA que afirma superar DeepSeek-V3

SEC processa Elon Musk por divulgação tardia de participação no Twitter

Table of Contents

“O Qwen 2.5-Max supera (…) quase todos os GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, disse a unidade de computação em nuvem da Alibaba em anúncio publicado em sua conta oficial na rede social WeChat, referindo-se aos modelos de IA de código aberto mais avançados das norte-americanas OpenAI e Meta.

O lançamento, em 10 de janeiro, do assistente de IA da DeepSeek, equipado com o modelo DeepSeek-V3, bem como o lançamento, em 20 de janeiro, de seu modelo R1, chocou o Vale do Silício e fez com que ações de empresas de tecnologia ao redor do mundo despencassem.

Mas o sucesso do DeepSeek também levou a uma corrida entre seus concorrentes nacionais para atualizar seus próprios modelos de IA.

Dois dias após o lançamento do DeepSeek-R1, a ByteDance, proprietária do TikTok, lançou uma atualização de seu principal modelo de IA, que, segundo ela, superou o o1, da OpenAI, no teste AIME, um exame que mede a capacidade dos modelos de IA de entender e responder a instruções complexas.

Isso ecoou a afirmação da DeepSeek de que seu modelo R1 rivalizava com o o1 em vários benchmarks de desempenho.

DEEPSEEK VERSUS CONCORRENTES CHINESES

Visto Primeiro Em