DeepSeek compartilhará código de modelo de IA, dobrando a aposta no código aberto

SEC processa Elon Musk por divulgação tardia de participação no Twitter

A DeepSeek abalou a indústria global de IA no mês passado quando lançou seu modelo de raciocínio R1 de código aberto, que rivalizava com os sistemas ocidentais em desempenho e era desenvolvido a um custo menor.

O comprometimento da empresa com o código aberto a distinguiu da maioria das empresas de IA na China, que, assim como suas rivais nos EUA, se inclinam para modelos de código fechado. O discreto fundador da DeepSeek, Liang Wenfeng, disse em uma rara entrevista a um meio de comunicação chinês em julho passado que a empresa não priorizou a comercialização de seus modelos de IA e que havia soft power a ser obtido com o código aberto.

“Ter outros seguindo sua inovação dá uma grande sensação de realização”, disse Liang em julho.

“Na verdade, o código aberto é mais um comportamento cultural do que comercial, e contribuir para isso nos traz respeito”, acrescentou.

O código-fonte aberto recém-lançado fornecerá infraestrutura para dar suporte aos modelos de IA que a DeepSeek já compartilhou publicamente, com base nas estruturas de modelos de código-fonte aberto existentes.

O anúncio foi feito depois que a DeepSeek lançou na terça-feira um novo algoritmo chamado Native Sparse Attention (NSA), projetado para tornar o treinamento e a inferência de longo contexto mais eficientes.



Visto Primeiro Em

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

This site uses Akismet to reduce spam. Learn how your comment data is processed.