fbpx

Chinesa DeepSeek compartilhará código de modelo de IA – 21/02/2025 – Tec

A startup chinesa DeepSeek disponibilizará publicamente o código de seus modelos, anunciou nesta sexta-feira (21), reforçando seu compromisso com a IA (inteligência artificial) de código aberto.

A empresa disse em uma publicação na plataforma de mídia social X que abrirá cinco repositórios de código-fonte na próxima semana, descrevendo a medida como “um progresso pequeno, mas sincero”, que será compartilhado “com total transparência”.

“Esses humildes blocos de construção em nosso serviço online foram documentados, implantados e testados em campo na produção”, afirmou a publicação.

O post encerra dizendo que, “como parte da comunidade de código aberto, acreditamos que cada linha compartilhada se torna um impulso coletivo que acelera a jornada”.

A DeepSeek abalou a indústria global de IA no mês passado quando lançou seu modelo de raciocínio R1 de código aberto, que rivaliza com os sistemas ocidentais em desempenho e desenvolvido a um custo menor.

O comprometimento da empresa com o código aberto distingue a Deepseek da maioria das empresas de IA na China, que, assim como suas rivais nos EUA, se inclinam para modelos de código fechado. O discreto fundador da DeepSeek, Liang Wenfeng, disse em uma rara entrevista a um meio de comunicação chinês em julho passado que a empresa não priorizou a comercialização de seus modelos de IA e que havia soft power a ser obtido com o código aberto.

“Ter outros seguindo sua inovação dá uma grande sensação de realização”, disse Liang em julho. “Na verdade, o código aberto é mais um comportamento cultural do que comercial, e contribuir para isso nos traz respeito”, acrescentou.

O código-fonte aberto recém-lançado fornecerá infraestrutura para dar suporte aos modelos de IA que a DeepSeek já compartilhou publicamente, com base nas estruturas de modelos de código-fonte aberto existentes.

O anúncio foi feito depois que a DeepSeek lançou, na terça, um novo algoritmo chamado Native Sparse Attention (NSA), projetado para tornar o treinamento e a inferência de longo contexto mais eficientes.

A base de usuários do DeepSeek explodiu desde o mês passado. Na China, é o serviço de chatbot mais popular, com 22,2 milhões de usuários ativos diários em 11 de janeiro, superando os 16,95 milhões de usuários do Douban, de acordo com o Aicpb.com, site chinês que rastreia produtos de IA.

Visto primeiro na Folha de São Paulo

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

This site uses Akismet to reduce spam. Learn how your comment data is processed.