Como a startup chinesa DeepSeek está competindo com gigantes do Vale do Silício

No dia após o Natal, uma pequena startup chinesa chamada DeepSeek revelou um novo sistema de inteligência artificial que poderia igualar as capacidades de chatbots de ponta de empresas como OpenAI e Google.

Isso por si só já teria sido um marco. Mas a equipe por trás do sistema, chamado DeepSeek-V3, descreveu um passo ainda maior. Em um artigo de pesquisa explicando como construíram a tecnologia, os engenheiros da DeepSeek disseram que usaram apenas uma fração dos chips de computador altamente especializados que as principais empresas de IA dependem para treinar seus sistemas.

Esses chips estão no centro de uma tensa competição tecnológica entre os Estados Unidos e a China. À medida que o governo dos EUA trabalha para manter a liderança do país na corrida global de IA, está tentando limitar o número de chips poderosos, como os fabricados pela empresa do Vale do Silício Nvidia, que podem ser vendidos para a China e outros rivais.

Tudo o que você precisa saber para proteger sua carteira

BAIXE AGORA

Mas o desempenho do modelo DeepSeek levanta questões sobre as consequências não intencionais das restrições comerciais do governo dos EUA. Os controles forçaram os pesquisadores na China a serem criativos com uma ampla gama de ferramentas que estão livremente disponíveis na internet.

O chatbot DeepSeek respondeu a perguntas, resolveu problemas de lógica e escreveu seus próprios programas de computador tão habilidosamente quanto qualquer outro disponível no mercado, de acordo com os testes de referência que as empresas de IA dos EUA têm utilizado.

Continua depois da publicidade

E foi criado de forma econômica, desafiando a ideia predominante de que apenas as maiores empresas da indústria de tecnologia — todas baseadas nos Estados Unidos — poderiam se dar ao luxo de criar os sistemas de IA mais avançados. Os engenheiros chineses disseram que precisaram de apenas cerca de $6 milhões em poder computacional bruto para construir seu novo sistema. Isso é cerca de 10 vezes menos do que a gigante da tecnologia Meta gastou para desenvolver sua mais recente tecnologia de IA.

“O número de empresas que têm $6 milhões para gastar é muito maior do que o número de empresas que têm $100 milhões ou $1 bilhão para gastar”, disse Chris V. Nicholson, um investidor da empresa de capital de risco Page One Ventures, que se concentra em tecnologias de IA.

Desde que a OpenAI desencadeou o boom da IA em 2022 com o lançamento do ChatGPT, muitos especialistas e investidores concluíram que nenhuma empresa poderia competir com os líderes de mercado sem gastar centenas de milhões de dólares em chips especializados.

As principais empresas de IA do mundo treinam seus chatbots usando supercomputadores que utilizam até 16.000 chips, se não mais. Os engenheiros da DeepSeek, por outro lado, disseram que precisaram de apenas cerca de 2.000 chips de computador especializados da Nvidia.

As restrições aos chips na China forçaram os engenheiros da DeepSeek a “treiná-lo de forma mais eficiente para que ainda pudesse ser competitivo”, disse Jeffrey Ding, professor assistente da Universidade George Washington, que se especializa em tecnologia emergente e relações internacionais.

No início deste mês, a administração Biden emitiu novas regras que visam impedir que a China obtenha chips avançados de IA através de outros países. As regras se baseiam em várias rodadas de restrições anteriores que impedem as empresas chinesas de comprar ou fabricar chips de computador de ponta. O presidente Donald Trump ainda não indicou se manterá ou revogará as regras.

Continua depois da publicidade

O governo dos EUA tentou manter chips avançados fora das mãos das empresas chinesas devido a preocupações de que eles possam ser usados para fins militares. Em resposta, algumas empresas na China estocaram milhares de chips, enquanto outras os obtiveram de um próspero mercado underground de contrabandistas.

A DeepSeek é administrada por uma empresa de negociação de ações quantitativas chamada High Flyer. Até 2021, havia canalizado seus lucros para adquirir milhares de chips da Nvidia, que usou para treinar seus modelos anteriores. A empresa, que não respondeu a pedidos de comentário, se tornou conhecida na China por recrutar talentos recém-formados em universidades de topo, oferecendo salários altos e a capacidade de seguir as questões de pesquisa que mais despertam seu interesse.

Zihan Wang, um engenheiro de computação que trabalhou em um modelo anterior da DeepSeek, disse que a empresa também contrata pessoas sem formação em ciência da computação para ajudar a tecnologia a entender e ser capaz de gerar poesia e responder perguntas no notoriamente difícil exame de admissão universitária da China.

Continua depois da publicidade

A DeepSeek não fabrica produtos para consumidores, deixando seus engenheiros focados inteiramente em pesquisa. Isso significa que sua tecnologia não está limitada pelo aspecto mais rigoroso das regulamentações da China sobre IA, que exigem que a tecnologia voltada para o consumidor cumpra os controles do governo sobre informações.

As principais empresas dos EUA continuam a avançar o estado da arte em IA. Em dezembro, a OpenAI revelou um novo sistema de “raciocínio” chamado o3 que supera o desempenho das tecnologias existentes, embora ainda não esteja amplamente disponível fora da empresa. Mas a DeepSeek continua a mostrar que não está muito atrás. Este mês, lançou um impressionante modelo de raciocínio próprio.

(O New York Times processou a OpenAI e seu parceiro, Microsoft, acusando-os de violação de direitos autorais em relação a conteúdos de notícias relacionados a sistemas de IA. A OpenAI e a Microsoft negaram essas acusações.)

Continua depois da publicidade

Uma parte crucial deste mercado global em rápida mudança é uma ideia antiga: software de código aberto. Como muitas outras empresas, a DeepSeek tornou seu mais recente sistema de IA de código aberto, o que significa que compartilhou o código subjacente com outras empresas e pesquisadores. Isso permite que outros construam e distribuam seus próprios produtos usando as mesmas tecnologias.

Muitos executivos e comentaristas argumentaram que as grandes empresas dos EUA não deveriam abrir suas tecnologias, pois poderiam ser usadas para espalhar desinformação ou causar outros danos sérios. Alguns legisladores dos EUA exploraram a possibilidade de prevenir ou restringir essa prática.

Mas outros argumentam que, se os reguladores sufocarem o progresso da tecnologia de código aberto nos Estados Unidos, a China ganhará uma vantagem significativa. Se as melhores tecnologias de código aberto vierem da China, argumentam, os desenvolvedores dos EUA construirão seus sistemas sobre essas tecnologias. A longo prazo, isso poderia colocar a China no centro da pesquisa e desenvolvimento em IA.

Continua depois da publicidade

“O centro de gravidade da comunidade de código aberto tem se deslocado para a China”, disse Ion Stoica, professor de ciência da computação da Universidade da Califórnia, Berkeley. “Isso pode ser um grande perigo para os EUA”, porque permite que a China acelere o desenvolvimento de novas tecnologias.

c.2025 The New York Times Company

Como a startup chinesa DeepSeek está competindo com gigantes do Vale do Silício

Tópicos relacionados