Publicidade
A DeepSeek, uma startup chinesa de inteligência artificial (IA), está no centro de um debate global sobre o futuro da tecnologia. Recentemente, seu assistente de IA ultrapassou o ChatGPT como o aplicativo mais bem avaliado na App Store dos Estados Unidos, enquanto seu modelo de IA, o DeepSeek-R1, desafia soluções líderes do mercado, como OpenAI e Meta, com custos muito mais baixos e eficiência que vem surpreendendo o mercado – e, consequentemente, afetando as ações de gigantes como Nvidia, Microsoft e Meta.
Veja, a seguir, tudo o que se sabe sobre a nova tecnologia.
O que é DeepSeek?
Fundada em 2023 na China, a DeepSeek começou como um braço de pesquisa da High-Flyer, um fundo quantitativo de US$ 8 bilhões. Desde então, tornou-se uma das startups de IA mais comentadas no mundo. Sua missão inicial era desenvolver modelos de IA eficientes com foco em pesquisa fundamental, em vez de buscar lucro imediato. Isso a diferencia de outras empresas que priorizam a comercialização rápida.
Os modelos de IA da DeepSeek, como o DeepSeek-R1, são projetados para lidar com tarefas complexas de raciocínio e já rivalizam com modelos como o OpenAI o1, segundo o Wall Street Journal. Apesar de usar chips de menor custo e enfrentar restrições de exportação dos EUA, a empresa conseguiu alcançar desempenho competitivo.
O que torna a DeepSeek única?
1. Custo e eficiência
A DeepSeek reduz drasticamente os custos de treinamento de seus modelos. Segundo a revista Nature, o DeepSeek-R1, por exemplo, foi treinado por aproximadamente US$ 6 milhões, enquanto modelos como o Llama 3.1 da Meta custaram mais de US$ 60 milhões para serem desenvolvidos.
2. Inovação tecnológica
Continua depois da publicidade
A empresa adota estratégias como:
- Reinforcement Learning (Aprendizado por Reforço): permite que os modelos aprendam por tentativa e erro.
- Mixture-of-Experts Architecture (MoE): ativa apenas uma fração dos parâmetros do modelo para tarefas específicas, economizando recursos computacionais.
- Multi-Head Latent Attention (MLA): melhora a capacidade dos modelos de processar dados e identificar padrões complexos.
3. Modelo open-weight
A startup adota um modelo parcialmente aberto, permitindo que pesquisadores acessem seus algoritmos. Isso democratiza o acesso à IA avançada e promove maior colaboração na comunidade global de pesquisa.
Quem está por trás da DeepSeek?
O fundador da DeepSeek é Liang Wenfeng, um gestor de hedge fund conhecido por sua atuação em tecnologia e finanças. Ao criar a startup, ele reuniu uma equipe jovem e talentosa, principalmente formada por recém-formados de universidades de elite chinesas, como Tsinghua e Peking. Essa abordagem permitiu à empresa cultivar uma cultura de inovação e explorar caminhos não convencionais no desenvolvimento de IA.
Continua depois da publicidade
Em entrevista à publicação chinesa 36Kr, Wenfeng revelou que sua motivação para criar a DeepSeek foi científica, e não comercial. “O retorno financeiro imediato não era o objetivo; queríamos resolver os problemas mais difíceis do mundo”, disse ele.
Por que a DeepSeek está impactando o mercado global?
O sucesso do modelo DeepSeek R1 e de seu aplicativo de IA colocou em xeque os grandes players de tecnologia nos EUA. O impacto foi tão significativo que, nesta segunda-feira (27), os futuros do Nasdaq caíram mais de 4%, com ações de empresas como Nvidia, Microsoft e Meta sendo diretamente afetadas.
Segundo a Forbes, o modelo do DeepSeek desafia a suposição de que são necessários chips avançados e caros para desenvolver IA de ponta. O uso de tecnologias mais acessíveis sugere que grandes empresas americanas podem precisar repensar suas estratégias, incluindo a redução de custos para se manterem competitivas.
Continua depois da publicidade
DeepSeek e a geopolítica tecnológica
As restrições de exportação dos EUA, que limitam o acesso de empresas chinesas a chips avançados como o Nvidia H100, foram o catalisador para que o DeepSeek desenvolvesse métodos inovadores e mais eficientes.
Essa abordagem agora ameaça o domínio dos EUA no setor, enquanto demonstra a capacidade da China de inovar mesmo sob sanções.
De acordo com Wendy Chang, analista de políticas do Mercator Institute, “o DeepSeek mostrou que não é preciso um orçamento gigantesco para criar modelos de ponta. Isso muda as regras do jogo para a IA global.”
Continua depois da publicidade
Os desafios da DeepSeek
Apesar de sua ascensão meteórica, a DeepSeek enfrenta desafios importantes:
- Percepção global: A empresa precisa construir uma reputação confiável fora da China para competir com gigantes como OpenAI e Google.
- Censura: Seus modelos estão sujeitos a restrições governamentais que podem limitar sua adoção em mercados internacionais.
- Limitações de hardware: Sem acesso irrestrito a chips avançados, a DeepSeek precisará continuar inovando para superar suas desvantagens computacionais.
O que esperar da DeepSeek no futuro?
Especialistas acreditam que a startup pode provocar uma revolução no mercado de IA, levando empresas estabelecidas a reduzir custos e buscar inovações mais sustentáveis. “O sucesso do DeepSeek mostra que eficiência e inovação podem ser tão importantes quanto poder bruto”, disse François Chollet, pesquisador em Seattle, à Nature, ressaltando o impacto geopolítico da DeepSeek no papel estratégico da IA na competição entre China e EUA.
(Com Wired, Wall Street Journal, Forbes e Nature)