DeepSeek é uma startup chinesa que desenvolveu um modelo de inteligência artificial (IA) que compete com gigantes do mercado, como OpenAI e Google. Lançada este mês, a tecnologia é eficiente e econômica e emprega menos chips e dados em comparação com as grandes empresas ocidentais.
A startup conseguiu criar uma IA capaz de realizar tarefas complexas de forma mais barata e com um custo de treinamento significativamente menor, o que fez seu modelo se destacar no mercado. A DeepSeek superou até mesmo o ChatGPT na Apple Store dos EUA, gerando um impacto significativo nas ações de empresas de chips, como a Nvidia.
A empresa chinesa adota uma técnica chamada “mixture of experts” (mistura de especialistas), que consiste em ativar componentes específicos em diferentes tarefas enquanto mantém outros desativados. Isso permite uma utilização mais eficiente dos recursos computacionais, o que reduz os custos de treinamento. Entenda mais nesta reportagem do Estadão.
- Entenda o “efeito DeepSeek” no Brasil: Nvidia afunda quase 17% com nova IA chinesa; só três entre as big techs fecharam no positivo
Outro ponto relevante é que a DeepSeek desenvolveu um modelo que pode ser executado localmente, ou seja, ele não depende de servidores externos ou da internet para funcionar. Isso permite que dispositivos menores, como smartphones, possam rodar IA sem a necessidade de grandes centros de dados, como detalhou esta matéria do Estadão.
Além disso, a DeepSeek utiliza dados filtrados e sintéticos, gerados pelo próprio modelo, para melhorar seu desempenho. Com isso,consegue criar um modelo similar a outras linguagens ocidentais por um custo muito menor.
O que são chips e qual sua importância?
Os chips são componentes de hardware essenciais para o treinamento e execução de modelos de inteligência artificial. Segundo a DeepSeek, a empresa utiliza cerca de 2 mil chips especializados da Nvidia para desenvolver o chatbot, comparado com os 16 mil necessários para a criação dos rivais, afirmou o The New York Times.
Essa tecnologia permite processar grandes quantidades de dados, algo fundamental para o funcionamento de sistemas de IA. Esses chips, em sua maioria, são unidades de processamento gráfico (GPUs) ou chips especializados, como os da Nvidia, que são projetados para lidar com as operações matemáticas envolvidas no treinamento de modelos de aprendizado de máquina.
Publicidade
Invista em oportunidades que combinam com seus objetivos. Faça seu cadastro na Ágora Investimentos
Basicamente, quanto mais poderosos são os chips, mais rápido e eficiente é o treinamento dos modelos de IA, barateando a empresa e tornando-a mais atrativa no mercado.
Entenda o conflito entre China e EUA depois da DeepSeek
Os conflitos entre a DeepSeek e os Estados Unidos estão relacionados à competição tecnológica e ao impacto que a startup tem no mercado global de IA. Com custos significativamente mais baixos do que os modelos tradicionais, como os do ChatGPT, da OpenAI, ou do Gemini, do Google, que dependem de grandes quantidades de chips potentes, como os da Nvidia, a DeepSeek tornou-se uma surpresa no mercado. Entenda mais lendo esta notícia.
Essa abordagem mais econômica, baseada em chips menos avançados, desafia o domínio das grandes empresas de tecnologia dos EUA.
Outro ponto nebuloso entre DeepSeek e EUA envolve as restrições impostas pelos americanos à exportação de chips poderosos, como os da Nvidia, para a China. Essas restrições foram criadas para limitar o avanço da China na tecnologia de IA, já que os chips mais avançados são essenciais para o treinamento de modelos de IA em larga escala, como afirmou Pedro Burgos, consultor em inteligência artificial, ao Estadão.
Publicidade