DeepSeek, até recentemente uma startup chinesa de IA pouco conhecida, abalou a indústria de tecnologia dos EUA ao revelar um modelo de IA de linguagem de ponta que poderia competir com os grandes nomes como OpenAI, por uma fração do orçamento da OpenAI.
O pesado índice tecnológico Nasdaq caiu 3% na segunda-feira (27) e a fabricante de chips de IA Nvidia sozinha perdeu quase US$ 600 bilhões enquanto o modelo mais barato e igualmente capaz da DeepSeek levava os investidores a questionar a quantidade de capital que foi investida no desenvolvimento de IA.
- Efeito DeepSeek: mercado trilionário de IA dos EUA era apenas uma bolha?
Mas a DeepSeek não é a única empresa de tecnologia chinesa a lançar um modelo de IA nas últimas semanas, já que uma série de players chineses de IA têm lançado atualizações antes do Ano Novo Lunar na quarta-feira, quando o país tradicionalmente faz uma pausa de pelo menos uma semana. Embora possa ser um caso de empresas lançando seu melhor trabalho antes de um feriado, os analistas pensam que a enxurrada de atividades é algo bem diferente — isto é, uma “psyops coordenada para contrapor os anúncios dos EUA da semana passada”.
- Você sabe o que é PsyOps? Entenda sobre esta ameaça ao mercado financeiro
Esse anúncio dos EUA foi a apresentação de Trump de um projeto de US$ 500 bilhões chamado Stargate que visa construir infraestrutura de IA nos EUA — um anúncio que vem na esteira de meses de proibições de exportação de chips de IA anunciadas sob o ex-presidente Joe Biden.
“A necessidade é a mãe da invenção, então as proibições de controle de exportação de chips podem ter causado esse desafio”, disse Ray Wang, analista principal e CEO da firma de pesquisa e consultoria tecnológica baseada no Vale do Silício, Constellation Research.
Publicidade
Invista em oportunidades que combinam com seus objetivos. Faça seu cadastro na Ágora Investimentos
“Isso é obviamente uma psyops. Você não pode chegar à AGI (sigla em inglês para “inteligência artificial geral”, pesquisas que pretendem aumentar a capacidade cognitiva das AIs) dessa maneira. É engenharia reversa para eficiência”, Wang acrescentou, referindo-se ao papel da DeepSeek como um concorrente de baixo orçamento para nomes como OpenAI. De acordo com Wang, apesar de todo o burburinho em torno da DeepSeek, os modelos de IA continuarão se tornando mais exigentes e complexos ao longo do tempo, o que exigirá grandes quantidades de poder de computação caro.
Outro analista da IDC, uma firma de inteligência de mercado, tem uma visão semelhante e acha que a China quer mostrar que ainda é uma força a ser reconhecida quando se trata de tecnologia.
“É difícil dizer se eles cronometraram isso para o Ano Novo Chinês, no entanto, com a nova presidência nos EUA e o anúncio de enormes investimentos em IA desenvolvendo infraestrutura de IA através do Stargate, há uma necessidade da China reforçar sua posição na indústria tecnológica global”, disse Deepika Giri, chefe de pesquisa de IA na IDC APAC.
Modelos de IA chineses lançados recentemente
MiniMax
Esta startup chinesa lançou uma nova série de modelos de código aberto há duas semanas sob o nome MiniMax-01. Essa família inclui um modelo fundamental de propósito geral, o MiniMax-Text-01, e o modelo visual multimodal Minimax-VL-01.
Os desenvolvedores afirmam que o MiniMax-01, que tem 456 bilhões de parâmetros, supera o recém-lançado Gemini 2.0 Flash da Google em alguns benchmarks como MMLU e SimpleQA. MMLU significa entendimento de linguagem multitarefa massiva e é um benchmark usado para avaliar modelos de linguagem grandes em uma ampla gama de tarefas. SimpleQA mede a capacidade de um modelo de linguagem grande de responder a perguntas curtas de busca de fatos.
Publicidade
Além do MiniMax-01, a startup, apoiada pela Tencent e Alibaba, também lançou um gerador de áudio rotulado T2A-01-HD. A empresa afirma que o aplicativo pode gerar “saída de qualidade premium” a partir de apenas 10 segundos de entrada de áudio, e pode capturar características de voz, padrões de fala e nuances emocionais.
Qwen
Qwen, também conhecido como Tongyi Qianwen, é um modelo de linguagem grande apoiado pela Alibaba. A empresa afirmou em maio do ano passado que o Qwen foi adotado por mais de 90.000 clientes corporativos, variando de eletrônicos de consumo a automotivos e jogos online.
Na segunda-feira, a equipe do Qwen lançou o Qwen2.5-VL, que pode realizar vários tipos de tarefas de análise de imagem e texto, bem como interagir com softwares em um PC ou smartphone.
Um vídeo circulando no X postado por Philipp Schmid, líder técnico na Hugging Face, mostra o Qwen2.5-VL lançando o aplicativo Booking.com no Android e depois reservando um voo de Chongqing para Pequim.
A equipe do Qwen afirma que o Qwen2.5-VL supera o GPT4o quando comparado em benchmarks de vídeo.
Tencent
A Tencent é uma das maiores empresas de tecnologia da China e proprietária do WeChat, o super aplicativo que tem 1,3 bilhão de usuários mensais. Mas, além do aplicativo, a Tencent é um grande player na indústria de videogames, com participações em empresas como Supercell, Riot e Epic Games.
Publicidade
A Tencent lançou o Hunyuan3D 2.0 na semana passada, uma atualização de seu modelo de IA Hunyuan de código aberto que poderia revolucionar a indústria de videogames. Artistas altamente qualificados podem muitas vezes levar dias ou até semanas para criar modelos e personagens 3D em videogames, e espera-se que a versão mais nova da Tencent torne mais fácil e rápido para esses desenvolvedores produzi-los.
“Criar ativos 3D de alta qualidade é um processo demorado para os artistas, tornando a geração automática um objetivo de longo prazo para os pesquisadores”, escreveu a empresa em um relatório técnico.
O Hunyuan 3D 2.0 inclui dois componentes fundamentais: um modelo de geração de forma em grande escala, o Hunyuan3D-DiT, e um modelo de síntese de textura em grande escala chamado Hunyuan 3D-paint.
A equipe afirma que o aplicativo Hunyuan 3D supera os modelos de última geração anteriores, incluindo modelos de código aberto e fechado, quando se trata de parâmetros como detalhes de geometria e qualidade de textura.
Publicidade
Outras DeepSeeks vão causar caos no mercado?
*Esta história foi originalmente publicada na Fortune.com (c.2024 Fortune Media IP Limited) e distribuída por The New York Times Licensing Group. O conteúdo foi traduzido com o auxílio de ferramentas de inteligência artificial e revisado por nossa equipe editorial. Saiba mais em nossa Política de IA.