DeepSeek: tudo sobre a bomba chinesa que está derrubando o ChatGPT, a NVIDIA e as grandes empresas de tecnologia dos EUA

Redacao
Por Redacao
7 Min Read

Eduardo César Garrido Merchán, Universidad Pontificia Comillas

Há dois anos, a OpenAI conseguiu o efeito Coca-Cola com seu principal produto, o ChatGPT. Mas a nova bomba, que nesse caso seria mais como o efeito Bruce Lee, é o DeepSeek-R1 e o Qwen 2.5, que são incrivelmente baratos para desenvolver e de código aberto. E ambos made in China.

As pessoas comuns, que não pertencem à comunidade de especialistas em IA, dificilmente sabem da existência de outras IAs, muito menos se são ou não gratuitas e de código aberto. Há muito tempo existem alternativas ao ChatGPT, como o Gemini da Alphabet, que também é uma empresa privada dos EUA. E entre as IAs de código aberto, a mais usada é a LLaMA (Large Language Model Meta AI), que serviu de base para o desenvolvimento da ALIA, a IA espanhola de código aberto que acaba de ser lançada.

Com tudo isso, a China é agora o líder tecnológico indiscutível do mundo. Pode-se dizer que ela colocou os pés na lua na corrida pela IA.

O DeepSeek agora pode ser usado

O DeepSeek-R1, com uma interface gráfica muito semelhante ao ChatGPT, já está disponível gratuitamente em seu site. Agora cabe aos usuários decidir se querem ficar ou não, mas seu apelo parece irresistível: ele é gratuito e continuará gratuito. O ChatGPT não é gratuito se for usado com todos os seus recursos, e o Gemini deixará de ser gratuito após o término do período de fidelidade.

Mas o aspecto mais impressionante da chegada do DeepSeek é que ele derrubou um gigante. O lançamento do modelo chinês fez com que o preço das ações da fabricante de chips NVIDIA despencassem mais de 16% no momento em que este artigo foi escrito (e despencando a cada minuto…). A NVIDIA perdeu 700 bilhões de dólares em menos de 24 horas. Essa é a maior perda de capitalização de mercado da história.

Por que os chineses tornaram o preço tão barato?

Por que o DeepSeek é tão barato? Em primeiro lugar, seus desenvolvedores reduziram muito o custo de treinamento do modelo em relação ao seu desempenho.

De acordo com o próprio DeepSeek, eles gastaram US$ 5,57 milhões. Para colocar esses números em perspectiva, isso é menos de um décimo do custo do modelo pago da empresa ironicamente chamada OpenAI.

O treinamento, de acordo com a DeepSeek, levou 55 dias, usando um conjunto de 2.048 unidades de processador gráfico H800 da fabricante de chips norte-americana NVIDIA, com 671 trilhões de parâmetros. Versões menores e destiladas também estão disponíveis. Na verdade, todo o treinamento do DeepSeek-R1 está sendo replicado no Github, uma plataforma de desenvolvimento colaborativo, confirmando que essa é uma IA aberta e gratuita.

Além disso, esse modelo também é dez vezes menor que o da OpenIA, o que o torna muito mais rápido na resposta aos prompts (as instruções que o usuário imputa para obter seus resultados). Mas isso não termina aí.

Em aberto

A empresa responsável pelo DeepSeek publicou seu modelo sob licença MIT, ou seja, em acesso aberto, e um artigo técnico detalhando o funcionamento completo do modelo para que ele possa ser replicado. Um verdadeiro presente para a comunidade científica e uma bomba na linha d’água das grandes corporações americanas ou Big Tech e dos fabricantes de chips, que, com exceção do modelo LLaMA da Meta, estão um passo atrás. Eles viram como uma startup chinesa é capaz de publicar um modelo gratuito cujo desempenho está no mesmo nível de seus modelos de licença proprietários mais sofisticados.

Nesta imagem, de um sistema de avaliação de modelo longo de idioma público da HuggingFace, com uma boa reputação na comunidade, você pode ver o desempenho fantástico do DeepSeek.

DeepSeek: tudo sobre a bomba chinesa que está derrubando o ChatGPT, a NVIDIA e as grandes empresas de tecnologia dos EUA | Diário Carioca
DeepSeek performance example.

Resposta do público

A reação do público ao novo modelo de linguagem longa do DeepSeek foi rápida.

Na primeira semana de mandato de Donald Trump, assim que Sam Altman, CEO da OpenAI, publicou um vídeo na rede social X dizendo que a sociedade deveria repensar o contrato social atual para o desenvolvimento futuro de inteligências artificiais, a China apareceu e derrubou o mercado com um único sinal do grande desenvolvimento tecnológico que o Ocidente muitas vezes teima em ignorar.

Trump também havia anunciado o projeto Stargate AI, incorporando a Big Tech em uma aliança sem precedentes, com um investimento de capital estatal de 500 bilhões de dólares. E então, uma startup chinesa consegue elaborar e lançar um modelo com uma implementação fabulosa e uma ideia técnica feliz, extremamente eficiente.

Até mesmo Yann LeCun, diretor de IA da Meta, parabenizou a equipe chinesa por uma conquista que causou um choque na comunidade global de inteligência artificial.

Esse é um sinal de que a Big Tech e o setor de tecnologia dos EUA em geral podem ter subestimado o gigante asiático.

As quedas no mercado de ações podem ser parcialmente explicadas pela fabulosa recepção do povo americano ao novo modelo de linguagem longa. O DeepSeek tornou-se o aplicativo mais baixado na App Store da Apple neste fim de semana nos EUA, à frente do ChatGPT!

A inovação tecnológica implementada pelo gigante asiático em uma infinidade de campos está realmente no mesmo nível dos Estados Unidos. Um exemplo é o protótipo EAST, que conseguiu manter um sol artificial de plasma de alto confinamento em um estado estável por 1,066 segundos, um marco fundamental para a energia de fusão limpa e inesgotável.

Quanto a mim, como pesquisador, posso garantir que já acompanho de perto as empresas chinesas, pois seu potencial inovador é indiscutível.

Eduardo César Garrido Merchán, Profesor Colaborador Asistente, Departamento de Métodos Cuantitativos, Universidad Pontificia Comillas

This article is republished from The Conversation under a Creative Commons license. Read the original article.

Compartilhe esta notícia