Você está em | Home | Inteligência Artificial e chatbots | Por que a NVIDIA foi a que mais sofreu com o lançamento do DeepSeek

Por que a NVIDIA foi a que mais sofreu com o lançamento do DeepSeek

Compartilhe

O DeepSeek abalou os pilares da indústria de tecnologia, gerando pânico entre as gigantes do Vale do Silício. Seu desenvolvimento eficiente e de baixo custo provou ser uma ameaça real ao domínio das empresas ocidentais, forçando uma reavaliação dos investimentos no setor.

A chegada dessa IA não apenas desafia o modelo tradicional de desenvolvimento, mas também abre um precedente sobre como inovações podem surgir fora do eixo predominante dos Estados Unidos.

E a Big Tech que mais sofreu com a chegada do DeepSeek foi a NVIDIA de Jensen Huang que, até o momento, era uma das protagonistas do cenário atual de Inteligência Artificial, com uma recuperação impressionante em rentabilidade.

O que aconteceu aqui?

 

A queda histórica da NVIDIA e suas implicações

A NVIDIA sofreu um colapso sem precedentes na bolsa de valores após o anúncio do DeepSeek, perdendo 17% de seu valor em poucas horas, o equivalente a uma redução de US$ 600 bilhões em capitalização de mercado.

O que foi chamado lá fora de “segunda-feira negra” foi um reflexo direto da ameaça representada pelo DeepSeek, que demonstrou ser possível desenvolver IA sem depender dos chips da empresa americana.

Ou seja, temos aqui uma nova fase para a indústria, onde a busca por eficiência supera a dependência de hardware de alto custo.

A NVIDIA era a principal fornecedora de chips para grandes empresas de tecnologia no setor de inteligência artificial, mas as restrições dos EUA impediram que a China acessasse livremente esses processadores.

Pois bem, o DeepSeek conseguiu treinar sua IA com apenas 2.048 chips NVIDIA H800, provando que é possível alcançar desempenho de ponta sem os componentes mais avançados da empresa.

Foi um golpe direto no modelo de negócios da NVIDIA, que agora vê seu domínio e todos os investimentos feitos em seus processadores para o desenvolvimento de IA serem questionados.

 

O impacto da publicação do DeepSeek V3 como código aberto

A decisão de disponibilizar o modelo de inteligência artificial DeepSeek V3 como código aberto representa um marco para o setor de Inteligência Artificial, e foi um dos principais motivos para promover a queda da NVIDIA no valor de mercado.

A comunidade de IA agora tem acesso ao que pode ser considerado um dos modelos mais eficientes já desenvolvidos na China, permitindo uma análise aprofundada da estratégia utilizada pelos engenheiros da empresa.

O número de processadores da NVIDIA utilizados para o treinamento do DeepSeek chama sim a atenção de todos, levantando questionamentos sobre a real infraestrutura do modelo. Há especulações de que a empresa pode ter acesso a um número muito maior de GPUs H100, adquiridas por meio de intermediários.

O que é fato aqui é que, devido às sanções impostas pelos Estados Unidos, a NVIDIA foi proibida de fornecer diretamente esses chips para empresas chinesas desde novembro de 2023, tornando o H800 a única opção disponível para o treinamento da plataforma.

O sucesso de qualquer modelo de IA não depende apenas da potência das GPUs utilizadas, mas também da eficiência do software que as opera.

No caso da DeepSeek, o grande trunfo veio da decisão de evitar o uso do CUDA, a plataforma de computação paralela da NVIDIA, que domina o mercado global de inteligência artificial.

Em vez disso, os engenheiros optaram pelo PTX (Parallel Thread Execution), uma linguagem de programação de mais baixo nível, similar ao assembler, que permite um controle mais refinado sobre o hardware.

É uma tarefa muito mais complexa, e exige um nível avançado de otimização manual por parte dos programadores. Em compensação, garante um uso mais eficiente dos recursos das GPUs H800.

De qualquer forma, o mérito da DeepSeek é enorme. Ela teve que extrair o máximo desempenho possível do hardware ao qual ainda tinha acesso.

E entregou resultados espetaculares.

 

Estratégias para maximizar a capacidade das GPUs

A escolha pelo PTX não foi apenas uma alternativa ao CUDA, mas uma estratégia cuidadosamente planejada para superar as limitações impostas pelas sanções.

A DeepSeek inovou ao distribuir o poder de processamento dentro de cada GPU H800. Normalmente, grande parte dos núcleos das GPUs é utilizada para comunicação entre servidores, mas os engenheiros da empresa chinesa otimizaram esse uso, alocando apenas 20 dos Streaming Multiprocessors (SM) de cada chip para essa função, enquanto os 112 SM restantes foram totalmente dedicados aos cálculos necessários para treinar o modelo de IA.

A reconfiguração garantiu um aumento no aproveitamento da capacidade computacional disponível, o que explica a eficiência do DeepSeek V3, mesmo com uma quantidade relativamente menor de hardware em comparação com concorrentes ocidentais.

O desenvolvimento do DeepSeek V3 é a maior prova que a China está conseguindo superar as barreiras impostas por restrições comerciais e tecnológicas.

A estratégia chinesa de fortalecer sua autonomia em tecnologia avançada vem sendo desenhada há anos, especialmente sob a diretriz do plano “Feito na China 2025”, que busca tornar o país um líder global em setores estratégicos, como semicondutores, inteligência artificial e redes 5G.

A criação de alternativas ao ecossistema da NVIDIA, como a Compute Architecture for Neural Networks (CANN) da Huawei, reflete esse esforço contínuo para reduzir a dependência de tecnologias ocidentais.

O sucesso da DeepSeek V3 reforça essa tendência, e sugere que as empresas chinesas estão encontrando soluções inovadoras para contornar as limitações externas, fortalecendo sua posição no mercado global de IA.

Além de seu significado geopolítico e tecnológico, a publicação do DeepSeek V3 como código aberto tem o potencial de influenciar significativamente o futuro do desenvolvimento de IA.

O sucesso da abordagem baseada em PTX pode inspirar outras empresas e instituições a explorar alternativas ao CUDA, diversificando o ecossistema de desenvolvimento de modelos de inteligência artificial.

Se essa tendência se consolidar, a NVIDIA pode perder parte do seu domínio sobre a infraestrutura de software de IA, abrindo espaço para novas soluções que tornem a tecnologia mais acessível e flexível.

Por outro lado, a divulgação do código da DeepSeek V3 também permite que pesquisadores ao redor do mundo estudem e aprimorem suas técnicas, o que pode levar a avanços ainda maiores no setor.

E Jensen Huang, testemunhando tudo isso, chora em posição fetal.

 

O efeito dominó no setor de tecnologia

A queda da NVIDIA arrastou outras gigantes da tecnologia para um cenário de instabilidade que, para muitos, era totalmente inesperado.

Empresas como Alphabet (Google), Microsoft e Amazon também sofreram perdas nos seus respectivos valores de mercado, uma vez que seus modelos de investimento em IA dependem de infraestrutura de alto custo, capitaneado pelo hardware da NVIDIA.

Enquanto isso, a Apple seguiu um caminho diferente, registrando um crescimento de 3,7%, possivelmente devido a uma estratégia menos exposta à guerra da inteligência artificial.

Até porque a Apple está desenvolvendo o seu próprio hardware há muito tempo, e qualquer coisa que vai contar com IA em seus produtos passa, de forma obrigatória, pelos seus processadores.

O modelo de investimento em IA, até então baseado na ideia de que mais dinheiro resultava em melhores resultados, foi oficialmente colocado em xeque.

Durante anos, as empresas gastaram bilhões para desenvolver modelos cada vez mais poderosos. Mas o DeepSeek mostrou que eficiência e custo-benefício podem ser mais determinantes do que simplesmente investir mais.

Essa mudança pode forçar um realinhamento de estratégias no setor, onde a otimização de recursos se torna o novo diferencial competitivo.

O impacto do DeepSeek chegou até o presidente Donald Trump, que reconheceu a necessidade de os Estados Unidos reverem sua abordagem em inteligência artificial.

Durante o seu primeiro mandato, ele aprovou um plano de US$ 500 bilhões para fortalecer a IA americana, mas agora vê o surgimento de um competidor chinês capaz de fazer mais com muito menos.

Ao que tudo indica, Trump deve reforçar ainda mais os investimentos nas gigantes de tecnologia que trabalham em IA, ao mesmo tempo em que trabalha em políticas protecionistas, aplicando táticas regulatórias para tentar conter o avanço da China nesse campo estratégico.

 

Barato demais para ser tão eficiente

Enquanto grandes empresas de tecnologia desembolsam centenas de milhões para treinar suas inteligências artificiais, o DeepSeek foi treinado com um orçamento de apenas US$ 5,6 milhões.

São valores que levantam dúvidas sobre a veracidade dos números. A OpenAI acusa neste momento a startup DeepSeek em utilizar suas APIs para o treinamento de um modelo menor de chatbot, o que seria uma violação de direitos de uso do ChatGPT e, ao mesmo tempo, uma forma de explicar os baixos custos de treinamento da plataforma.

Tudo bem, existe uma certa dose de hipocrisia de Sam Altman e sua turma, já que o ChatGPT foi treinado com os dados dos vídeos do YouTube sem o devido consentimento dos envolvidos. Mas isso é assunto para outro momento.

De qualquer forma, a discrepância de valores deixa mais do que evidente a capacidade da China de criar soluções inovadoras sem os custos exorbitantes que dominam o setor no Ocidente.

O modelo de treinamento proposto pela DeepSeek não apenas torna a IA mais acessível, mas também estabelece um novo padrão para o futuro da tecnologia.

Não estamos diante de uma simples inovação tecnológica. Esse é um divisor de águas na forma como a Inteligência Artificial é desenvolvida e financiada.

Antes, a corrida por IA era baseada no poder computacional e na capacidade de gastar mais dinheiro.

Agora a prioridade passa a ser a eficiência e o retorno sobre investimento.

Um novo paradigma que pode reformular a indústria como um todo, reduzindo a dependência de grandes estruturas e tornando a IA mais acessível globalmente.

As grandes empresas de tecnologia agora enfrentam um dilema: continuar investindo bilhões em IA ou buscar formas mais eficientes de competir com modelos como o DeepSeek.

A pressão para cortar custos e aumentar a eficiência pode levar a mudanças nas estratégias de desenvolvimento das plataformas, possivelmente acelerando fusões, aquisições e colaborações inesperadas.

A concorrência vai ter que reagir rápido ao DeepSeek, se quiserem se manter relevantes nessa disputa. Com pouco tempo, o aplicativo chinês já é o mais baixado em vários mercados, mostrando que o usuário está mais do que disposto a abraçar uma IA de qualidade a custo zero.

Mesmo que isso signifique ceder os seus dados para os chineses.

A China consolidou sua posição como uma potência na inteligência artificial com um golpe de mestre, desafiando o domínio dos Estados Unidos no setor.

O sucesso do DeepSeek pode incentivar ainda mais o desenvolvimento de tecnologias locais, reduzindo a dependência de componentes ocidentais e acelerando a inovação no país.

Estamos diante de um movimento que pode redefinir o equilíbrio global de poder na tecnologia, tornando a IA um dos principais campos de disputa geopolítica nos próximos anos.

 

Via Yahoo! Finance


Compartilhe