Press "Enter" to skip to content

5 fatos que explicam por que a IA está mais barata, mas pagamos cada vez mais caro para usá-la

Compartilhe

A inteligência artificial vive um paradoxo econômico peculiar: enquanto o custo por token despenca continuamente desde o lançamento do ChatGPT, os usuários enfrentam contas cada vez mais altas.

Não dá para dizer que essa contradição é exclusiva desse segmento, já que o mundo dos videogames passa pelo mesmo efeito neste exato momento.

Os consoles de videogames de última geração contam com cinco anos de lançamento (no momento em que este artigo foi produzido) e estão custando cada vez mais caros, mesmo com os custos de produção absorvidos pela Microsoft e Sony.

A contradição aparente revela aspectos fundamentais sobre como a tecnologia de IA evoluiu e se tornou mais sofisticada, ao mesmo tempo em que tenta capitalizar os robustos investimentos feitos pelas empresas envolvidas.

O fenômeno afeta especialmente desenvolvedores e profissionais que adotaram massivamente essas ferramentas em seus fluxos de trabalho. A explicação para esse paradoxo reside na natureza dos novos modelos de raciocínio e nas aplicações emergentes que consomem recursos de forma exponencial.

Vamos conversar um pouco sobre isso, pois o tema é um pouco mais complexo do que parece.

 

Queda consistente nos preços por token

Os custos operacionais da IA despencaram desde 2022. Segundo dados da Epoch AI, o preço por milhão de tokens caiu drasticamente em todos os principais modelos.

Fatores como hardware mais eficiente e modelos otimizados contribuíram para essa redução contínua, além da própria otimização de recursos técnicos e operacionais dessas plataformas, considerando inclusive a redução dos preços do hardware envolvido par os servidores.

A tendência beneficia diretamente as empresas desenvolvedoras, que conseguem processar mais requisições com menor custo operacional. Paradoxalmente, essa economia não se reflete nas contas dos usuários finais.

A conta é repassada para o usuário final de qualquer maneira e, em alguns casos específicos, para que as versões gratuitas dessas plataformas ainda estejam disponíveis para o grande público.

Quem está pagando por IA está, de alguma forma, cobrindo os custos de quem não paga e, por tabela, devolvendo uma pequena porção da obscena quantidade de dinheiro investido pelas plataformas.

 

Modelos de raciocínio multiplicam o consumo

A nova geração de IAs que “pensam” consome recursos de forma exponencial, e isso está tirando o sono de CEOs e executivos responsáveis por essas plataformas.

Diferentemente dos modelos tradicionais que geram texto linearmente, os sistemas de raciocínio criam múltiplas teorias, analisam alternativas e refinam respostas antes de apresentar o resultado final.

O processo iterativo multiplica o número de tokens processados, o que aumenta os custos das plataformas em escala.

Embora melhore a precisão das respostas, cada consulta pode consumir dezenas de vezes mais recursos que um modelo convencional.

Foi mais ou menos esse o motivo pelo qual a OpenAI pediu encarecidamente para que os usuários do ChatGPT parassem de ser gentis e educados com a plataforma, pois a cada “por favor” e “muito obrigado” dos usuários, água e energia elétrica eram consumidos, deixando a conta para a empresa cada vez mais cara.

 

Programação assistida dispara os custos

Plataformas de “vibe coding” são outros elementos que ajudam a ilustrar melhor o problema dos altos custos envolvidos para a manutenção dos serviços de inteligência artificial.

Ferramentas como Cursor e Windsurf permitem programar com conhecimento mínimo, mas consomem tokens massivamente para gerar, revisar e otimizar código automaticamente.

As empresas deste segmento enfrentam dificuldades para manter modelos de negócio sustentáveis. E os usuários relatam contas com reajustes de preços que simplesmente dispararam os seus valores, forçando uma reavaliação sobre o uso intensivo dessas tecnologias.

 

Agentes de IA prometem custos elevados

Os sistemas autônomos de IA representam o próximo desafio econômico para todas as plataformas envolvidas.

Agentes capazes de executar tarefas complexas autonomamente consumirão recursos substanciais para compreender contextos, raciocinar sobre soluções e executar ações coordenadas.

A evolução tecnológica promete funcionalidades revolucionárias, mas também custos operacionais que podem limitar sua adoção generalizada no curto prazo.

Não existe almoço grátis neste mundo.

Toda melhoria tecnológica neste caso vai resultar em aumentos de custos consideráveis, pois novos recursos demandam em estruturas técnicas atualizadas. Não dá para rodar uma nova funcionalidade de IA em um hardware antigo.

 

Estratégias para otimização de custos

A solução mais eficaz envolve o uso seletivo de modelos de raciocínio, que é o que está acontecendo neste momento em praticamente todas as plataformas de inteligência artificial.

Para tarefas simples, modelos tradicionais oferecem custo-benefício superior, reservando sistemas avançados apenas para demandas que justifiquem o investimento adicional. E neste caso, quem quer mais vai pagar para ter algo a mais.

O roteamento inteligente da OpenAI exemplifica esta abordagem, direcionando automaticamente consultas para o modelo mais adequado.

A estratégia beneficia tanto usuários quanto provedores, otimizando recursos sem comprometer a qualidade das respostas.

Por outro lado, cria de forma direta uma separação de acesso aos melhores recursos de inteligência artificial disponível pelas plataformas.

Quem tem dinheiro para pagar vai ter os melhores recursos de IA. Quem não tem fica à margem dessa evolução, convivendo com as migalhas das funcionalidades.

Não sei se digo o famigerado “é melhor do que nada”, ou se me lamento pelo capitalismo falhar miseravelmente (mais uma vez).

 


Compartilhe