Últimas Notícias

Como as empresas estão administrando os gastos com tokens de IA

Se há algo que as firmas sabem fazer, é pisar no freio quando os gastos começam a disparar. Mas a inteligência artificial está testando esse instinto. Os custos com IA estão aumentando, embora a maioria dos líderes de tecnologia continue convencida de que a tecnologia pode gerar retornos significativos no futuro — desde que o preço não seja excessivo.

Diretores de tecnologia e informação (CIOs) disseram ao The Wall Street Journal Leadership Institute que estão adotando diversas estratégias para controlar os gastos com IA, incluindo métodos já consagrados durante a expansão da computação em nuvem, quando as firmas precisaram lidar com contas crescentes de cloud.

“Com a IA, você está colocando o cartão de crédito nas mãos do usuário final. Se não houver controle sobre isso, ou se o usuário não estiver suficientemente treinado, ele vai acumular uma conta enorme”, afirmou Chris Reed, diretor sênior de finanças de TI da firma de viagens online Priceline.

Ao contrário de ciclos tecnológicos anteriores, a adoção corporativa da IA depende de todos os funcionários — e não apenas dos desenvolvedores — utilizarem a tecnologia. Além disso, os serviços de IA são cada vez mais cobrados com base no uso, e o preço dos tokens, a unidade básica de processamento da IA, tem apresentado volatilidade. Tudo isso se traduz em custos mais elevados.

Na Priceline, painéis monitoram o consumo de tokens, e relatórios mensais são enviados ao diretor monetário (CFO) e ao diretor de tecnologia (CTO), segundo Reed. Quando um funcionário apresenta uso elevado de tokens, isso “gera uma conversa” para entender como ele está utilizando a IA. Os limites podem ser flexibilizados caso a pessoa esteja trabalhando em uma iniciativa que gere receita.

A chegada dos agentes de IA eleva a pressão sobre custos

A pressão sobre os gastos aumenta com a migração de chatbots baseados em prompts para agentes autônomos de IA que funcionam continuamente e consomem muito mais tokens. Com modelos cada vez maiores e mais sofisticados, espera-se que esses custos cresçam de forma acentuada.

“Será várias ordens de magnitude superior ao que gastamos hoje”, afirmou Greg Meyers, diretor digital e de tecnologia da farmacêutica Bristol Myers Squibb. Segundo ele, os custos associados aos agentes de IA tendem a crescer de forma “exponencial” à medida que o uso da tecnologia atingir um ponto de inflexão.

Meyers disse que já preparou a equipe de gestão da companhia, incluindo o CFO e o conselho de administração, para esperar um consumo “muito elevado” de tokens.

Ainda assim, ele vê um saldo positivo:

“Se considerarmos o retorno que acreditamos que isso pode gerar, entendemos que o investimento tende a ser bastante positivo.”

Ferramentas herdadas da era da computação em nuvem

Alguns executivos estão recorrendo a práticas desenvolvidas durante a expansão da computação em nuvem.

Kathy Kay, CIO da Principal Financial Group, afirmou que a firma está implementando processos de governança e otimização semelhantes aos utilizados para controlar gastos com cloud. Um dos focos é utilizar o modelo de IA mais adequado para cada tarefa, evitando que maior utilização resulte automaticamente em custos mais altos.

“Como os preços e as capacidades dos modelos evoluem muito rapidamente, estamos construindo uma estrutura flexível para nos adaptarmos ao longo do tempo e continuar implantando IA de forma eficiente”, disse.

Um dos conceitos que voltou ao centro das discussões é o FinOps, disciplina que combina finanças, engenharia e gestão de produtos para maximizar o valor dos investimentos em tecnologia e computação em nuvem.

Ravi Soin, CIO e diretor de segurança da informação da Smartsheet, afirmou que a equipe de FinOps da firma é responsável por monitorar todos os gastos com IA.

“Alguém precisa ser dono do orçamento”, disse.

A companhia criou alertas automáticos para avisar funcionários quando estão próximos de atingir seus limites de consumo de tokens.

“Temos painéis disponíveis para toda a firma, por departamento e por gestor, oferecendo visibilidade em tempo real sobre a frequência de uso e os custos, para que não haja surpresas no fim do mês”, explicou.

Outras firmas estão contratando especialistas externos com experiência em FinOps. A CVS Health, por exemplo, está recrutando um diretor executivo de engenharia de operações de IA com conhecimentos em governança de custos de GPUs e redução de despesas.

Agentes por toda parte

As firmas já utilizam mais IA do que nunca e muitas estão administrando um número de agentes de IA maior do que conseguem acompanhar.

Segundo Jim Schneider, analista sênior de pesquisa de ações do Goldman Sachs, pedir a um agente que execute uma tarefa pode exigir até 50 vezes mais capacidade computacional do que simplesmente fazer uma pergunta a um chatbot.

O Goldman Sachs estima que os agentes de IA elevarão o consumo de tokens em 24 vezes nos próximos quatro anos. Já os agentes corporativos poderão aumentar o consumo em 55 vezes até 2040.

As desenvolvedoras OpenAI e Anthropic afirmam que os custos dos tokens vêm caindo e chegaram a considerar cortes significativos de preços.

Mesmo assim, os agentes continuam consumindo quantidades crescentes de tokens, à medida que interagem entre si e operam durante períodos prolongados.

De acordo com levantamento da consultoria Bain & Company, enquanto os preços dos modelos caíram cerca de 50% entre dezembro de 2024 e dezembro de 2025, o volume de tokens consumidos aumentou 4,5 vezes no mesmo período.

Como reduzir a conta da IA

O desafio não é apenas controlar quanto a IA custa, mas também entender quanto valor ela gera, afirmam os executivos.

Atilla Tinic, CIO da Qualcomm, disse que a fabricante de chips adotou diferentes estratégias para limitar os gastos, incluindo tetos de consumo para determinadas equipes.

“Algumas áreas de engenharia são naturalmente grandes consumidoras de tokens”, afirmou.

A Qualcomm também implementou um sistema de “showback”, prática que permite demonstrar a cada departamento quanto dinheiro está associado ao consumo de tokens.

“Assim as pessoas entendem o impacto monetário dos seus gastos”, explicou Tinic.

Shannon Bell, CIO e diretora digital da OpenText, afirmou que mecanismos de showback ou chargeback podem reduzir os custos com tokens entre 20% e 30%.

“Queremos que nossos líderes de desenvolvimento sejam responsáveis pelos gastos e pelos resultados obtidos com eles”, disse.

Ainda assim, medir a eficiência do uso de IA não é simples.

“Um alto consumo de IA não é necessariamente algo bom ou ruim. Tudo depende do resultado de negócio que está associado a esse uso — e essa é a parte mais difícil de quantificar”, afirmou Reed, da Priceline.

Essa incerteza está levando muitas firmas a adotar outra estratégia: reduzir o custo por tarefa. Em vez de executar tudo em modelos grandes e caros, algumas estão migrando parte das operações para modelos menores, mais antigos ou de código aberto.

Segundo Tinic, utilizar esses modelos em hardware próprio da Qualcomm gera economias adicionais.

Seemantini Godbole, diretora digital e de informação da varejista Lowe’s, afirmou que a companhia também está implementando diretrizes para evitar o “desperdício de tokens”, incluindo o uso de modelos menores e de código aberto.

“O consumo de tokens é algo positivo, desde que esteja alinhado a um objetivo de negócio”, disse. “Também precisamos garantir que não estamos gastando capital desnecessariamente onde não há necessidade.”

O que achou dessa notícia? Deixe um comentário abaixo e/ou compartilhe em suas redes sociais. Assim deixaremos mais pessoas por dentro do mundo das finanças, economia e investimentos!

Esta notícia foi originalmente publicada em:
Fonte original

Autor: Karla Mamona

Dinheiro Portal

Somos um portal de notícias e conteúdos sobre Finanças Pessoais e Empresariais. Nosso foco é desmistificar as finanças e elevar o grau de conhecimento do tema em todas as pessoas.

Artigos relacionados

Botão Voltar ao topo