Salário vs Token: Como a IA Muda o Controle Financeiro

Este é o segundo artigo da série Navegando no Escuro, sobre o que está acontecendo de verdade com a IA nas empresas e o que fazer a respeito.

A Uber queimou o orçamento inteiro de IA de 2026 em quatro meses. O CTO publicou o fato nas redes sem cerimônia, como quem ainda está tentando entender o que aconteceu. O COO, Andrew Macdonald, disse à Fortune que não conseguia conectar o aumento no uso de IA a novas funcionalidades para o consumidor. Não foi aumento de preço por token que causou o problema. Foi volume. Ninguém sabia quanto seria consumido até a conta chegar.

A Microsoft, no mesmo período, começou a revogar licenças internas do Claude Code para parte de seus engenheiros, migrando-os para o Copilot interno. O timing coincide com o fim do ano fiscal. Uma empresa não-identificada relatou ter gasto 500 milhões de dólares com a Anthropic em um único mês após liberar acesso de IA para seus funcionários sem teto de uso.

Esse é o cenário em que decisores brasileiros estão tomando decisões sobre substituir pessoas por IA. Vale a conversa.

A ilusão do custo por token

O argumento que chega ao conselho parece irrefutável: tokens ficaram 90% mais baratos desde o lançamento do GPT-4 em 2023. O GPT-4 custava 30 dólares por milhão de tokens de entrada em março de 2023. Hoje, modelos equivalentes custam entre 1,25 e 3 dólares. A conta parece óbvia: substitua pessoas por IA, corte custos, escale sem contratar.

O problema está no que a conta não inclui, que é a parte relevante.

O FinOps Foundation publicou em fevereiro de 2026 o seu relatório anual, representando 1.192 organizações com mais de 83 bilhões de dólares em gastos com tecnologia. Um dos dados mais reveladores: 73% das empresas relataram que seus custos de IA excederam as projeções originais. Preço por unidade caiu. Fatura subiu. As duas coisas são verdadeiras ao mesmo tempo porque a equação relevante não é preço por token. É preço por token multiplicado por volume consumido.

O volume consumido não tem teto natural. Um funcionário trabalha oito horas. Um agente de IA pode rodar 24 horas por dia, sete dias por semana, processando tokens em cada etapa de cada tarefa que executa, incluindo etapas intermediárias que nenhum humano pediu. A análise de 2,4 bilhões de chamadas de API empresariais no primeiro trimestre de 2026 encontrou que organizações rodando workflows agênticos pagaram entre 2,31 e 18,40 dólares por milhão de tokens dependendo de como configuraram seus sistemas. Uma variação de oito vezes para o mesmo trabalho.

O que você sabe sobre salário que não sabe sobre token

Salário tem características que qualquer CFO reconhece: é negociado antes de ser pago, tem valor fixo mensal, sobe em intervalos previsíveis e termina quando você decide terminar. O custo total de um funcionário é calculável com margem de erro pequena. RH entrega o número. Financeiro aprova. Você sabe, no início de cada ano, quanto vai gastar com folha.

Token não tem nenhuma dessas características.

O preço por token é definido unilateralmente pelo fornecedor e pode mudar sem aviso contratual relevante. A OpenAI, a Anthropic e o Google publicam suas tabelas de preço e as atualizam quando julgam adequado. Não existe paridade com negociação trabalhista, não existe data-base, não existe sindicato do outro lado da mesa (e a assimetria de poder nessa relação é maior do que parece quando você está avaliando uma demo impressionante). Quando o fornecedor decide que o modelo novo custa mais, ele atualiza a tabela. Você migra para o modelo mais barato, aceita pagar mais, ou reconstrói sua arquitetura.

O volume consumido depende de como seus sistemas foram construídos, de como seus funcionários usam as ferramentas e de quantos agentes estão rodando em paralelo. A Sphere Partners, analisando padrões de consumo empresarial em 2025, identificou que um único power user pode consumir 50 vezes mais tokens por mês do que um usuário leve e que, sem limites por usuário, uma minoria pequena consome a maior parte do orçamento de IA da empresa.

Isso é o oposto de folha de pagamento. Em folha, você sabe quem ganha o quê antes de pagar. Em token, você descobre quanto gastou no final do mês, quando a fatura chega.

Quem controla o preço não é você

Existe uma dimensão do risco de tokens que raramente aparece nas apresentações de ROI de IA: dependência de fornecedor.

Quando você contrata um funcionário, a relação é regulada por lei trabalhista, por contrato e pelo mercado de trabalho. O custo pode subir, mas dentro de parâmetros que você conhece. Quando você constrói operações inteiras sobre a API de um único fornecedor de LLM, a relação é diferente. Você está terceirizando uma função crítica para uma empresa que pode mudar de preço, deprecar o modelo que você usa ou criar novas categorias de cobrança que não existiam quando você planejou a arquitetura.

O GitHub anunciou em 2026 que seus planos Copilot migrariam para cobrança baseada em uso a partir de junho, com créditos consumidos conforme tokens utilizados. Essa mudança transformou um custo fixo previsível em custo variável para empresas que constroem fluxos de trabalho de desenvolvimento em torno do Copilot. A mudança não é opcional. Você adapta ou substitui toda a infraestrutura.

A Gartner, em relatório de março de 2026, foi direta: modelos agênticos consomem de 5 a 30 vezes mais tokens por tarefa do que consultas padrão, e os custos totais de IA para empresas vão subir apesar da queda no preço por token. Fornecedores não repassam integralmente as reduções de custo de infraestrutura para o cliente. E os novos casos de uso que justificam a IA, agentes, automação contínua, monitoramento permanente, consomem volumes de tokens que não existiam nas planilhas de 2023.

O agente que consome enquanto você dorme

Existe uma categoria de custo de token que ainda não aparece no radar da maioria dos gestores: consumo de background.

Agentes de monitoramento, sistemas de vigilância de conformidade, documentos sob observação contínua. Esses sistemas processam tokens contra cada evento e cada atualização de dado que ocorre, independentemente de qualquer usuário ter feito uma solicitação. Um agente que monitora contratos em busca de cláusulas de risco consome tokens toda vez que um documento é atualizado. O sistema a fez por conta própria, dentro do fluxo para o qual foi programado, cobrou por isso, e ninguém percebeu no momento em que aconteceu.

Goldman Sachs publicou em maio de 2026 o relatório "Decoding the Agentic Economy". A projeção: o consumo global de tokens deve multiplicar 24 vezes até 2030, chegando a 120 quadrilhões de tokens por mês, impulsionado principalmente por agentes empresariais que rodam em loop, revisam seu próprio trabalho e operam de forma contínua. Se a adoção empresarial de agentes atingir escala plena, a demanda pode crescer 55 vezes até 2040.

Isso é um custo que nenhuma folha de pagamento tem. O funcionário que trabalha enquanto você dorme e cobra por cada pensamento que teve durante a noite.

O que o CFO precisa perguntar antes de assinar

Não estou argumentando contra o uso de IA. Estou argumentando contra decisões de substituição de pessoas por IA tomadas sem a mesma disciplina financeira que qualquer outra decisão de custo relevante exigiria.

Antes de aprovar uma iniciativa de substituição de headcount por IA, cinco perguntas merecem resposta documentada:

Qual é o teto de consumo mensal e quem é responsável por monitorá-lo? Token sem teto é passivo aberto. A boa notícia é que tetos são implementáveis tecnicamente. A má é que a maioria das empresas não os implementa antes de escalar.

Qual é a sensibilidade do custo ao volume? Se o uso dobrar, a fatura dobra. Existe algum mecanismo de absorção ou o custo é linear sem amortecimento?

Qual é o plano se o fornecedor alterar o preço do modelo que você usa? Migrar não é trivial quando seus fluxos de trabalho foram construídos em torno de um comportamento específico. O custo de migração precisa entrar no cálculo de risco.

O ROI foi calculado com o custo de tokens atual ou com uma projeção de volume real? A Deloitte documentou em janeiro de 2026 que chatbots de atendimento que custavam 5.000 dólares por mês em piloto chegaram a 50.000 dólares ou mais após deployment em escala, sem mudança no preço por token. Piloto e produção não são a mesma coisa.

Quem tem autoridade para pausar o sistema se o custo sair do planejado? Em folha de pagamento, existe um processo claro para decisões de corte. Em token, sem governança explícita, o sistema continua consumindo até alguém perceber.

Tokens mais baratos, conta maior

Preço vai cair. A tendência é real e documentada.

O problema com esse argumento é que ele resolve apenas metade da equação. Custo total não é preço por token. É preço por token multiplicado por volume. A Goldman Sachs projeta queda de 60% a 70% no custo por token até 2030 impulsionada por avanços em chips. Ao mesmo tempo, projeta aumento de 24 vezes no volume. Se o custo por unidade cai 70% mas o volume cresce 24 vezes, o gasto total cresce cerca de sete vezes. A matemática não fecha em favor do cliente.

Há também o que a Gartner identificou em 2026: fornecedores de IA não repassam integralmente a queda de custo de infraestrutura para o cliente. Eles retêm parte como margem e criam modelos mais capazes que incentivam a migração. O ciclo de atualização de modelos não existe para beneficiar o seu orçamento. Existe para manter a receita do fornecedor crescendo.

Tokens mais baratos por unidade e conta maior no agregado não são contraditórios. São o modelo de negócio funcionando como planejado, da perspectiva de quem vende os tokens.

Por onde continuar

A pergunta relevante não é se IA entra na operação. Já entrou. A pergunta é com que nível de rigor financeiro e de governança você vai gerenciar esse custo nos próximos três anos, antes que ele apareça como surpresa no balanço.

Empresas que chegaram primeiro ao problema, Uber, Microsoft e dezenas que não viraram notícia, chegaram porque escalonaram sem controles. As que chegam agora têm a vantagem de aprender com esses casos antes de replicá-los, o que em gestão é uma vantagem rara e com prazo de validade.

Na mentoria da Direção e Sentido, trabalho com decisores na construção desse rigor: mapeamento de casos de uso, modelo de governança de custo de IA, estrutura de decisão para quando faz sentido substituir headcount e quando não faz. Não é uma conversa técnica. É uma conversa de gestão sobre um custo que está crescendo mais rápido do que a maioria das diretorias percebe.

Se você tem essa decisão na mesa agora ou nos próximos meses, vale conversar antes de assinar.

Arnaldo Auad é consultor em gestão, BI e estratégia de dados na Direção e Sentido. Trabalha com executivos e gestores na construção de estratégias de IA que geram retorno mensurável.

Leia os outros artigos da série Navegando no Escuro: [Artigo 1: A IA Não Vai Tirar Seu Emprego. Mas Alguém com IA Vai] [Artigo 3: Vendado numa Sala Escura] [Artigo 4: Chegar Tarde Não é Só Perder Vantagem]

O Salário Que Você Controlava e o Token Que Controla Você