A Pergunta de $50K: Qual Agente Está Consumindo Seu Orçamento de IA?

Você está rodando cinco agentes no GPT-4o: um assistente de chat, um resumidor de documentos, um reranker de busca, um copilot de checkout e um fluxo de onboarding. Sua conta mensal é de $50.000. Seu CFO pergunta: “Quanto disso é o agente de chat versus o resumidor?”

Você não faz ideia. Ninguém faz.

Chamadas de API de IA são opacas por padrão. Você recebe uma fatura da OpenAI. Um item. Sem detalhamento por agente, produto, equipe ou ambiente. E a maioria das camadas de roteamento e observabilidade que você adiciona por cima também não separa isso nativamente — o custo acaba agregado em um único número de dashboard que ninguém consegue acionar.

Como a Maioria das Ferramentas Lida Com Isso (Spoiler: Não Lidam)

Analisamos cinco camadas populares de ferramentas de IA — roteadores, plataformas de observabilidade e stacks de proxy — para ver como abordam a atribuição de custos por agente:

Portkey

O Portkey rastreia custos e suporta chaves virtuais por equipe, mas a atribuição de custos é no nível da chave, não do agente ou da funcionalidade. Se múltiplos agentes compartilham uma chave, você não consegue dividir os gastos. Seria necessário criar e gerenciar uma chave virtual separada por agente — possível, mas operacionalmente pesado depois que você passa de três ou quatro agentes.

Helicone

O Helicone tem excelente logging e permite marcar requisições com propriedades customizadas. Você poderia adicionar uma propriedade agent a cada requisição e então filtrar no dashboard. Mas isso é faça-você-mesmo — não existe um conceito de primeira classe de “projeto” com seu próprio orçamento, papéis ou segmentação por ambiente.

LiteLLM

O LiteLLM é um proxy de roteamento, não uma plataforma de alocação de custos. Ele roteia requisições e rastreia gastos, mas a atribuição por agente exige ferramentas externas. Você precisaria direcionar logs para sua própria stack de analytics e construir o agrupamento manualmente.

Langfuse

O Langfuse é uma plataforma de observabilidade. Ele rastreia chamadas de LLM e pode marcá-las com metadados, mas não aplica orçamentos, limites de taxa ou controle de acesso no nível do projeto. É um visualizador, não um controlador.

OpenRouter

O OpenRouter é um marketplace de modelos. Ele roteia para muitos modelos a preços competitivos, mas não segmenta custos por projeto ou agente. Você tem um saldo único e um histórico de uso que cobre tudo.

O Que “Por Projeto” Realmente Significa no Floopy

O Floopy trata Projetos como uma entidade de primeira classe. Um projeto representa um agente, uma funcionalidade do produto, um fluxo de trabalho de equipe, ou qualquer unidade lógica que você queira rastrear independentemente.

Como funciona

Crie um projeto no dashboard (ex: “Agente de Checkout”, “Reranker de Busca”, “Assistente de Chat”)
Envie um header em cada requisição: floopy-project-id: <project-id>
Cadeia de fallback: Se não houver header, o Floopy usa o default_project_id da chave de API. Se a chave tem um project_id fixo (hard-locked), ele sempre prevalece.

from openai import OpenAI

client = OpenAI(
    base_url="https://api.floopy.ai/v1",
    api_key="fl-your-key",
    default_headers={"floopy-project-id": "proj_checkout_abc123"},
)

Pronto. Cada requisição agora está vinculada a um projeto e cada widget do dashboard — custo, latência, qualidade, taxa de erro — detalha por projeto automaticamente.

Ambiente é propriedade da chave, não do projeto

Projetos são agnósticos a ambientes. Em vez disso, você atribui um ambiente (development, staging, production) a cada chave de API. Isso significa que você pode criar três chaves para o mesmo projeto — uma por ambiente — e comparar gastos entre ambientes nativamente no widget de custo por ambiente.

Orçamentos e alertas por projeto

Defina um limite mensal de custo por projeto. Receba alertas quando um projeto atingir 80% do orçamento. O Floopy retorna 402 Payment Required quando o limite é violado — sem faturas surpresa.

Papéis por projeto

Conceda a um prestador de serviço acesso apenas ao projeto “Reranker de Busca” sem expor os outros projetos, chaves ou dados de faturamento da sua organização. O papel manager pode criar projetos e gerenciar membros sem ser admin da organização.

Roteamento orientado por feedback por projeto

Como projetos são uma entidade de primeira classe, as decisões de roteamento que o Floopy toma a partir de sinal de sessão, avaliações automáticas, notas manuais e benchmarks também são escopadas por projeto. O assistente de chat e o resumidor de documentos aprendem quais modelos funcionam melhor para seu workload — e não uma média combinada entre todos os agentes da conta.

Um Caso Hipotético

Imagine que você opera uma plataforma de e-commerce com quatro agentes alimentados por IA:

Projeto	Gasto Mensal	Ambiente
Agente de Checkout	$2.847	production
Reranker de Busca	$1.923	production
Assistente de Chat	$1.205	production
Resumidor	$684	production

Sem projetos, você vê $6.659/mês como um número único. Com projetos, você imediatamente vê que o Agente de Checkout é 43% do gasto total. Você pode então:

Definir um limite de orçamento de $3.000 no Agente de Checkout
Comparar custo de dev vs. prod para identificar prompts ineficientes antes de irem para produção
Dar à equipe de checkout acesso ao dashboard do projeto sem expor outros projetos
Rotear o Agente de Checkout para um modelo mais barato assim que o feedback confirmar que ele se mantém sólido em prompts específicos de checkout

Experimente

Projetos estão disponíveis em todos os planos. Free inclui 1 projeto, Starter inclui 3, Pro inclui 10 e Enterprise não tem limite.

Aponte seu SDK para api.floopy.ai, adicione o header floopy-project-id, e sua próxima visita ao dashboard mostrará o detalhamento.