Credibilidade por Design: Floopy Agora Expoe Cada Decisao de Roteamento

Nao pedimos que voce confie na magica. Pedimos que voce inspecione.

Hoje estamos lancando a maior superficie de credibilidade que a Floopy ja teve: cinco novas APIs publicas, um painel lateral de decisao redesenhado no dashboard, um campo confidence em cada decisao de roteamento, restricoes declarativas que voce fixa em codigo, experimentos em modo sombra e uma exportacao em streaming do seu historico completo de decisoes com um trailer SHA-256. O canary Pro abre hoje. O GA publico e em 14 dias.

O problema que continuamos ouvindo

Pela maior parte do ultimo ano, a frase mais incomoda em uma call de venda da Floopy foi alguma variacao de: “Como eu sei o que o roteador de voces realmente esta fazendo?”

Era uma pergunta justa e a resposta nao era boa o suficiente. Voce via graficos de custo agregado. Voce via latencia. Voce via economia. O que voce nao via era a decisao por requisicao: qual modelo o roteador escolheu, quais alternativas ele considerou, quais sinais inclinaram a escolha, e quao confiante ele estava. O roteador entregava bons resultados; nao entregava os comprovantes.

Para o engenheiro de plataforma conectando Floopy a um SIEM, o lider de ML investigando uma resposta ruim do chatbot, o lider de FinOps auditando uma queda subita de custo, e o revisor de seguranca rodando avaliacao de fornecedor — a ausencia desses comprovantes era um bloqueador de adocao real. Entao construimos.

O que e novo

1. Decisoes que voce pode auditar

GET /v1/decisions/{id} retorna o registro completo da decisao para qualquer requisicao: o modelo escolhido, as alternativas consideradas, cada sinal que alimentou a escolha, as restricoes que estavam ativas, e a confianca que o roteador tinha no momento da chamada. GET /v1/decisions lista decisoes com filtragem por organizacao e cursor estavel. O painel lateral de decisao redesenhado em app.floopy.ai renderiza o mesmo registro visualmente — clique em qualquer linha do log de requisicoes e veja exatamente por que seu trafego foi para onde foi.

Ambos os endpoints sao restritos ao Pro para a superficie de listagem/filtro, mas GET /v1/decisions/{id} esta disponivel tambem no Free, porque credibilidade para o usuario Free e o caminho para o Pro.

2. Confianca em que voce pode agir

Cada decisao agora carrega um campo confidence — um score limitado que captura quanta massa de sinal o roteador tinha por tras da escolha. No trafego Day-0 (um modelo que o roteador nunca viu na sua org), a confianca e travada bem abaixo do teto de regime estavel, entao um candidato totalmente novo nao pode dominar o roteamento apenas com base em numeros de benchmark. A view Quality vs Cost no dashboard plota confianca como opacidade do ponto — decisoes de alta confianca aparecem vivas; a cauda de baixa confianca fica esmaecida para voce encontra-la num olhar.

Voce tambem pode transformar confianca em regra dura (proxima secao).

3. Restricoes que voce pode declarar

PUT /v1/constraints deixa voce fixar tres guard-rails em codigo, por organizacao:

max_regression — recusa rotear para um candidato cuja qualidade medida esteja mais de X pontos percentuais abaixo do seu default atual.
max_cost_increase — recusa rotear para um candidato que aumentaria o custo rolante em mais de Y%.
confidence_threshold — recusa rotear para qualquer candidato cuja confidence esteja abaixo de um piso definido por voce.

Cada PUT e gravado no log audit_events com o ator, os valores anteriores e os novos. O roteador le restricoes em cada decisao e as respeita silenciosamente — sem upgrades surpresa, sem downgrades surpresa, sem trade-offs opacos.

4. Experimentos que voce pode rodar em sombra

POST /v1/experiments deixa voce rodar um modelo candidato em modo sombra ao lado da sua rota de producao: o roteador responde o trafego de producao com o vencedor atual, mas tambem dispara o mesmo prompt no candidato, pontua os dois e escreve a comparacao no seu historico de decisoes. Nada muda visivelmente para o usuario. Voce pode reverter qualquer experimento ativo com uma chamada, e o rollback e ele mesmo um evento de auditoria.

Modo sombra e como recomendamos avaliar qualquer candidato novo — incluindo lancamentos dos provedores principais — antes de deixar tocar trafego real.

5. Dados que voce pode levar embora

GET /v1/export/decisions faz streaming do seu historico de decisoes como JSONL com um trailer SHA-256: a ultima linha do export e o digest de todas as linhas anteriores, entao voce pode verificar que o export foi completo e nao modificado antes de carrega-lo no seu warehouse. O export tem limite de concorrencia por org (uma stream por vez) e teto de linhas para proteger voce e nos, mas dentro desses limites voce pode levar tudo que registramos sobre seu roteamento — e deveria.

Nao ha blob proprietario, nao ha despejo opaco, nao ha “fale com o suporte para exportar.” Suas decisoes sao suas.

Como verificar a matematica em vez de so confiar

As paginas de metodologia em floopy.ai/docs/ sao a versao longa deste post:

Confianca: /docs/methodology/confidence — a formula, o cap Day-0, o teto de informacao compartilhada e o racional de cada parametro.
Baseline vs Floopy: /docs/methodology/baseline-vs-floopy — como calculamos o numero de economia que aparece no seu dashboard, incluindo os prompts que reproduzimos, as regras de janela e os modos de falha que explicitamente nao escondemos.

Cada endpoint tambem tem uma pagina de referencia completa com exemplo curl, sample JSON e matriz de erros em /docs/api/.

A parte honesta

Nao estamos afirmando “roteamento perfeito.” O roteador comete erros. Vai continuar cometendo. O ponto deste lancamento nao e que os erros desaparecam — e que voce agora pode encontra-los, nomea-los e limita-los.

Quando o roteador erra uma decisao, o registro de auditoria torna o erro visivel no painel lateral. Quando o mix de modelos muda de um jeito que voce nao autorizou, a API de restricoes para isso antes de subir. Quando um candidato novo parece tentador em benchmark mas falha no seu trafego, o modo sombra pega isso sem expor um unico usuario. Quando voce quiser sair com tudo que sabemos do seu trafego, o export faz isso com checksum.

Esse e o formato do acordo. Contamos a voce o que o roteador esta fazendo, voce define as regras que ele tem que seguir, e voce pode sair com seus dados a qualquer momento.

Como obter

Os novos endpoints, o painel lateral, o scatter Quality vs Cost, a view Baseline vs Floopy e as reescritas das FAQs estao no ar atras de uma flag de canary hoje. Clientes do plano Pro podem optar pelo canary enviando email para support@floopy.ai com o ID da organizacao. O GA publico e em 14 dias, condicionado a revisao pos-canary descrita no runbook de rollout do canary.

Se voce esta avaliando a Floopy e “nao podiamos auditar o roteador” estava na sua lista de bloqueadores — esse fechou.