Blog

Roteamento por feedback, feedback por sessão, otimização de custo LLM e engenharia de AI gateway — com atualizações de produto e guias.

product 6 min de leitura

Credibilidade v2: Agora Voce Pode Limitar, e A Gente Te Explica de Volta

Sete novas features estendem a superficie de credibilidade da Floopy — evidencia bucketizada de regressao, quatro novos portoes de constraint, savings verificados, explicacoes localizadas, dashboard de experimentos, passo de shadow no onboarding e endpoint de resultados. Canary Pro abre hoje.

8 de maio de 2026

product 6 min de leitura

Credibilidade por Design: Floopy Agora Expoe Cada Decisao de Roteamento

Cinco novas APIs e um dashboard novo permitem auditar, restringir, testar em sombra e exportar cada decisao de roteamento. Canary Pro abre hoje.

6 de maio de 2026

engineering 13 min de leitura

Quatro Sinais, Um Loop: Como Roteamento Multi-Fonte Realmente Funciona

NPS de sessão, LLM-as-judge, avaliação de admin e benchmarks falham sozinhos. Combinar os quatro com pesos dinâmicos é a única forma honesta de rotear.

17 de abril de 2026

engineering 8 min de leitura

Self-Hosted vs LLMOps Gerenciado: Quando Escolher Cada Um

LLMOps self-hosted te dá controle. LLMOps gerenciado te dá inteligência cross-tenant. O framework honesto pra decidir — nenhum dos dois está errado.

17 de abril de 2026

Dashboard de alocação de custos por projeto mostrando detalhamento de gastos por agente e funcionalidade

product 5 min de leitura

Alocação de Custos por Projeto para Agentes de IA

Detalhe gastos de IA por agente, funcionalidade ou equipe — para ver quais valem o custo e quais estão consumindo seu orçamento em silêncio.

14 de abril de 2026

guides 14 min de leitura

Como Hackers Exploram APIs de LLM (E Como Se Proteger)

Vetores de ataque contra APIs de LLM — de injeção de prompt a ataques de custo — e como detecção de ameaças em tempo real protege sua app.

9 de abril de 2026

product 4 min de leitura

Floopy Suporta MCP: Conecte Ferramentas de IA ao Seu Gateway

Floopy agora suporta Model Context Protocol — exponha seu gateway como servidor MCP ou conecte ferramentas externas aos seus workflows.

5 de abril de 2026

guides 5 min de leitura

Como Reduzir os Custos da API da OpenAI em Até 70%

Estratégias práticas para cortar sua conta da API da OpenAI — desde otimização de prompts e cache até roteamento de modelos e monitoramento.

5 de abril de 2026

engineering 8 min de leitura

Como o Floopy Protege Seu Tráfego de LLM

Um mergulho profundo nas camadas de segurança que protegem seus dados, API keys e prompts enquanto passam pelo gateway do Floopy.

5 de abril de 2026

product 4 min de leitura

Smart Cost Routing: Reduza Custos com IA em até 60%

O Smart Cost Routing escolhe modelos mais baratos para prompts simples, protegido pelo loop de feedback por sessão do Floopy. Economia típica de 40-60%.

5 de abril de 2026

guides 7 min de leitura

Como Construir um Workflow Agentico com MCP no Floopy

Construa um agent loop em producao com o Floopy: plugin YAML, servidor MCP de busca na web, gestao de segredos e teste completo.

5 de abril de 2026

engineering 7 min de leitura

Por que o Floopy Permanece Rápido Enquanto Otimiza Seus Agentes

Velocidade de gateway virou commodity. A pergunta real é se seu roteamento torna seus agentes melhores com o tempo. Veja como o Floopy faz os dois.

5 de abril de 2026

engineering 10 min de leitura

Otimização de Agentes vs AI Gateway: Qual a Diferença em 2026

Gateways roteiam tráfego. Plataformas de otimização de agentes aprendem com feedback de produção e melhoram o roteamento. Essa distinção importa.

4 de abril de 2026

guides 8 min de leitura

Como Escolher o Modelo de IA Certo (Dica: Pare de Escolher)

Pare de escolher modelo por endpoint. Deixe um roteador guiado por feedback escolher por prompt com NPS de sessão, auto-scores, ratings e benchmarks.

4 de abril de 2026

guides 6 min de leitura

Como Estimar e Controlar Seus Custos com APIs de IA

Aprenda a prever seus gastos com OpenAI, Anthropic ou Google AI antes que a conta surpreenda — com fórmulas, exemplos e dicas de monitoramento.

3 de abril de 2026

guides 5 min de leitura

Como Proteger Sua Aplicação de IA Contra Prompt Injection

Guia para desenvolvedores sobre como entender e prevenir ataques de prompt injection em aplicações que usam LLMs.

2 de abril de 2026

guides 5 min de leitura

Como Fazer Cache de Requisições de API de IA e Economizar 30-40%

Guia prático para implementar cache em chamadas de API da OpenAI, Claude e outros LLMs — desde cache exato até cache semântico.

1 de abril de 2026