Painel de Custos - Documentação do Entity Enricher

Painel de Custos

Análises de custos em tempo real com gráficos de séries temporais, discriminações por model, métricas de desempenho e predefinições de datas configuráveis.

Visão geral

O Painel de Custos dá-lhe visibilidade total sobre os seus gastos e desempenho com LLM. Agrega os dados de todos os registos de enriquecimento da sua organização e apresenta-os através de gráficos interativos e cartões de resumo. Use-o para identificar tendências de custos, comparar a eficiência dos modelos e otimizar o seu pipeline de enriquecimento.

Separadores

Predefinições de Data

Tipos de gráfico

Entre organizações

Proprietário+

Predefinições de Data

Selecione um intervalo de tempo na barra lateral. O URL é atualizado para refletir a predefinição selecionada (por exemplo, /costs/30d), permitindo vistas que podem ser adicionadas aos favoritos:

Predefinição	Intervalo de tempo	Agrupamento de gráficos
`7d`	Últimos 7 dias	Diário
`30d`	Últimos 30 dias	Diário
`90d`	Últimos 90 dias	Semanal
`all`	Desde sempre	Mensal

Os proprietários e administradores podem ativar Todas as organizações na barra lateral para ver os custos agregados de toda a plataforma. Esta preferência é guardada no armazenamento local.

Separador de Visão Geral de Custos

O separador predefinido fornece uma discriminação abrangente dos gastos:

Cartões de resumo

Custo Total

$12.47

Soma de todos os custos de LLM no período

Total de Pedidos

342

Número de chamadas LLM efetuadas

Custo médio/pedido

$0.036

Custo médio por chamada individual

Modelo mais utilizado

claude-sonnet

Modelo com o maior número de pedidos

Gráficos e tabelas

Custo ao Longo do Tempo— Gráfico de linhas que mostra as tendências de gastos ao longo do período selecionado, agrupadas por dia/semana/mês.

Custo por Modelo— Gráfico de barras horizontais dos 10 principais modelos por custo total. Identifique rapidamente os modelos mais caros.

Utilização de tokens— Discriminação de tokens de entrada, tokens de saída e total de tokens consumidos.

Insights do Model— Cartões que destacam o modelo mais utilizado e o modelo mais caro.

Detalhe Diário— Tabela com data, número de pedidos, custo total, custo médio por pedido e totais de tokens.

Separador de análise de desempenho

Mude para o separador Desempenho para analisar a eficiência dos modelos e identificar compromissos entre custo e desempenho:

Cartões de resumo

Total de Registos

156

Registos de enriquecimento no período

Modelos utilizados

Models distintos que produziram resultados

Variantes de idioma

Idiomas usados no enriquecimento multilingue

Intervalos de tokens

Intervalos distintos de tamanho de tokens de entrada

Gráficos e tabelas

Custo vs Duração— Gráfico de dispersão com tamanhos de bolha proporcionais ao número de pedidos. Cada bolha é um modelo — encontre o melhor equilíbrio entre velocidade e custo.

Desempenho por modelo— Tabela que compara o número de pedidos, o custo médio, a duração média e as estatísticas de tokens por modelo.

Custo por Número de Idiomas— Gráfico de barras que mostra como o custo varia com o número de idiomas selecionados para enriquecimento multilingue.

Custo por Intervalo de Tokens de Entrada— Gráfico de barras que distribui os custos por intervalos de tamanho do prompt de entrada (por exemplo, 0–1K, 1K–5K, 5K–10K tokens).

Desempenho por número de propriedades do esquema— Tabela que mostra como o custo e a duração do enriquecimento se relacionam com a complexidade do schema (apenas registos de enriquecimento).

Dicas de Otimização

Comparar modelos

Utilize o gráfico de dispersão Custo vs Duração para encontrar models que oferecem boa qualidade a um custo mais baixo. Models mais pequenos e rápidos são muitas vezes suficientes para schemas simples.

Monitorizar tendências

Verifique o gráfico de Custo ao Longo do Tempo semanalmente. Picos súbitos podem indicar trabalhos em lote mal configurados ou ciclos de repetição inesperados.

Dimensione os esquemas corretamente

A tabela Desempenho por Número de Propriedades do Esquema mostra como o custo escala com o tamanho do esquema. Remova propriedades desnecessárias para reduzir o custo por enriquecimento.

Utilizar models de cache

Os modelos com cache de prompts (como a Anthropic) reduzem custos em enriquecimentos repetidos com o mesmo esquema. Os cartões de utilização de tokens mostram as poupanças de tokens em cache.

Painel de Custos

Visão geral

Predefinições de Data

Separador de Visão Geral de Custos

Cartões de resumo

Gráficos e tabelas

Separador de análise de desempenho

Cartões de resumo

Gráficos e tabelas

Dicas de Otimização

Comparar modelos

Monitorizar tendências

Dimensione os esquemas corretamente

Utilizar models de cache

Próximos Passos

Registos

Modelos e preços

Referência da API