Panel de costos - Documentación de Entity Enricher

Panel de costos

Análisis de costes en tiempo real con gráficos de series temporales, desgloses por modelo, métricas de rendimiento y presets de fechas configurables.

Resumen

El panel de costes le ofrece visibilidad total de su gasto y rendimiento en LLM. Agrega los datos de todos los registros de enriquecimiento de su organización y los presenta mediante gráficos interactivos y tarjetas de resumen. Úselo para identificar tendencias de coste, comparar la eficiencia de los modelos y optimizar su flujo de enriquecimiento.

Pestañas
2
Predefinidos de fecha
4
Tipos de gráfico
5
Entre organizaciones
Propietario+

Predefinidos de fecha

Seleccione un rango de tiempo en la barra lateral. La URL se actualiza para reflejar el ajuste predefinido seleccionado (por ejemplo, /costs/30d), lo que permite guardar vistas en marcadores:

PreajusteIntervalo de tiempoAgrupación del gráfico
7dÚltimos 7 díasDiario
30dÚltimos 30 díasDiario
90dÚltimos 90 díasSemanal
allTodo el periodoMensual

Los propietarios y administradores pueden activar Todas las organizaciones en la barra lateral para ver los costos agregados de toda la plataforma. Esta preferencia se guarda en el almacenamiento local.

Pestaña de resumen de costos

La pestaña predeterminada ofrece un desglose completo del gasto:

Tarjetas de resumen

Coste total
$12.47
Suma de todos los costes de LLM en el periodo
Total de solicitudes
342
Número de llamadas al LLM realizadas
Costo promedio/solicitud
$0.036
Costo medio por llamada individual
Modelo más usado
claude-sonnet
Modelo con el mayor número de solicitudes

Gráficos y tablas

Costo a lo largo del tiempoGráfico de líneas que muestra las tendencias de gasto durante el período seleccionado, agrupadas por día/semana/mes.
Costo por modeloGráfico de barras horizontales de los 10 modelos principales por coste total. Identifique rápidamente los modelos más caros.
Uso de tokensDesglose de tokens de entrada, tokens de salida y total de tokens consumidos.
Información del modeloTarjetas que destacan el modelo más utilizado y el modelo más costoso.
Desglose diarioTabla con la fecha, el número de solicitudes, el coste total, el coste medio por solicitud y los totales de tokens.

Pestaña de análisis de rendimiento

Cambie a la pestaña Rendimiento para analizar la eficiencia de los modelos e identificar compensaciones entre coste y rendimiento:

Tarjetas de resumen

Total de registros
156
Registros de enriquecimiento en el periodo
Modelos utilizados
8
Modelos distintos que produjeron resultados
Variantes de idioma
3
Idiomas usados en el enriquecimiento multilingüe
Rangos de tokens
4
Distintos rangos de tamaño de tokens de entrada

Gráficos y tablas

Coste vs DuraciónGráfico de dispersión con burbujas de tamaño proporcional al número de solicitudes. Cada burbuja es un modelo: encuentre el mejor equilibrio entre velocidad y coste.
Rendimiento por modeloTabla que compara el número de solicitudes, el coste medio, la duración media y las estadísticas de tokens por modelo.
Costo por número de idiomasGráfico de barras que muestra cómo escala el costo según la cantidad de idiomas seleccionados para el enrichment multilingüe.
Costo por rango de tokens de entradaGráfico de barras que desglosa los costos por rangos de tamaño del prompt de entrada (p. ej., 0–1K, 1K–5K, 5K–10K tokens).
Rendimiento por número de propiedades del esquemaTabla que muestra cómo el coste y la duración del enriquecimiento se correlacionan con la complejidad del esquema (solo registros de enriquecimiento).

Consejos de optimización

Comparar modelos

Utilice el gráfico de dispersión de Coste frente a Duración para encontrar modelos que ofrezcan buena calidad a menor coste. A menudo, los modelos más pequeños y rápidos son suficientes para schemas simples.

Supervisar tendencias

Revise semanalmente el gráfico de Costo a lo largo del tiempo. Los picos repentinos pueden indicar trabajos por lotes mal configurados o bucles de reintento inesperados.

Dimensione los schemas al tamaño justo

La tabla Rendimiento por número de propiedades del esquema muestra cómo escala el coste con el tamaño del esquema. Elimine las propiedades innecesarias para reducir el coste por enriquecimiento.

Usar modelos de caché

Los modelos con almacenamiento en caché de prompts (como Anthropic) reducen los costes de los enriquecimientos repetidos con el mismo esquema. Las tarjetas de uso de tokens muestran el ahorro de tokens en caché.

Próximos pasos