Panel de costos - Documentación de Entity Enricher
Panel de costos
Análisis de costes en tiempo real con gráficos de series temporales, desgloses por modelo, métricas de rendimiento y presets de fechas configurables.
Resumen
El panel de costes le ofrece visibilidad total de su gasto y rendimiento en LLM. Agrega los datos de todos los registros de enriquecimiento de su organización y los presenta mediante gráficos interactivos y tarjetas de resumen. Úselo para identificar tendencias de coste, comparar la eficiencia de los modelos y optimizar su flujo de enriquecimiento.
Pestañas
2
Predefinidos de fecha
4
Tipos de gráfico
5
Entre organizaciones
Propietario+
Predefinidos de fecha
Seleccione un rango de tiempo en la barra lateral. La URL se actualiza para reflejar el ajuste predefinido seleccionado (por ejemplo, /costs/30d), lo que permite guardar vistas en marcadores:
Preajuste
Intervalo de tiempo
Agrupación del gráfico
7d
Últimos 7 días
Diario
30d
Últimos 30 días
Diario
90d
Últimos 90 días
Semanal
all
Todo el periodo
Mensual
Los propietarios y administradores pueden activar Todas las organizaciones en la barra lateral para ver los costos agregados de toda la plataforma. Esta preferencia se guarda en el almacenamiento local.
Pestaña de resumen de costos
La pestaña predeterminada ofrece un desglose completo del gasto:
Tarjetas de resumen
Coste total
$12.47
Suma de todos los costes de LLM en el periodo
Total de solicitudes
342
Número de llamadas al LLM realizadas
Costo promedio/solicitud
$0.036
Costo medio por llamada individual
Modelo más usado
claude-sonnet
Modelo con el mayor número de solicitudes
Gráficos y tablas
Costo a lo largo del tiempo— Gráfico de líneas que muestra las tendencias de gasto durante el período seleccionado, agrupadas por día/semana/mes.
Costo por modelo— Gráfico de barras horizontales de los 10 modelos principales por coste total. Identifique rápidamente los modelos más caros.
Uso de tokens— Desglose de tokens de entrada, tokens de salida y total de tokens consumidos.
Información del modelo— Tarjetas que destacan el modelo más utilizado y el modelo más costoso.
Desglose diario— Tabla con la fecha, el número de solicitudes, el coste total, el coste medio por solicitud y los totales de tokens.
Pestaña de análisis de rendimiento
Cambie a la pestaña Rendimiento para analizar la eficiencia de los modelos e identificar compensaciones entre coste y rendimiento:
Tarjetas de resumen
Total de registros
156
Registros de enriquecimiento en el periodo
Modelos utilizados
8
Modelos distintos que produjeron resultados
Variantes de idioma
3
Idiomas usados en el enriquecimiento multilingüe
Rangos de tokens
4
Distintos rangos de tamaño de tokens de entrada
Gráficos y tablas
Coste vs Duración— Gráfico de dispersión con burbujas de tamaño proporcional al número de solicitudes. Cada burbuja es un modelo: encuentre el mejor equilibrio entre velocidad y coste.
Rendimiento por modelo— Tabla que compara el número de solicitudes, el coste medio, la duración media y las estadísticas de tokens por modelo.
Costo por número de idiomas— Gráfico de barras que muestra cómo escala el costo según la cantidad de idiomas seleccionados para el enrichment multilingüe.
Costo por rango de tokens de entrada— Gráfico de barras que desglosa los costos por rangos de tamaño del prompt de entrada (p. ej., 0–1K, 1K–5K, 5K–10K tokens).
Rendimiento por número de propiedades del esquema— Tabla que muestra cómo el coste y la duración del enriquecimiento se correlacionan con la complejidad del esquema (solo registros de enriquecimiento).
Consejos de optimización
Comparar modelos
Utilice el gráfico de dispersión de Coste frente a Duración para encontrar modelos que ofrezcan buena calidad a menor coste. A menudo, los modelos más pequeños y rápidos son suficientes para schemas simples.
Supervisar tendencias
Revise semanalmente el gráfico de Costo a lo largo del tiempo. Los picos repentinos pueden indicar trabajos por lotes mal configurados o bucles de reintento inesperados.
Dimensione los schemas al tamaño justo
La tabla Rendimiento por número de propiedades del esquema muestra cómo escala el coste con el tamaño del esquema. Elimine las propiedades innecesarias para reducir el coste por enriquecimiento.
Usar modelos de caché
Los modelos con almacenamiento en caché de prompts (como Anthropic) reducen los costes de los enriquecimientos repetidos con el mismo esquema. Las tarjetas de uso de tokens muestran el ahorro de tokens en caché.