Dashboard dei costi - Documentazione di Entity Enricher

Dashboard dei costi

Analisi dei costi in tempo reale con grafici di serie temporali, ripartizioni per modello, metriche delle prestazioni e intervalli di date preimpostati configurabili.

Panoramica

La dashboard dei costi offre piena visibilità sulla spesa e sulle prestazioni dell'LLM. Aggrega i dati di tutti i record di arricchimento della propria organizzazione e li presenta tramite grafici interattivi e schede riepilogative. Consente di individuare le tendenze dei costi, confrontare l'efficienza dei modelli e ottimizzare la pipeline di arricchimento.

Schede

Preimpostazioni di data

Tipi di grafico

Multi-organizzazione

Proprietario+

Preimpostazioni di data

Seleziona un intervallo di tempo dalla barra laterale. L'URL si aggiorna per riflettere il preset selezionato (ad es. /costs/30d), consentendo viste aggiungibili ai preferiti:

Preimpostazione	Intervallo di tempo	Raggruppamento del grafico
`7d`	Ultimi 7 giorni	Giornaliero
`30d`	Ultimi 30 giorni	Giornaliero
`90d`	Ultimi 90 giorni	Settimanale
`all`	Tutto il periodo	Mensile

I proprietari e gli amministratori possono attivare Tutte le organizzazioni nella barra laterale per visualizzare i costi aggregati dell'intera piattaforma. Questa preferenza viene mantenuta nella memoria locale.

Scheda Panoramica dei costi

La scheda predefinita fornisce una ripartizione completa della spesa:

Schede di riepilogo

Costo totale

$12.47

Somma di tutti i costi LLM nel periodo

Richieste totali

342

Numero di chiamate LLM effettuate

Costo medio/richiesta

$0.036

Costo medio per singola chiamata

Modello più utilizzato

claude-sonnet

Modello con il maggior numero di richieste

Grafici e tabelle

Costi nel tempo— Grafico a linee che mostra le tendenze di spesa nel periodo selezionato, raggruppate per giorno/settimana/mese.

Costo per modello— Grafico a barre orizzontali dei 10 modelli principali per costo totale. Identifica rapidamente i modelli più costosi.

Utilizzo dei token— Ripartizione dei token di input, token di output e token totali consumati.

Approfondimenti sul modello— Schede che evidenziano il modello più utilizzato e il modello più costoso.

Ripartizione giornaliera— Tabella con data, numero di richieste, costo totale, costo medio per richiesta e totali dei token.

Scheda Analisi delle prestazioni

Passa alla scheda Prestazioni per analizzare l'efficienza dei model e individuare i compromessi tra costo e prestazioni:

Schede di riepilogo

Record totali

156

Record di arricchimento nel periodo

Modelli utilizzati

Modelli distinti che hanno prodotto risultati

Varianti linguistiche

Lingue utilizzate nell'enrichment multilingue

Intervalli di token

Bucket distinti di dimensione dei token di input

Grafici e tabelle

Costo vs durata— Grafico a dispersione con dimensioni delle bolle proporzionali al numero di richieste. Ogni bolla è un modello: trova il miglior equilibrio tra velocità e costo.

Prestazioni per modello— Tabella che confronta il numero di richieste, il costo medio, la durata media e le statistiche dei token per ciascun model.

Costo per numero di lingue— Grafico a barre che mostra come il costo aumenta al crescere del numero di lingue selezionate per l'arricchimento multilingue.

Costo per intervallo di token di input— Grafico a barre che suddivide i costi per fasce di dimensione del prompt di input (ad es. 0–1K, 1K–5K, 5K–10K token).

Prestazioni per numero di proprietà dello schema— Tabella che mostra come il costo e la durata dell'enrichment si correlano alla complessità dello schema (solo record di enrichment).

Suggerimenti di ottimizzazione

Confronta i modelli

Utilizzate il grafico a dispersione Costo vs Durata per individuare i modelli che offrono buona qualità a costi inferiori. Modelli più piccoli e veloci sono spesso sufficienti per schema semplici.

Monitora le tendenze

Controlla ogni settimana il grafico Costo nel tempo. Picchi improvvisi possono indicare lavori batch configurati in modo errato o cicli di ripetizione imprevisti.

Dimensiona correttamente gli schemi

La tabella Prestazioni per numero di proprietà dello schema mostra come il costo scala con le dimensioni dello schema. Rimuova le proprietà non necessarie per ridurre il costo per arricchimento.

Usa modelli di caching

I modelli con caching dei prompt (come Anthropic) riducono i costi per gli arricchimenti ripetuti con lo stesso schema. Le schede di utilizzo dei token mostrano il risparmio sui token memorizzati nella cache.

Dashboard dei costi

Panoramica

Preimpostazioni di data

Scheda Panoramica dei costi

Schede di riepilogo

Grafici e tabelle

Scheda Analisi delle prestazioni

Schede di riepilogo

Grafici e tabelle

Suggerimenti di ottimizzazione

Confronta i modelli

Monitora le tendenze

Dimensiona correttamente gli schemi

Usa modelli di caching

Passaggi successivi

Record

Modelli e prezzi

Riferimento API