Dashboard dei costi - Documentazione di Entity Enricher

Dashboard dei costi

Analisi dei costi in tempo reale con grafici di serie temporali, ripartizioni per modello, metriche delle prestazioni e intervalli di date preimpostati configurabili.

Panoramica

La dashboard dei costi offre piena visibilità sulla spesa e sulle prestazioni dell'LLM. Aggrega i dati di tutti i record di arricchimento della propria organizzazione e li presenta tramite grafici interattivi e schede riepilogative. Consente di individuare le tendenze dei costi, confrontare l'efficienza dei modelli e ottimizzare la pipeline di arricchimento.

Schede
2
Preimpostazioni di data
4
Tipi di grafico
5
Multi-organizzazione
Proprietario+

Preimpostazioni di data

Seleziona un intervallo di tempo dalla barra laterale. L'URL si aggiorna per riflettere il preset selezionato (ad es. /costs/30d), consentendo viste aggiungibili ai preferiti:

PreimpostazioneIntervallo di tempoRaggruppamento del grafico
7dUltimi 7 giorniGiornaliero
30dUltimi 30 giorniGiornaliero
90dUltimi 90 giorniSettimanale
allTutto il periodoMensile

I proprietari e gli amministratori possono attivare Tutte le organizzazioni nella barra laterale per visualizzare i costi aggregati dell'intera piattaforma. Questa preferenza viene mantenuta nella memoria locale.

Scheda Panoramica dei costi

La scheda predefinita fornisce una ripartizione completa della spesa:

Schede di riepilogo

Costo totale
$12.47
Somma di tutti i costi LLM nel periodo
Richieste totali
342
Numero di chiamate LLM effettuate
Costo medio/richiesta
$0.036
Costo medio per singola chiamata
Modello più utilizzato
claude-sonnet
Modello con il maggior numero di richieste

Grafici e tabelle

Costi nel tempoGrafico a linee che mostra le tendenze di spesa nel periodo selezionato, raggruppate per giorno/settimana/mese.
Costo per modelloGrafico a barre orizzontali dei 10 modelli principali per costo totale. Identifica rapidamente i modelli più costosi.
Utilizzo dei tokenRipartizione dei token di input, token di output e token totali consumati.
Approfondimenti sul modelloSchede che evidenziano il modello più utilizzato e il modello più costoso.
Ripartizione giornalieraTabella con data, numero di richieste, costo totale, costo medio per richiesta e totali dei token.

Scheda Analisi delle prestazioni

Passa alla scheda Prestazioni per analizzare l'efficienza dei model e individuare i compromessi tra costo e prestazioni:

Schede di riepilogo

Record totali
156
Record di arricchimento nel periodo
Modelli utilizzati
8
Modelli distinti che hanno prodotto risultati
Varianti linguistiche
3
Lingue utilizzate nell'enrichment multilingue
Intervalli di token
4
Bucket distinti di dimensione dei token di input

Grafici e tabelle

Costo vs durataGrafico a dispersione con dimensioni delle bolle proporzionali al numero di richieste. Ogni bolla è un modello: trova il miglior equilibrio tra velocità e costo.
Prestazioni per modelloTabella che confronta il numero di richieste, il costo medio, la durata media e le statistiche dei token per ciascun model.
Costo per numero di lingueGrafico a barre che mostra come il costo aumenta al crescere del numero di lingue selezionate per l'arricchimento multilingue.
Costo per intervallo di token di inputGrafico a barre che suddivide i costi per fasce di dimensione del prompt di input (ad es. 0–1K, 1K–5K, 5K–10K token).
Prestazioni per numero di proprietà dello schemaTabella che mostra come il costo e la durata dell'enrichment si correlano alla complessità dello schema (solo record di enrichment).

Suggerimenti di ottimizzazione

Confronta i modelli

Utilizzate il grafico a dispersione Costo vs Durata per individuare i modelli che offrono buona qualità a costi inferiori. Modelli più piccoli e veloci sono spesso sufficienti per schema semplici.

Monitora le tendenze

Controlla ogni settimana il grafico Costo nel tempo. Picchi improvvisi possono indicare lavori batch configurati in modo errato o cicli di ripetizione imprevisti.

Dimensiona correttamente gli schemi

La tabella Prestazioni per numero di proprietà dello schema mostra come il costo scala con le dimensioni dello schema. Rimuova le proprietà non necessarie per ridurre il costo per arricchimento.

Usa modelli di caching

I modelli con caching dei prompt (come Anthropic) riducono i costi per gli arricchimenti ripetuti con lo stesso schema. Le schede di utilizzo dei token mostrano il risparmio sui token memorizzati nella cache.

Passaggi successivi