Tableau de bord des coûts - Documentation Entity Enricher

Tableau de bord des coûts

Analyse des coûts en temps réel avec graphiques temporels, ventilation par modèle, métriques de performance et préréglages de dates configurables.

Vue d'ensemble

Le tableau de bord des coûts vous offre une visibilité complète sur vos dépenses et performances LLM. Il agrège les données de tous les enregistrements d'enrichissement de votre organisation et les présente sous forme de graphiques interactifs et de cartes de synthèse. Utilisez-le pour identifier les tendances de coûts, comparer l'efficacité des modèles et optimiser votre pipeline d'enrichissement.

Onglets
2
Préréglages de dates
4
Types de graphiques
5
Inter-organisations
Propriétaire+

Préréglages de dates

Sélectionnez une plage de temps dans la barre latérale. L'URL se met à jour pour refléter le préréglage sélectionné (p. ex. /costs/30d), permettant des vues enregistrables en favoris :

PréréglagePériodeRegroupement des graphiques
7d7 derniers joursQuotidien
30d30 derniers joursQuotidien
90d90 derniers joursHebdomadaire
allToute la périodeMensuel

Les propriétaires et les administrateurs peuvent activer Toutes les organisations dans la barre latérale pour afficher les coûts agrégés sur l'ensemble de la plateforme. Cette préférence est conservée dans le stockage local.

Onglet Aperçu des coûts

L'onglet par défaut fournit une ventilation complète des dépenses :

Cartes de résumé

Coût total
$12.47
Somme de tous les coûts LLM sur la période
Total des requêtes
342
Nombre d'appels LLM effectués
Coût moyen/requête
$0.036
Coût moyen par appel individuel
Modèle le plus utilisé
claude-sonnet
Modèle avec le plus grand nombre de requêtes

Graphiques et tableaux

Évolution des coûtsGraphique linéaire montrant l'évolution des dépenses sur la période sélectionnée, regroupées par jour/semaine/mois.
Coût par modèleGraphique à barres horizontales des 10 modèles au coût total le plus élevé. Identifiez rapidement les modèles les plus coûteux.
Utilisation des tokensDétail des jetons d'entrée, des jetons de sortie et du total des jetons consommés.
Analyses des modèlesCartes mettant en avant le modèle le plus utilisé et le modèle le plus coûteux.
Répartition quotidienneTableau avec la date, le nombre de requêtes, le coût total, le coût moyen par requête et les totaux de tokens.

Onglet Analyse des performances

Passez à l'onglet Performance pour analyser l'efficacité des modèles et identifier les compromis coût-performance :

Cartes de résumé

Total des enregistrements
156
Enregistrements d'enrichissement sur la période
Modèles utilisés
8
Modèles distincts ayant produit des résultats
Variantes linguistiques
3
Langues utilisées dans l'enrichissement multilingue
Plages de tokens
4
Tranches distinctes de taille de tokens d'entrée

Graphiques et tableaux

Coût vs duréeNuage de points avec des bulles de taille proportionnelle au nombre de requêtes. Chaque bulle représente un modèle — trouvez le meilleur équilibre entre vitesse et coût.
Performances par modèleTableau comparant le nombre de requêtes, le coût moyen, la durée moyenne et les statistiques de tokens par modèle.
Coût par nombre de languesGraphique à barres montrant l'évolution du coût selon le nombre de langues sélectionnées pour l'enrichissement multilingue.
Coût par plage de tokens d'entréeGraphique à barres détaillant les coûts par tranches de taille de prompt d'entrée (p. ex. 0–1K, 1K–5K, 5K–10K tokens).
Performances par nombre de propriétés du schémaTableau montrant la corrélation entre le coût et la durée d'enrichissement et la complexité du schéma (enregistrements d'enrichissement uniquement).

Conseils d'optimisation

Comparer les modèles

Utilisez le nuage de points Coût vs Durée pour trouver des modèles offrant une bonne qualité à moindre coût. Les modèles plus petits et plus rapides suffisent souvent pour les schémas simples.

Surveiller les tendances

Consultez chaque semaine le graphique Coût dans le temps. Des pics soudains peuvent indiquer des tâches de traitement par lot mal configurées ou des boucles de réessai inattendues.

Des schémas bien dimensionnés

Le tableau « Performances par nombre de propriétés du schéma » montre comment le coût évolue avec la taille du schéma. Supprimez les propriétés inutiles pour réduire le coût par enrichissement.

Utiliser les modèles de mise en cache

Les modèles avec mise en cache du prompt (comme Anthropic) réduisent les coûts des enrichissements répétés avec le même schéma. Les cartes d'utilisation des tokens affichent les économies liées aux tokens mis en cache.

Prochaines étapes