टाइम-सीरीज़ चार्ट्स, प्रति-मॉडल ब्रेकडाउन, प्रदर्शन मेट्रिक्स, और कॉन्फ़िगरेबल डेट प्रीसेट्स के साथ रीयल-टाइम लागत एनालिटिक्स।
अवलोकन
Cost Dashboard आपको आपके LLM खर्च और प्रदर्शन में पूरी दृश्यता देता है। यह आपके ऑर्गनाइज़ेशन के सभी एनरिचमेंट रिकॉर्ड से डेटा एकत्र करता है और उसे इंटरैक्टिव चार्ट और सारांश कार्ड के माध्यम से प्रस्तुत करता है। इसका उपयोग लागत रुझानों की पहचान करने, मॉडल दक्षता की तुलना करने, और अपनी एनरिचमेंट पाइपलाइन को अनुकूलित करने के लिए करें।
Tabs
2
तारीख प्रीसेट
4
चार्ट प्रकार
5
क्रॉस-Org
स्वामी+
तारीख प्रीसेट
साइडबार से एक समय सीमा चुनें। चयनित प्रीसेट को दर्शाने के लिए URL अपडेट होता है (उदा., /costs/30d), जिससे बुकमार्क करने योग्य व्यू सक्षम होते हैं:
प्रीसेट
समय सीमा
चार्ट ग्रुपिंग
7d
पिछले 7 दिन
दैनिक
30d
पिछले 30 दिन
दैनिक
90d
पिछले 90 दिन
साप्ताहिक
all
सभी समय
मासिक
स्वामी और एडमिन पूरे प्लेटफ़ॉर्म पर समेकित लागत देखने के लिए साइडबार में सभी संगठन टॉगल कर सकते हैं। यह प्राथमिकता लोकल स्टोरेज में सहेजी जाती है।
लागत अवलोकन टैब
डिफ़ॉल्ट टैब एक व्यापक खर्च विवरण प्रदान करता है:
सारांश कार्ड
कुल लागत
$12.47
इस अवधि में सभी LLM लागतों का योग
कुल अनुरोध
342
किए गए LLM calls की संख्या
औसत लागत/रिक्वेस्ट
$0.036
प्रति व्यक्तिगत कॉल औसत लागत
सबसे अधिक उपयोग किया गया मॉडल
claude-sonnet
सबसे अधिक रिक्वेस्ट काउंट वाला मॉडल
चार्ट और टेबल
समय के साथ लागत— चयनित अवधि में खर्च के रुझान दिखाने वाला लाइन चार्ट, दिन/सप्ताह/माह के अनुसार समूहीकृत।
मॉडल के अनुसार लागत— कुल लागत के अनुसार शीर्ष 10 मॉडलों का हॉरिज़ॉन्टल बार चार्ट। सबसे महंगे मॉडलों को तुरंत पहचानें।
टोकन उपयोग— इनपुट टोकन, आउटपुट टोकन, और खपत किए गए कुल टोकन का विवरण।
मॉडल इनसाइट्स— सबसे अधिक उपयोग किए गए मॉडल और सबसे महंगे मॉडल को हाइलाइट करने वाले कार्ड।
दैनिक विवरण— तिथि, अनुरोध संख्या, कुल लागत, प्रति अनुरोध औसत लागत, और token योग वाली तालिका।
प्रदर्शन विश्लेषण टैब
मॉडल दक्षता का विश्लेषण करने और लागत-प्रदर्शन ट्रेड-ऑफ पहचानने के लिए Performance टैब पर स्विच करें:
सारांश कार्ड
कुल रिकॉर्ड
156
अवधि में Enrichment रिकॉर्ड
उपयोग किए गए मॉडल
8
परिणाम देने वाले अलग-अलग मॉडल
भाषा वेरिएंट
3
बहुभाषी संवर्धन में उपयोग की गई भाषाएँ
टोकन रेंज
4
अलग-अलग इनपुट टोकन आकार बकेट
चार्ट और टेबल
लागत बनाम अवधि— बबल आकारों के साथ स्कैटर चार्ट, जो रिक्वेस्ट संख्या के अनुपात में हैं। प्रत्येक बबल एक मॉडल है — गति और लागत का सबसे अच्छा संतुलन खोजें।
model अनुसार प्रदर्शन— प्रति model अनुरोध संख्या, औसत लागत, औसत अवधि, और token आँकड़ों की तुलना करने वाली तालिका।
भाषा गणना के अनुसार लागत— बार चार्ट जो दिखाता है कि मल्टीलिंगुअल एनरिचमेंट के लिए चुनी गई भाषाओं की संख्या के साथ लागत कैसे बढ़ती है।
इनपुट टोकन रेंज के अनुसार लागत— इनपुट प्रॉम्प्ट साइज़ बकेट (जैसे, 0–1K, 1K–5K, 5K–10K टोकन) के अनुसार लागत को विभाजित करने वाला बार चार्ट।
schema प्रॉपर्टी संख्या अनुसार प्रदर्शन— यह दर्शाने वाली तालिका कि enrichment लागत और अवधि schema जटिलता के साथ कैसे सहसंबंधित होती हैं (केवल enrichment record)।
अनुकूलन सुझाव
Models की तुलना करें
कम लागत पर अच्छी गुणवत्ता देने वाले मॉडल खोजने के लिए Cost vs Duration स्कैटर चार्ट का उपयोग करें। सरल स्कीमा के लिए अक्सर छोटे, तेज़ मॉडल पर्याप्त होते हैं।
रुझान मॉनिटर करें
Cost Over Time चार्ट को साप्ताहिक रूप से जाँचें। अचानक उछाल गलत तरीके से कॉन्फ़िगर किए गए बैच जॉब या अप्रत्याशित रीट्राई लूप का संकेत हो सकते हैं।
schema को सही आकार दें
Performance by Schema Property Count टेबल दिखाती है कि स्कीमा आकार के साथ लागत कैसे बढ़ती है। प्रति-एनरिचमेंट लागत घटाने के लिए अनावश्यक प्रॉपर्टीज़ हटाएँ।
कैशिंग मॉडल का उपयोग करें
प्रॉम्प्ट कैशिंग वाले मॉडल (जैसे Anthropic) एक ही स्कीमा के साथ बार-बार होने वाले संवर्धन की लागत को कम करते हैं। टोकन उपयोग कार्ड कैश किए गए टोकन की बचत दिखाते हैं।