Modellen en prijzen - Entity Enricher-documentatie

Modellen en prijzen

Beheer LLM-providers en models, synchroniseer models vanuit externe registers, voer statuscontroles uit en configureer API-sleutels per organization voor onafhankelijke facturatie.

Providerbeheer

Entity Enricher ondersteunt een breed scala aan LLM-providers. Elke provider kan meerdere modellen hebben met individuele prijzen, mogelijkheden en configuratie.

Ondersteunde providers

AnthropicOpenAIGoogleMistralDeepSeekGroqTogether AIFireworks AICoherexAINVIDIA NIMOllamaAzure OpenAI

Providertypes

StandaardDe meeste providers (Anthropic, OpenAI, Mistral, enz.) gebruiken standaard API-eindpunten met bearer-tokenauthenticatie. Een Standard-provider kan ook verwijzen naar een aangepast OpenAI-compatibel eindpunt — zie Aangepaste & bedrijfseindpunten hieronder.
AzureAzure OpenAI gebruikt aangepaste deployment-endpoints met API-versieconfiguratie.
OllamaSelf-hosted Ollama-instanties met aangepaste endpoint-URL's en automatische modelontdekking.

Aangepaste en zakelijke endpoints

Veel teams sturen LLM-verkeer via een bedrijfs-AI-gateway, een regionaal endpoint of een provider die niet standaard is ingebouwd — bijvoorbeeld een enterprise LiteLLM-proxy, Cloudflare AI Gateway of Alibaba DashScope (voor Qwen-modellen). Je voegt deze toe als een eigen Standard (OpenAI-compatible)provider met een aangepaste base-URL.

Een gateway-provider toevoegen

  1. Maak een provider aan met een naam die niet een van de ingebouwde namen is (bijv. acme-openai-gw). Ingebouwde namen zoals openai of anthropic zijn gereserveerd.
  2. Kies het type Standaard (OpenAI-compatibel) en vul Aangepast API-eindpunt (basis-URL) in — bijv. https://gateway.example.com/v1. Dit veld is vereist voor elke provider waarvoor Entity Enricher geen ingebouwde client heeft.
  3. Voeg de sleutel van de gateway toe als Organisatiesleutel voor die provider (API Keys → AI Provider Keys), zodat facturering en rotatie per organisatie plaatsvinden.
  4. Voeg de modellen toe die de gateway aanbiedt. De model-identifier wordt letterlijk verzonden, dus die moet exact overeenkomen met wat de gateway verwacht.

Goed om te weten

  • Ingebouwde providers verbergen het endpoint-veld. Anthropic, OpenAI, Mistral en de andere herkende providers kennen hun endpoint al, dus er valt niets in te stellen. Als een aangepaste provider later ingebouwd wordt, blijft het opgeslagen endpoint zichtbaar zodat je het kunt wissen.
  • Alleen publieke HTTPS. Endpoints moeten publieke https://-URL's zijn. Loopback- en privébereiken (localhost, 10.x, 192.168.x) worden geweigerd om SSRF te voorkomen — een zelf gehoste server moet bereikbaar zijn via internet. Gebruik voor een lokale Ollama in plaats daarvan de speciale Ollama-tunnel.
  • OpenAI-compatibel wire-formaat. Aanroepen naar een aangepaste provider verlopen via de OpenAI-compatibele API, dus het endpoint moet het OpenAI-/v1-protocol spreken (chat completions, /models).
  • Verbinding testen test {endpoint}/models om de sleutel en de basis-URL te verifiëren voordat je een enrichment uitvoert.

Gelijktijdigheidslimieten (per sleutel)

Elke provider heeft een instelling Max concurrent calls per key (de override voor de rate limit). Deze bepaalt hoeveel LLM-aanroepen een enkele API-sleutel parallel uitvoert — voor elke flow die de sleutel gebruikt: de fan-out van de multi-expertise-enrichment, classification, arbitration en schema-/samplegeneratie.

  • Begrensd per sleutel, niet per provider. Elke organisatiesleutel en de gedeelde globale sleutel krijgt zijn eigen onafhankelijke budget, zodat de parallelle aanroepen van de ene sleutel die van een andere nooit verdringen.
  • Valt terug op een verstandige standaard wanneer niet ingesteld (standaarden per provider, doorgaans 3–5 gelijktijdige aanroepen).
  • Wordt van kracht bij de volgende taak — geen herstart nodig.

Dit staat los van de limiet max gelijktijdige jobs van je abonnement, die bepaalt hoeveel enrichment-jobs je hele organization tegelijk uitvoert over alle providers heen.

Modelmogelijkheden

Elk model houdt zijn mogelijkheden bij, die als pictogrammen worden getoond in de modelkiezer:

MogelijkheidBeschrijving
VisionKan afbeeldingen en visuele invoer verwerken
Tool-aanroepenOndersteunt function calling / tool use
Audio-invoerKan audio-invoer verwerken
PDF-invoerKan PDF-documenten verwerken
PromptcachingOndersteunt prompt-caching voor kostenreductie
RedenerenUitgebreid denken / chain-of-thought-mogelijkheden

Automatische prijssynchronisatie

Houd modelprijzen up-to-date door te synchroniseren vanuit externe registers. Het synchronisatieproces detecteert automatisch nieuwe modellen, prijswijzigingen en verwijderde modellen.

LiteLLM-register

De standaardprijsbron. Haalt gegevens op uit LiteLLM's door de community onderhouden register op GitHub met echte API-modelnamen, prijzen, contextlengtes en mogelijkheden.

Dekt ~30 providers. Bevat geen weergavenamen, benchmarks of generatiesnelheid.

PricePerToken

Een alternatieve bron van pricepertoken.com. Bevat weergavenamen, benchmarks (coderings- en wiskundescores) en generatiesnelheid (tokens per seconde).

Dekt ~20 providers. Biedt rijkere metadata dan LiteLLM.

Synchronisatieproces

  1. Dry-run-voorbeeld — Zie wat er verandert voordat je het toepast. Bekijk nieuwe modellen, prijsupdates en deactiveringen.
  2. Bronspecifieke matching — Elke bron beïnvloedt alleen modellen van die bron. Handmatige modellen worden nooit aangeraakt.
  3. Stabiele sync-sleutels — Modellen worden gematcht op een stabiele identifier, niet op naam. Je kunt modellen hernoemen zonder de synchronisatie te breken.
  4. Transactioneel toepassen — Alle wijzigingen worden in één databasetransactie toegepast voor consistentie.
  5. Automatisch aanmaken van providers — Als een gesynchroniseerd model bij een onbekende provider hoort, wordt de provider automatisch aangemaakt.

Model-gezondheidscontroles

Valideer proactief of modellen bereikbaar zijn door een minimale health check-prompt uit te voeren. Zo worden defecte modellen opgespoord voordat gebruikers fouten tegenkomen tijdens verrijking.

GeslaagdModel reageert succesvol. Als het eerder automatisch werd gedeactiveerd, wordt het opnieuw geactiveerd.
Niet gevondenModel geeft een 'niet gevonden'-fout terug. Het wordt automatisch gedeactiveerd om toekomstige fouten te voorkomen.
Overige foutAuthenticatiefouten, time-outs of rate limits worden gerapporteerd, maar leiden niet tot deactivering.

Statuscontroles kunnen worden uitgevoerd op alle modellen, de modellen van een specifieke provider of een enkel model. Resultaten worden in realtime gestreamd via SSE met een voortgangsbalk die het aantal geslaagde/mislukte controles toont.

Automatische deactivering

Wanneer een verrijkingsaanroep mislukt met een “model niet gevonden”-fout, wordt het model automatisch gedeactiveerd om herhaalde fouten te voorkomen. Dit gebeurt in realtime tijdens normale verrijkingsbewerkingen.

Reden voor deactiveringIngesteld doorAutomatisch heractiveerd?
Model niet gevondenVerrijkingsfouten of health checksJa (via prijssynchronisatie of validatie)
Synchronisatie verwijderdPrijssynchronisatie (model verdwenen)Ja (als het model opnieuw in het register verschijnt)
HandmatigBeheerdersschakelaar in de UINee (alleen handmatige reactivering)

Breng je eigen sleutel mee (BYOK)

Organisaties kunnen hun eigen API-sleutels voor LLM-providers configureren voor onafhankelijke facturering en gebruiksregistratie. Het systeem gebruikt een sleutelresolutie in twee niveaus met LRU-selectie:

1e
Sleutelpool organisatie

Sleutels per organisatie geconfigureerd op de pagina API Keys. Ondersteunt meerdere sleutels per provider met LRU-rotatie. Versleuteld met Fernet.

2e
Globale sleutelpool

Platformbrede sleutels beheerd door beheerders. Gedeeld over alle organizations. Ondersteunt ook meerdere sleutels per provider met LRU-rotatie.

Elke enrichment legt vast welke sleutel is gebruikt, zodat je de kosten per sleutel kunt volgen. Sleutels ondersteunen health checks en gebruikstellers en worden automatisch uitgeschakeld bij permanente storingen (ongeldige sleutel, betaling vereist). Sleutels met een rate limit worden tijdelijk teruggeschakeld terwijl andere sleutels in de pool worden gebruikt. Lees hoe je sleutels beheert in de API Keys-gids.

Importeren & Exporteren

Exporteer je volledige provider- en modelconfiguratie als JSON voor back-up of overdracht naar een andere instantie. Importeren is altijd een upsert: bestaande providers en modellen worden op naam gematcht en ter plekke bijgewerkt, terwijl nieuwe worden toegevoegd — er wordt niets verwijderd.

De export bevat providerinstellingen, modelconfiguraties, prijzen, mogelijkheden en de canonieke modelspecificaties — maar nooit API-sleutels, die apart worden opgeslagen. Configureer API-sleutels na het importeren apart. Systeembeheerders maken een back-up van de volledige globale catalogus; organisatie-eigenaren exporteren en importeren alleen de providers en modellen van hun eigen organisatie — de gedeelde globale catalogus kan niet via import worden aangemaakt of bewerkt.

Volgende stappen