Verrijkingsstrategieën - Entity Enricher-documentatie

Verrijkingsstrategieën

Entity Enricher biedt twee verrijkingsstrategieën die bepalen hoe LLM-aanroepen worden georkestreerd. De juiste strategie kiezen heeft invloed op nauwkeurigheid, snelheid en kosten.

Pipelinediagrammen

Van de eenvoudigste tot de krachtigste configuratie. Elke bouwt voort op de vorige.

Eenvoudig

Enkele doorloop — 1 model

Eén model, één aanroep. Het hele schema wordt in één prompt verzonden. Snel en goedkoop — ideaal voor eenvoudige schema's of snel itereren.

Entiteit

Aspirin

Elke entiteit: bedrijf, geneesmiddel, rechtszaak, onderzoekspaper...

Anthropic

Gebruik elke LLM-provider met je eigen API-sleutel.

AnthropicVolledig schema

Volledig schema in één aanroep — probeert automatisch opnieuw bij validatiefout.

Verrijkt resultaat

Aspirin

Multi-model

Enkele doorloop — 3 modellen

Dezelfde strategie, maar parallel uitgevoerd op meerdere modellen. De resultaten worden veld voor veld vergeleken en beslecht om één output met hoge betrouwbaarheid te produceren.

Entiteit

Aspirin

Elke entiteit: bedrijf, geneesmiddel, rechtszaak, onderzoekspaper...

Pre-flightclassificatie

Match — Pharmaceutical Compound

Vangt typemismatches op voordat je LLM-credits verspilt.

Anthropic
OpenAI
Google Gemini

Breng je eigen API-sleutels mee — werkt met elke LLM-provider.

AnthropicVolledig schema
OpenAIVolledig schema
GeminiVolledig schema

Volledig schema in één aanroep — probeert automatisch opnieuw bij validatiefout.

Uiteindelijk verrijkt resultaat

Aspirin

Gearbitreerd

Beredeneerde conflictoplossing op veldniveau levert het uiteindelijke betrouwbare resultaat op.

Geavanceerd

Multi-expertise — 3 modellen

Het schema wordt opgesplitst per expertisedomein. Elk model ontvangt gerichte sub-prompts voor elk domein. Resultaten worden per model diep samengevoegd en vervolgens gearbitreerd over de modellen heen. Maximale nauwkeurigheid voor complexe schema's met meerdere domeinen.

Entiteit

Aspirin

Elke entiteit: bedrijf, geneesmiddel, rechtszaak, onderzoekspaper...

Pre-flightclassificatie

Match — Pharmaceutical Compound

Vangt typemismatches op voordat je LLM-credits verspilt.

Anthropic
OpenAI
Google Gemini

Breng je eigen API-sleutels mee — werkt met elke LLM-provider.

Anthropic
FarmacologieLLM-prompt
RegelgevingLLM-prompt
OpenAI
FarmacologieLLM-prompt
RegelgevingLLM-prompt
Gemini
FarmacologieLLM-prompt
RegelgevingLLM-prompt

Schema opgesplitst per domein — zelfcorrigerende prompts proberen het opnieuw bij een validatiefout.

Anthropic resultaat
OpenAI resultaat
Gemini resultaat

Deep merge van expertise-reacties per model.

Uiteindelijk verrijkt resultaat

Aspirin

Gearbitreerd

Beredeneerde conflictoplossing op veldniveau levert het uiteindelijke betrouwbare resultaat op.

Gedetailleerde vergelijking

AspectEnkele doorloopMulti-expertise
LLM-aanroepen1 per modelN per model (1 per expertise domain)
Schema verzondenVolledig schema in één promptSubset per expertisedomein
UitvoeringSequentieel (één call)Parallel (alle expertisedomeinen worden tegelijk uitgevoerd)
NauwkeurigheidGeschikt voor eenvoudige schema'sHoger — gerichte prompts leveren betere resultaten op
SnelheidSneller voor kleine schema'sParallelle uitvoering kan sneller zijn voor grote schema's
KostenLager (overhead van één call)Hoger (meerdere aanroepen met overhead per aanroep)
StreamingAlles-of-niets-resultaatProgressief — resultaten stromen binnen zodra elke expertise klaar is
Gedeeltelijk geluktNee — de hele aanroep slaagt of misluktJa — geslaagde expertises worden bewaard, mislukte kunnen opnieuw worden geprobeerd

Wanneer je welke strategie gebruikt

Gebruik Single Pass wanneer:

  • Je schema heeft minder dan 15–20 eigenschappen
  • Alle eigenschappen behoren tot één domein (bijv. alle financiële gegevens)
  • Je wilt het snelste, goedkoopste resultaat en nauwkeurigheid is minder cruciaal
  • Je test een nieuw schema en itereert snel

Gebruik Multi-Expertise wanneer:

  • Je schema beslaat meerdere expertisedomeinen (farmaceutisch, financieel, geografisch, enz.)
  • Je hebt een complex schema met 20+ eigenschappen
  • Nauwkeurigheid is cruciaal en je wilt gerichte, gespecialiseerde prompts
  • Je wilt realtime voortgang terwijl elk domein klaar is
  • Je hebt afhandeling van gedeeltelijk succes nodig — alleen opnieuw proberen wat mislukte

Hoe multi-expertise in detail werkt

De multi-expertisestrategie volgt voor elk model een proces in vier stappen:

1
Eigenschappen groeperen op expertise

Het schema wordt recursief doorlopen. Elke eigenschap met een expertisedomein-tag wordt gegroepeerd met andere met hetzelfde domein. Bijvoorbeeld: revenue en market_cap gaan naar de groep “financieel”, terwijl gmp_status naar “regelgeving” gaat.

2
Gerichte subschema's maken

Elke expertisegroep wordt een minimaal subschema dat alleen zijn eigen eigenschappen bevat. Dit betekent dat de LLM een kleinere, gerichtere prompt ontvangt en alleen de velden hoeft in te vullen waarin ze gespecialiseerd is.

3
Parallel uitvoeren

Alle expertise domain-aanroepen draaien gelijktijdig. Een schema met 5 expertise domains start 5 LLM-aanroepen tegelijk. Zodra een aanroep klaar is, worden de resultaten diep samengevoegd in de opgebouwde output en in realtime naar de UI gestreamd.

4
Gedeeltelijke fouten afhandelen

Als sommige expertises falen, retourneert het systeem de samengevoegde output van de geslaagde expertises met de status “Gedeeltelijk”. Je kunt alleen de mislukte expertises opnieuw proberen, en de nieuwe resultaten worden samengevoegd met de bestaande output zonder het al geslaagde werk te herhalen.

Combineren met multi-model enrichment

Beide strategieën kunnen worden gecombineerd met multimodelverrijking. Wanneer je meerdere modellen selecteert, voert elk model de gekozen strategie onafhankelijk uit. De resultaten kunnen vervolgens worden samengevoegd met multimodelfusie om één uitvoer met hoge betrouwbaarheid te produceren.

Voorbeeld: Multi-expertise gebruiken met 3 modellen en een schema met 4 expertisedomeinen start in totaal 12 LLM-aanroepen (3 modellen x 4 expertises). Modellen van verschillende providers draaien parallel, terwijl modellen van dezelfde provider in de wachtrij worden geplaatst om rate limits te respecteren.