Verrijkingsstrategieën - Entity Enricher-documentatie

Verrijkingsstrategieën

Entity Enricher biedt twee verrijkingsstrategieën die bepalen hoe LLM-aanroepen worden georkestreerd. De juiste strategie kiezen heeft invloed op nauwkeurigheid, snelheid en kosten.

Pipelinediagrammen

Van de eenvoudigste tot de krachtigste configuratie. Elke bouwt voort op de vorige.

Eenvoudig

Enkele doorloop — 1 model

Eén model, één aanroep. Het hele schema wordt in één prompt verzonden. Snel en goedkoop — ideaal voor eenvoudige schema's of snel itereren.

Entiteit

Aspirin

Elke entiteit: bedrijf, geneesmiddel, rechtszaak, onderzoekspaper...

Anthropic

Gebruik elke LLM-provider met je eigen API-sleutel.

AnthropicVolledig schema

Volledig schema in één aanroep — probeert automatisch opnieuw bij validatiefout.

Verrijkt resultaat

Aspirin

Multi-model

Enkele doorloop — 3 modellen

Dezelfde strategie, maar parallel uitgevoerd op meerdere modellen. De resultaten worden veld voor veld vergeleken en beslecht om één output met hoge betrouwbaarheid te produceren.

Entiteit

Aspirin

Elke entiteit: bedrijf, geneesmiddel, rechtszaak, onderzoekspaper...

Pre-flightclassificatie

Match — Pharmaceutical Compound

Vangt typemismatches op voordat je LLM-credits verspilt.

Anthropic

OpenAI

Google Gemini

Breng je eigen API-sleutels mee — werkt met elke LLM-provider.

AnthropicVolledig schema

OpenAIVolledig schema

GeminiVolledig schema

Volledig schema in één aanroep — probeert automatisch opnieuw bij validatiefout.

Uiteindelijk verrijkt resultaat

Aspirin

Gearbitreerd

Beredeneerde conflictoplossing op veldniveau levert het uiteindelijke betrouwbare resultaat op.

Geavanceerd

Multi-expertise — 3 modellen

Het schema wordt opgesplitst per expertisedomein. Elk model ontvangt gerichte sub-prompts voor elk domein. Resultaten worden per model diep samengevoegd en vervolgens gearbitreerd over de modellen heen. Maximale nauwkeurigheid voor complexe schema's met meerdere domeinen.

Entiteit

Aspirin

Elke entiteit: bedrijf, geneesmiddel, rechtszaak, onderzoekspaper...

Pre-flightclassificatie

Match — Pharmaceutical Compound

Vangt typemismatches op voordat je LLM-credits verspilt.

Anthropic

OpenAI

Google Gemini

Breng je eigen API-sleutels mee — werkt met elke LLM-provider.

Anthropic

FarmacologieLLM-prompt

RegelgevingLLM-prompt

OpenAI

FarmacologieLLM-prompt

RegelgevingLLM-prompt

Gemini

FarmacologieLLM-prompt

RegelgevingLLM-prompt

Schema opgesplitst per domein — zelfcorrigerende prompts proberen het opnieuw bij een validatiefout.

Anthropic resultaat

OpenAI resultaat

Gemini resultaat

Deep merge van expertise-reacties per model.

Uiteindelijk verrijkt resultaat

Aspirin

Gearbitreerd

Beredeneerde conflictoplossing op veldniveau levert het uiteindelijke betrouwbare resultaat op.

Gedetailleerde vergelijking

Aspect	Enkele doorloop	Multi-expertise
LLM-aanroepen	1 per model	N per model (1 per expertise domain)
Schema verzonden	Volledig schema in één prompt	Subset per expertisedomein
Uitvoering	Sequentieel (één call)	Parallel (alle expertisedomeinen worden tegelijk uitgevoerd)
Nauwkeurigheid	Geschikt voor eenvoudige schema's	Hoger — gerichte prompts leveren betere resultaten op
Snelheid	Sneller voor kleine schema's	Parallelle uitvoering kan sneller zijn voor grote schema's
Kosten	Lager (overhead van één call)	Hoger (meerdere aanroepen met overhead per aanroep)
Streaming	Alles-of-niets-resultaat	Progressief — resultaten stromen binnen zodra elke expertise klaar is
Gedeeltelijk gelukt	Nee — de hele aanroep slaagt of mislukt	Ja — geslaagde expertises worden bewaard, mislukte kunnen opnieuw worden geprobeerd

Wanneer je welke strategie gebruikt

Gebruik Single Pass wanneer:

•Je schema heeft minder dan 15–20 eigenschappen
•Alle eigenschappen behoren tot één domein (bijv. alle financiële gegevens)
•Je wilt het snelste, goedkoopste resultaat en nauwkeurigheid is minder cruciaal
•Je test een nieuw schema en itereert snel

Gebruik Multi-Expertise wanneer:

•Je schema beslaat meerdere expertisedomeinen (farmaceutisch, financieel, geografisch, enz.)
•Je hebt een complex schema met 20+ eigenschappen
•Nauwkeurigheid is cruciaal en je wilt gerichte, gespecialiseerde prompts
•Je wilt realtime voortgang terwijl elk domein klaar is
•Je hebt afhandeling van gedeeltelijk succes nodig — alleen opnieuw proberen wat mislukte

Hoe multi-expertise in detail werkt

De multi-expertisestrategie volgt voor elk model een proces in vier stappen:

Eigenschappen groeperen op expertise

Het schema wordt recursief doorlopen. Elke eigenschap met een expertisedomein-tag wordt gegroepeerd met andere met hetzelfde domein. Bijvoorbeeld: revenue en market_cap gaan naar de groep “financieel”, terwijl gmp_status naar “regelgeving” gaat.

Gerichte subschema's maken

Elke expertisegroep wordt een minimaal subschema dat alleen zijn eigen eigenschappen bevat. Dit betekent dat de LLM een kleinere, gerichtere prompt ontvangt en alleen de velden hoeft in te vullen waarin ze gespecialiseerd is.

Parallel uitvoeren

Alle expertise domain-aanroepen draaien gelijktijdig. Een schema met 5 expertise domains start 5 LLM-aanroepen tegelijk. Zodra een aanroep klaar is, worden de resultaten diep samengevoegd in de opgebouwde output en in realtime naar de UI gestreamd.

Gedeeltelijke fouten afhandelen

Als sommige expertises falen, retourneert het systeem de samengevoegde output van de geslaagde expertises met de status “Gedeeltelijk”. Je kunt alleen de mislukte expertises opnieuw proberen, en de nieuwe resultaten worden samengevoegd met de bestaande output zonder het al geslaagde werk te herhalen.

Combineren met multi-model enrichment

Beide strategieën kunnen worden gecombineerd met multimodelverrijking. Wanneer je meerdere modellen selecteert, voert elk model de gekozen strategie onafhankelijk uit. De resultaten kunnen vervolgens worden samengevoegd met multimodelfusie om één uitvoer met hoge betrouwbaarheid te produceren.

Voorbeeld: Multi-expertise gebruiken met 3 modellen en een schema met 4 expertisedomeinen start in totaal 12 LLM-aanroepen (3 modellen x 4 expertises). Modellen van verschillende providers draaien parallel, terwijl modellen van dezelfde provider in de wachtrij worden geplaatst om rate limits te respecteren.

Verrijkingsflow

Volledige doorloop van de pipeline

Classificatie

Pre-flight-verificatie van entiteitstype

Multimodelfusie

Resultaten van meerdere modellen samenvoegen

Verrijkingsstrategieën

Pipelinediagrammen

Enkele doorloop — 1 model

Enkele doorloop — 3 modellen

Multi-expertise — 3 modellen

Gedetailleerde vergelijking

Wanneer je welke strategie gebruikt

Gebruik Single Pass wanneer:

Gebruik Multi-Expertise wanneer:

Hoe multi-expertise in detail werkt

Combineren met multi-model enrichment

Gerelateerde documentatie