Diffbot은 웹을 크롤링하여 수십억 개의 엔티티로 이루어진 거대한 지식 그래프로 구조화하고, 페이지를 정규화된 데이터로 변환하는 추출 API를 제공합니다. Entity Enricher는 다른 출발점을 택합니다. 존재하는 그대로의 웹을 미리 구축된 그래프에서 조회하는 대신, 여러 LLM과 사용자의 문서 및 실시간 웹 검색을 사용하여 사용자의 스키마에 맞춰 사용자가 정의한 엔티티를 보강하며, 중재와 신원 확인이 기본으로 내장되어 있습니다.
출력 구조를 정의하면 — 어떤 필드든, 어떤 중첩이든, 어떤 엔티티 유형이든 — 모델이 이를 채웁니다.
Diffbot의 고정된 지식 그래프 엔터티 유형과 필드를 조회합니다. 그 형태는 그들의 것입니다.
입력 키는 그대로 보존되며, 각 엔티티는 안정적이고 테넌트 범위의 시맨틱 ID를 부여받습니다.
엔터티는 사용자의 자체 레코드를 기준으로 모델링되지 않고 전역 지식 그래프 ID에 매칭됩니다.
둘 이상의 LLM이 병렬로 응답하며, 충돌은 추론 내용을 저장한 채 필드별로 해결됩니다.
단일 추출/그래프 파이프라인입니다. 모델 간 교차 검증이나 필드별 감사 추적이 없습니다.
엔터티와 스키마가 자신의 것이고, 원시 웹 커버리지보다 정확도/식별이 더 중요할 때 가장 적합합니다.
대규모의 사전 구축된 그래프가 필요하거나, 임의의 공개 웹페이지를 대규모로 구조화해야 할 때 가장 적합합니다.
| 기능 | Entity Enricher | Diffbot |
|---|---|---|
| 맞춤형 출력 schema(모든 필드) | 고정된 entity 유형 | |
| 직접 정의하는 모든 엔터티 유형 | KG 엔티티 유형만 | |
| 신뢰할 수 있는 출처 | LLM + 사용자 문서 + 웹 | 웹 크롤 + 지식 그래프 |
| 직접 보유한 레코드 / 키를 보강합니다 | KG 엔터티에 일치 | |
| 다중 모델 교차 검증 | ||
| 필드 수준 중재 + 감사 추적 | ||
| 시맨틱 ID (테넌트별 정체성) | 글로벌 KG ID | |
| 문서 수집 (PDF, DOCX, 이미지) | ||
| 웹 페이지 / HTML 추출 | 웹 검색을 통해 | |
| 다국어 출력(40개 언어) | ||
| 자체 키 사용 / 자체 호스팅 모델 | ||
| 방대한 사전 구축된 엔터티 그래프 | ||
| REST API + MCP + n8n / Make 인터페이스 | API | |
| 가격 모델 | 토큰당 과금 (BYOK) | 구독 / 엔터프라이즈 |
토큰당 과금
직접 발급한 LLM API 키를 사용하고 소비한 토큰에 대해 제공업체에 직접 결제합니다. 플랫폼 구독료도, 호출당 그래프 쿼리 요금도 없습니다.
구독
지식 그래프 및 추출 API에 대한 API 크레딧/쿼리로 측정되는 월간 요금제이며, 대용량 크롤링과 KG 접근을 위한 엔터프라이즈 등급을 제공합니다.
가격은 공개적으로 게시된 등급을 반영하며 변경될 수 있습니다 — 현재 요금은 각 공급업체에서 확인하세요.
고정된 그래프 스키마를 건너뛰세요. 직접 구조를 정의하고, 여러 모델과 문서, 웹으로 모든 엔티티를 강화하며, 자체 키와 아이덴티티를 유지하세요.
무료로 시작하기