供应商数据源往往内容残缺、语言不对,同一款产品还有三种不同的写法。Entity Enricher 能将原始产品行和规格表 PDF 转化为完整、去重的目录记录——包含属性、类别、合规数据,以及您各渠道销售所用每种语言的描述。
产品目录的质量取决于其最差的供应商数据源。缺失的属性会破坏分面搜索,不一致的品牌拼写会把一个产品拆成五条列表,而每进入一个新市场都会成倍增加翻译工作量。PIM 系统能很好地存储产品数据——但它们并不能填补这些空缺,而人工录入数据在超过几百个 SKU 后便无法扩展。
借助 Entity Enricher,你可以定义目录所需的精确记录,并同时从两个来源进行增强:模型已掌握的产品和品牌信息,以及附加的供应商文档——规格表 PDF、包装照片、数据表。即使供应商拼写的名称不同,语义 ID 也能将重复的产品归并为一条记录,而标记为多语言的字段可通过一次调用返回多达 40 种语言。
下面是一个用于充实零售产品的示例 schema。你可以使用 AI schema 生成从示例产品 JSON 自动生成这样的 schema,也可以在 schema 编辑器中可视化地构建。标记为多语言的字段会以你选择的每种语言返回;semantic_id 字段为每个现实产品保持唯一标识。
{
"name": "RetailProduct",
"properties": {
"product_name": { "type": "string", "is_key": true, "multilingual": true },
"gtin": { "type": "string" },
"brand": { "type": "string" },
"semantic_id": { "type": "string" },
"category_path": { "type": "array", "items": { "type": "string" } },
"description": { "type": "string", "multilingual": true },
"materials": { "type": "array", "items": { "type": "string" } },
"dimensions": {
"type": "object",
"properties": {
"width_cm": { "type": "number" },
"height_cm": { "type": "number" },
"depth_cm": { "type": "number" },
"weight_g": { "type": "number" }
}
},
"care_instructions": { "type": "string", "multilingual": true },
"compliance": {
"type": "object",
"properties": {
"ce_marking": { "type": "boolean" },
"age_restriction": { "type": "string" },
"safety_warnings": { "type": "array" }
}
},
"seo_keywords": { "type": "array", "items": { "type": "string" } }
}
}Entity Enricher 会将你的模式拆分为多个专业领域,并为每个领域并行调用 LLM。营销、物流和合规字段各自获得专属提示词,而不是一次性发出单个庞大的请求。
| 字段 | 专业领域 | 描述 |
|---|---|---|
| product_name | 常规 | 规范化的产品标题,按销售渠道本地化 |
| gtin | 常规 | GTIN / EAN / UPC 条形码标识符 |
| brand | 商品管理 | 跨供应商拼写的规范品牌名称 |
| category_path | 商品管理 | 用于导航和分面搜索的分类归位 |
| materials | 产品规格 | 从规格表中提取成分与材料明细 |
| dimensions | 物流 | 用于运输和存储的包装尺寸与重量 |
| compliance | 合规 | CE 标志、年龄限制及强制性安全警告 |
| seo_keywords | 营销 | 购物者实际使用的搜索词和同义词 |
从您的 PIM 或数据源粘贴一行产品数据。AI 会生成带类型的模式,涵盖商品管理、物流、合规和营销等专业领域——并将名称和描述标记为多语言。
发送 SKU、不完整的行或条形码——并附上供应商规格表、数据表或包装照片,让提取的属性来自源文档,而非凭空猜测。
多个 LLM 并行填充每个产品并交叉核对每个字段。语义 ID 可跨供应商拼写、语言和重复导入识别重复产品。
模型之间的冲突会被检测并附完整推理予以解决。可将增强后的产品导出为 JSON 或 Excel,或通过 API 或 n8n 推送到你的 PIM 和商店。
一次性将异构的供应商数据源转换为你的目录格式——规范化的品牌、映射的类别,以及从附加规格表中提取的属性。
无需翻译流程即可开拓新市场:名称、描述和保养说明将在同一次增强调用中以各渠道语言返回。
补全缺失的材质、尺寸和类别字段,避免破坏筛选器和比较页面——按你的模式类型进行校验,而非自由文本。
在产品上线前,通过完整的 GTIN、安全警告、年龄限制和 CE 标志标记,满足市场平台的上架要求。
定义你的产品模式,附上供应商规格表,几分钟内即可获得完整、多语言、去重的目录记录——无需逐个 SKU 录入数据。
免费开始使用