电商产品数据增强 - 用例 | Entity Enricher

电商产品数据增强

供应商数据源往往内容残缺、语言不对,同一款产品还有三种不同的写法。Entity Enricher 能将原始产品行和规格表 PDF 转化为完整、去重的目录记录——包含属性、类别、合规数据,以及您各渠道销售所用每种语言的描述。

为什么产品目录需要 AI 增强

产品目录的质量取决于其最差的供应商数据源。缺失的属性会破坏分面搜索,不一致的品牌拼写会把一个产品拆成五条列表,而每进入一个新市场都会成倍增加翻译工作量。PIM 系统能很好地存储产品数据——但它们并不能填补这些空缺,而人工录入数据在超过几百个 SKU 后便无法扩展。

借助 Entity Enricher,你可以定义目录所需的精确记录,并同时从两个来源进行增强:模型已掌握的产品和品牌信息,以及附加的供应商文档——规格表 PDF、包装照片、数据表。即使供应商拼写的名称不同,语义 ID 也能将重复的产品归并为一条记录,而标记为多语言的字段可通过一次调用返回多达 40 种语言。

示例:零售产品模式

下面是一个用于充实零售产品的示例 schema。你可以使用 AI schema 生成从示例产品 JSON 自动生成这样的 schema,也可以在 schema 编辑器中可视化地构建。标记为多语言的字段会以你选择的每种语言返回;semantic_id 字段为每个现实产品保持唯一标识。

RetailProduct.json
{
  "name": "RetailProduct",
  "properties": {
    "product_name": { "type": "string", "is_key": true, "multilingual": true },
    "gtin": { "type": "string" },
    "brand": { "type": "string" },
    "semantic_id": { "type": "string" },
    "category_path": { "type": "array", "items": { "type": "string" } },
    "description": { "type": "string", "multilingual": true },
    "materials": { "type": "array", "items": { "type": "string" } },
    "dimensions": {
      "type": "object",
      "properties": {
        "width_cm": { "type": "number" },
        "height_cm": { "type": "number" },
        "depth_cm": { "type": "number" },
        "weight_g": { "type": "number" }
      }
    },
    "care_instructions": { "type": "string", "multilingual": true },
    "compliance": {
      "type": "object",
      "properties": {
        "ce_marking": { "type": "boolean" },
        "age_restriction": { "type": "string" },
        "safety_warnings": { "type": "array" }
      }
    },
    "seo_keywords": { "type": "array", "items": { "type": "string" } }
  }
}

按专业领域划分的丰富化字段

Entity Enricher 会将你的模式拆分为多个专业领域,并为每个领域并行调用 LLM。营销、物流和合规字段各自获得专属提示词,而不是一次性发出单个庞大的请求。

字段专业领域描述
product_name常规规范化的产品标题,按销售渠道本地化
gtin常规GTIN / EAN / UPC 条形码标识符
brand商品管理跨供应商拼写的规范品牌名称
category_path商品管理用于导航和分面搜索的分类归位
materials产品规格从规格表中提取成分与材料明细
dimensions物流用于运输和存储的包装尺寸与重量
compliance合规CE 标志、年龄限制及强制性安全警告
seo_keywords营销购物者实际使用的搜索词和同义词

产品富集工作流

1

定义你的产品模式

从您的 PIM 或数据源粘贴一行产品数据。AI 会生成带类型的模式,涵盖商品管理、物流、合规和营销等专业领域——并将名称和描述标记为多语言。

2

输入产品和文档

发送 SKU、不完整的行或条形码——并附上供应商规格表、数据表或包装照片,让提取的属性来自源文档,而非凭空猜测。

3

多模型增强与去重

多个 LLM 并行填充每个产品并交叉核对每个字段。语义 ID 可跨供应商拼写、语言和重复导入识别重复产品。

4

融合并导出到你的目录

模型之间的冲突会被检测并附完整推理予以解决。可将增强后的产品导出为 JSON 或 Excel,或通过 API 或 n8n 推送到你的 PIM 和商店。

常见电商用例

供应商数据源接入

一次性将异构的供应商数据源转换为你的目录格式——规范化的品牌、映射的类别,以及从附加规格表中提取的属性。

多语言目录扩展

无需翻译流程即可开拓新市场:名称、描述和保养说明将在同一次增强调用中以各渠道语言返回。

面向分面搜索的属性补全

补全缺失的材质、尺寸和类别字段,避免破坏筛选器和比较页面——按你的模式类型进行校验,而非自由文本。

市场平台与合规就绪

在产品上线前,通过完整的 GTIN、安全警告、年龄限制和 CE 标志标记,满足市场平台的上架要求。

立即开始富集您的产品目录

定义你的产品模式,附上供应商规格表,几分钟内即可获得完整、多语言、去重的目录记录——无需逐个 SKU 录入数据。

免费开始使用