学术研究实体富集 - 用例 | Entity Enricher

学术研究实体富集

研究论文、作者和机构都是复杂实体,其文献计量数据分散在多个数据库中。Entity Enricher 让你可以为引用次数、h 指数、机构隶属关系、方法细节和资金来源定义自定义 schema——全部由多个 AI 模型进行充实和交叉验证。

学术数据为何受益于 AI 富集

文献计量数据分散在 PubMed、Scopus、Web of Science、Google Scholar 和机构知识库中。引用次数在不同索引之间各不相同,作者所属机构随时间变化,元数据质量也参差不齐。手动汇总既繁琐又容易出错,尤其是在进行系统综述或研究全景分析时。

Entity Enricher 的方法特别适合应对这一挑战。多个 LLM 各自带来不同的训练数据和知识,从而产生更丰富的覆盖范围。多模型融合随后会协调差异——如果两个模型报告的引用数不同,系统会自动选择中位数,或由仲裁模型推断哪个来源最为可靠。

示例:研究出版物 schema

精确定义你的分析所需的文献计量和方法学字段。使用 AI schema 生成,从示例出版物 record 创建此 schema。

ResearchEntity.json
{
  "name": "ResearchEntity",
  "properties": {
    "title": { "type": "string", "is_key": true },
    "authors": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "name": { "type": "string" },
          "affiliation": { "type": "string" },
          "orcid": { "type": "string" },
          "h_index": { "type": "number" }
        }
      }
    },
    "doi": { "type": "string" },
    "publication_year": { "type": "number" },
    "journal": { "type": "string" },
    "impact_factor": { "type": "number" },
    "citation_count": { "type": "number" },
    "abstract_summary": { "type": "string" },
    "methodology": {
      "type": "object",
      "properties": {
        "study_type": { "type": "string" },
        "sample_size": { "type": "number" },
        "statistical_methods": { "type": "array" },
        "peer_reviewed": { "type": "boolean" }
      }
    },
    "keywords": { "type": "array", "items": { "type": "string" } },
    "funding_sources": {
      "type": "array",
      "items": {
        "type": "object",
        "properties": {
          "funder": { "type": "string" },
          "grant_id": { "type": "string" }
        }
      }
    }
  }
}

按专业领域划分的丰富化字段

将文献计量数据与方法论和机构信息分离,可让每个 expertise domain 收到聚焦的 prompt,从而获得更精准的 enrichment。

字段专业领域描述
title常规完整出版物标题及别名标题
authors文献计量作者姓名、所属机构、ORCID ID 和 h 指数
citation_count文献计量主要索引中的引用总数
impact_factor文献计量发表时的期刊影响因子
methodology方法论研究设计、样本量及所用统计方法
keywords常规MeSH 术语、作者关键词和 classification 代码
funding_sources机构资助机构、资助编号及金额
abstract_summary常规研究结果的简明摘要

研究充实工作流

1

创建研究模式

为文献计量数据、方法学和机构信息定义字段。粘贴一条示例出版物 record,让 AI 生成 schema。

2

输入出版物数据

提供论文标题、DOI 或作者姓名。使用批处理模式可处理阅读清单或系统综述候选集。

3

多模型增强

多个 LLM 独立研究每篇出版物,利用不同的训练数据更广泛地覆盖引文数据库和机构记录。

4

导出富化后的数据集

以 JSON 格式下载结构化文献计量数据用于程序化分析,或以 Excel 格式下载用于人工审阅和标注。

常见研究用例

系统性文献综述

为候选论文富化方法学细节、样本量和质量指标,用于筛查和资格评估。

研究概况分析

绘制某个研究领域或治疗领域内的出版趋势、协作网络和资金模式。

作者画像

用 h 指数、任职机构历史、经费资助和合作网络丰富研究人员档案,助力招聘或合作决策。

拨款申请调研

识别你研究领域内的资助来源、资助金额和受资助主题,为申请资助策略提供参考。

立即开始充实研究数据

定义你的文献计量 schema,用多个 AI 模型交叉验证,获取用于系统综述和全景分析的结构化研究情报。

免费开始使用