Playground - Entity Enricher 文档

Playground

针对任意 AI 模型测试自定义 prompt,提供实时响应格式化、token 跟踪、成本指标和持久化历史记录。

概览

Playground 是一个自由形式的提示词测试环境。与由 schema 驱动的增强工作流不同,它允许你向模型发送任意的系统提示词和用户提示词,并检查原始响应。可用它试验提示词工程、测试模型能力或运行一次性查询。

模型
任意
语言
40
历史记录
持久化
成本跟踪
每次调用

界面布局

Playground 采用分栏布局,包含四个面板。所有输入都会跨会话保存在本地存储中。

系统 Prompt

设定 model 的行为和角色。此内容作为系统消息发送,并在多次执行之间保留,因此你可以在无需重新输入上下文的情况下迭代 user prompt。

用户 prompt

发送给模型的主提示词。你可在此编写查询、指令或测试用例。

响应

以自动检测的格式显示模型的响应。JSON 响应在 Monaco 编辑器中获得语法高亮;纯文本按原样呈现。一键复制到剪贴板。

历史记录

所有执行记录均保存在本地。可按模型筛选、查看提示词预览,并恢复任意此前会话以继续迭代。

配置

侧边栏提供 model 和语言选择:

选项描述
模型从任意已配置的 provider 中选择单个 AI model。虚拟化下拉菜单会显示定价和 provider 信息。
语言从 40 种支持的语言中选择。会影响发送给模型的提示词中的语言指令。

执行与指标

每次执行后,响应面板会显示详细指标:

处理时间总往返时间(毫秒),包括网络延迟和模型推理。
输入令牌由 model 统计的系统 prompt 与用户 prompt 中的 token 数量。
输出 tokenmodel 响应中的 token 数量。
成本根据模型的每 token 定价估算的美元成本。

执行历史

每次提示执行都会自动保存到本地存储。历史面板提供了查看和复用过往会话的工具:

模型筛选按所用模型筛选历史记录条目。快速查找来自特定提供方的结果。
提示词预览每条记录会显示用户提示词的前 50 个字符、时间戳和模型名称。
成功指示器显示执行成功或失败的可视化标记。
恢复会话点击任意历史记录即可恢复系统 prompt、用户 prompt、model 和语言选择。
清除历史记录一键移除所有已保存的条目。

常见用例

提示词工程

在将系统提示词和指令构建进增强架构之前,反复迭代以优化模型行为。

模型对比

用相同的 prompt 运行不同模型,在为充实选择模型之前,对比输出质量、速度和成本。

快速查询

无需搭建完整的 schema 和充实流水线,即可运行一次性知识提取查询。

后续步骤