Crest 文档
用户指南

数据血缘

Crest 数据血缘详细说明,包括资源选择、字段筛选、图谱解读、影响分析、删除前检查和常见问题。

数据血缘用于查看数据来源、使用方和变更影响范围。它是删除数据源、修改字段、调整数据集、下线仪表盘前必须查看的功能。

入口:顶部菜单 → 数据血缘。

数据血缘

这张图展示的是血缘总览。使用时先查看顶部统计,判断当前图谱规模;再用资源类型和资源选择缩小范围;最后在图谱区查看上下游节点。图谱过于复杂时,不宜直接查看全图,应按数据源、数据集或字段逐步过滤。

示例说明

本章以“数据集字段变更”和“页面指标追溯”为例说明血缘使用方法。示例中的资源类型和处理顺序可以复用,具体资源名称、负责人和字段口径应以实际项目为准。

血缘不是单独存在的页面,它连接了数据源、数据集、图表、仪表盘和数据大屏。理解血缘前,建议先把这条链路看清楚。

数据源详情

数据源是血缘的上游起点。这里能看到数据源类型、连接状态、表和字段。修改数据源连接、删除表、调整字段前,应该先到血缘里查看下游影响。

数据集结构

数据集是血缘中最关键的加工层。字段重命名、计算字段、分组字段、SQL 查询和缓存都可能改变下游图表结果。用户质疑指标来源时,通常要从图表追到数据集,再继续追到数据源字段。

血缘能解决什么问题

问题血缘可提供的支持
表是否可以下线查看表下游是否还有数据集、图表和页面
字段是否可以改名查看字段是否被数据集和图表引用
数据集是否可以删除查看是否有图表、仪表盘或大屏使用
指标来源从图表追溯到数据集字段和数据源字段
页面数据异常从页面向上查数据集和数据源
资源无人维护查看资源依赖后再决定清理方式

页面区域

区域说明
顶部统计显示当前范围内的节点、资源和关系数量
资源类型选择数据源、数据集、仪表盘 / 大屏等
资源选择选择具体资源
表字段筛选按表或字段缩小图谱范围
图谱区域展示上下游节点和依赖关系
资源明细展示当前图谱中的资源列表

血缘节点怎么理解

节点说明
数据源连接到的数据库、Excel 或 API
数据源中的物理表、视图或文件结构
字段表中的具体字段
数据集Crest 中用于图表分析的数据模型
数据集字段数据集中被重命名、计算或分类后的字段
图表使用数据集字段生成的可视化组件
仪表盘 / 大屏图表最终所在页面

通常从左到右表示“数据来源 → 数据加工 → 可视化展示”的路径。

查看数据源血缘

进入数据血缘

从顶部菜单打开数据血缘页面。

选择数据源视角

在资源类型中选择数据源。

选择目标数据源

搜索或从列表中选择要检查的数据源。

选择表和字段

如果只想看某张表或某个字段,继续使用表字段筛选。

查看下游依赖

在图谱中查看数据集、图表、仪表盘和大屏。

查看数据源血缘时,不能只看是否存在下游节点,还要看节点类型。如果下游只有测试数据集,风险较低;如果下游有已发布仪表盘、数据大屏或分享链接,变更就需要走发布和通知流程。

查看数据集血缘

适用于判断数据集是否可以删除、字段是否被使用。

操作步骤:

  1. 进入数据血缘。
  2. 选择数据集视角。
  3. 搜索数据集名称。
  4. 查看上游数据源、表和字段。
  5. 查看下游图表、仪表盘和大屏。
  6. 记录仍在使用的资源。

如果一个数据集下游仍有图表,删除数据集会导致图表不可用。

示例:判断字段是否可以改名

以“需求阶段”字段为例,改名前按以下步骤处理:

步骤操作判断
搜索资源在血缘中找到对应数据集确认选中的不是同名测试数据集
展开字段找到“需求阶段”字段看它是否连接到图表字段
查看下游记录使用该字段的图表和页面已发布页面需要重点关注
制定替换新字段准备好后,先在数据集同步不应直接删除旧字段
验证页面逐个打开下游仪表盘和大屏确认筛选、图表、联动都正常

字段改名常影响查询组件和联动。图表本身可能仍可显示,但筛选器和跳转参数可能已经失效,因此要同时检查页面交互。

查看仪表盘或大屏血缘

适用于分析页面指标来源。

仪表盘编辑器

仪表盘中的每个图表都会引用数据集字段。查看血缘时,不能只看页面名称,还要继续追到具体图表和字段。这样才能回答“这个数来自哪个字段、经过什么聚合、在哪些页面使用”。

数据大屏编辑器

数据大屏同样需要看血缘。大屏常用于展示和汇报,页面一旦公开分享,字段口径错误或上游数据变化的影响会被放大。改动大屏使用的数据集前,先用血缘确认下游页面和分享范围。

操作步骤:

  1. 选择仪表盘 / 大屏视角。
  2. 搜索页面名称。
  3. 查看页面包含哪些图表。
  4. 查看图表使用哪些数据集字段。
  5. 继续向上追溯到数据源表字段。

这适合用于解释指标来源。

示例:追溯一个指标来源

追溯“交付需求数”这类指标时,可以按这个顺序操作:

  1. 在血缘中选择仪表盘或数据大屏视角。
  2. 搜索页面名称,找到目标页面。
  3. 在图谱中定位对应图表,例如“月度吞吐量趋势”。
  4. 从图表继续追到数据集字段,例如“交付需求数”。
  5. 再向上追到数据集、数据源表和原始字段。
  6. 回到数据集页面查看 SQL、计算字段、分组字段和字段描述。
  7. 把最终口径写回页面说明或数据集描述。

这个过程用于明确指标链路。口径不清时,应先补充口径说明,再考虑调整图表。

删除资源前检查

删除任何数据资源前,都建议按以下流程执行:

搜索资源

在血缘中搜索数据源、表、字段、数据集或页面名称。

查看下游

确认是否还有图表、仪表盘或大屏依赖。

记录影响范围

保存截图或记录资源名称、负责人和影响页面。

与负责人确认

不能仅凭“看起来没人用”就删除。

替换或迁移

先让下游图表切换到新数据集或新字段。

再执行删除

删除后重新进入血缘确认关系已经清理。

删除检查建议保留截图或导出记录,尤其是数据源、数据集、已发布页面和外部分享相关资源。正式环境中,资源下线应有负责人确认,而不是由维护人员单独判断。

字段变更影响分析

字段变更包括改名、改类型、删除、口径调整。

变更风险建议
字段改名图表字段可能失效先在数据集同步字段,再检查图表
字段类型变化日期、数值图表可能异常修改前确认所有引用图表
字段删除下游图表直接不可用先替换字段,再删除
指标口径调整页面数值变化通知业务负责人并更新说明

典型场景

数据库表准备下线

  1. 在数据源视角选择该数据源。
  2. 选择目标表。
  3. 查看下游数据集。
  4. 查看数据集下游图表和页面。
  5. 如果仍有页面使用,先迁移到新表或新数据集。
  6. 迁移后再次查看血缘,确认无依赖再下线。

数据集准备重构

  1. 在数据集视角搜索数据集。
  2. 记录所有下游图表。
  3. 新建替代数据集。
  4. 修改图表数据来源。
  5. 预览仪表盘和大屏。
  6. 确认血缘切换到新数据集。
  7. 删除旧数据集。

用户质疑指标来源

  1. 在仪表盘 / 大屏视角找到页面。
  2. 找到对应图表。
  3. 追溯到数据集字段。
  4. 查看上游表字段。
  5. 回到数据集查看字段口径、计算字段或 SQL。
  6. 将口径说明补充到页面或数据集描述中。

页面准备公开分享

公开分享前,也建议看一次血缘:

  1. 从页面视角找到目标仪表盘或大屏。
  2. 查看页面下游是否有外部分享记录。
  3. 查看页面上游数据集和数据源。
  4. 确认是否包含人员、客户、合同、成本等敏感字段。
  5. 对外分享前删除或脱敏敏感明细。
  6. 分享后定期回到分享管理复核有效期。

血缘数据边界

Crest 的血缘基于系统内的元数据生成,主要覆盖 Crest 内部资源关系。

它通常不覆盖:

  • 外部调度平台中的 SQL。
  • 数据库外部脚本。
  • 其他 BI 工具里的报表。
  • 人工下载后加工的 Excel。
  • 未保存的草稿配置。

如果血缘没有显示某条关系,不能说明外部完全没有依赖。正式下线仍需结合业务确认。

常见问题

问题可能原因处理
找不到资源当前账号没有权限或资源名称不对换管理员账号确认或搜索关键字
血缘关系不完整SQL 复杂、资源未保存、外部依赖不在 Crest 中保存资源后重新查看,外部依赖单独确认
图谱过于复杂资源范围过大按表、字段或资源类型缩小范围
删除后仍看到关系缓存或资源仍有引用刷新页面,检查是否还有下游图表
字段改名后图表异常图表仍引用旧字段进入图表重新选择字段

使用建议

  • 数据源下线前必须看血缘。
  • 数据集字段改名或删除前必须看血缘。
  • 重要仪表盘交付前,用血缘确认指标来源。
  • 每次大规模资源清理前,先导出或记录影响范围。
  • 血缘结果要和业务负责人确认,不能仅依赖工具判断。