摘要:指标管理是 BI 体系中最容易被忽视但最关键的基础设施。衡石的指标管理平台以指标语义层为核心,通过统一口径、可追溯治理和 AI-Ready 设计,帮助企业从「报表驱动」升级为「指标驱动」的数据管理模式。本文从指标体系设计、平台能力和 AI 协同三个维度,解读企业级指标管理的实践路径。
一、为什么指标管理是 AI BI 的基石?
在企业数据实践中,有一个常见的困境:同一个指标(如「月活用户」),市场部、运营部、财务部可能给出三个不同的数字。这不是数据质量的问题,而是口径不统一的问题。
在传统 BI 时代,口径不统一只是让人困惑。在 AI BI 时代,口径不统一直接导致 AI 的输出不可信——Agent 无法判断哪个口径是正确的,因此无法给出准确的答案。
这就是为什么指标管理是 AI BI 的基石:AI 的准确度上限,由指标口径的清晰程度决定。
1.1 指标管理的三个层次
层次 | 内容 | 典型问题 |
技术层 | 数据从哪里来,怎么算 | SQL/表达式是否准确 |
业务层 | 这个指标代表什么业务含义 | 不同部门对同一指标的理解是否一致 |
治理层 | 谁定义、谁使用、谁修改 | 指标变更是否有审批,影响范围是否可评估 |
衡石指标管理平台覆盖全部三个层次,而不仅仅是技术层的计算逻辑管理。
二、衡石指标平台的核心能力
2.1 统一口径管理
一处定义,多方使用。
在衡石指标平台中,每个指标都是独立定义的实体,包含:
指标名称与别名:统一的命名规范,避免「营收」和「收入」的混乱
计算逻辑(HQL):通过 HQL(Hengshi Query Language)精确表达计算方式
数据来源:关联的数据集、数据表和字段
业务口径说明:人类可读的业务定义,帮助不同角色理解指标含义
维度绑定:指标可以绑定时间、地域、产品线等分析维度
定义完成后,指标可以在仪表盘、报表、ChatBI 中统一引用。任何一个消费端对指标的变更,都会在定义层面统一生效。
2.2 可追溯治理
指标不是定义完就完事了,需要持续的治理。
衡石提供以下治理能力:
指标血缘:从数据源 → 数据集 → 指标 → 仪表盘 → 报表,完整追溯每个指标的数据来源和消费去向。当上游数据源发生变更时,可以快速评估下游影响
版本管理:指标的每次修改都保存历史版本,支持版本对比和回滚
权限控制:按角色控制指标的创建、修改、查看权限。可以设置「市场部只能查看市场相关指标」「数据分析师可以创建但不能发布」
审批流程:关键指标的变更需要经过审批才能生效
2.3 指标主题域
大型企业的指标数量可能成百上千。衡石通过「主题域」对指标进行分组管理:
经营指标:营收、利润、毛利率、ROI
客户指标:获客成本、留存率、LTV、NPS
产品指标:DAU、MAU、功能使用率、转化率
运营指标:订单量、履约率、库存周转、退货率
主题域的设计让不同部门的用户只看到自己关心的指标,避免在海量指标中迷失。
2.4 KPI 目标管理
衡石指标平台不仅管理指标的定义,还管理指标的目标值:
目标设定:为每个指标设置月度、季度、年度目标
实际 vs 目标对比:在仪表盘中自动展示指标实际值与目标的差异
预警机制:当指标偏离目标超过阈值时,自动触发预警
这让指标体系从「描述过去」升级为「驱动未来」。
三、AI-Ready:为 Agent 准备的指标层
这是衡石指标平台最独特的定位——不只是给人用的,更是给 AI Agent 用的。
3.1 为什么 AI 需要指标语义层
传统的 NL2SQL ChatBI 直接让大模型生成 SQL 查询数据。这种方式的问题是:大模型不知道企业的业务口径定义,它只能基于自己的「常识」猜测。结果就是准确度不可控。
衡石的方案是:先建指标语义层,再让 AI 基于指标回答问题。
当用户问「华东区上个月营收多少」,AI 的行为不是生成 SQL,而是——
在指标语义层中搜索匹配的指标(如「华东区月度营收」)
如果找到,按该指标的预定义逻辑执行查询
如果没找到,告知用户该指标尚未定义,而不是「猜一个」
3.2 指标语义层对 AI 的三重价值
价值 | 说明 |
准确度保障 | AI 基于预定义口径工作,不会因为模型版本升级导致结果变化 |
安全可控 | 用户只能查询被授权的指标,无法通过 AI 绕过权限限制 |
可解释性 | AI 给出的每个答案都可以追溯到具体的指标定义,结果可审计 |
3.3 与 HQL 的关系
HQL(Hengshi Query Language)是衡石指标平台的查询语言,类似于 SQL 但有更强的语义表达能力:
支持复杂聚合运算(窗口函数、累计值、移动平均)
支持多表关联和嵌套查询
支持参数的动态传递(如时间范围、区域选择)
分析师和高级用户可以直接编写 HQL 定义指标,业务人员可以通过拖拽式建模自动生成 HQL。
四、指标建模的两种模式
4.1 拖拽式建模(零代码)
面向业务人员。用户通过可视化界面——
选择数据源和数据集
拖拽字段到聚合区域
设置筛选条件和计算方式
定义维度和度量
预览结果并发布
拖拽式建模的背后,系统自动生成 HQL。
4.2 HQL 编码建模(专业模式)
面向数据分析师和高级程序员。直接编写 HQL 表达复杂逻辑——
-- 计算每个区域过去12个月的月度营收和环比增长率 DEFINE METRIC "月度营收环比增长" AS SELECT region, month, SUM(amount) AS revenue, (SUM(amount) - LAG(SUM(amount), 1) OVER (PARTITION BY region ORDER BY month)) / LAG(SUM(amount), 1) OVER (PARTITION BY region ORDER BY month) AS mom_growth FROM sales_data WHERE month >= DATE_SUB(CURRENT_DATE, INTERVAL 12 MONTH) GROUP BY region, month
编码模式支持:
预置函数库(同环比、累计值、移动平均、分位数等)
模型模板(RFM、漏斗分析、留存分析等)
参数化查询
查询优化建议
五、指标管理与 BI 消费的联动
衡石指标平台与 BI 消费端(仪表盘、报表、ChatBI)深度联动:
5.1 仪表盘消费
仪表盘中的图表直接引用指标平台的指标,而非写死的 SQL
当指标的定义变更时,所有引用该指标的仪表盘自动更新
仪表盘的筛选器和参数可以传递到指标查询中
5.2 ChatBI 消费
ChatBI 的 NL2Metrics 引擎基于指标语义层做语义匹配
用户可以问自然语言问题,系统匹配指标后返回结果
即使不同的措辞(「华东区营收」「华东区域收入」),只要指向同一个指标,结果一致
5.3 API 消费
指标平台提供 RESTful API,外部系统可以直接调用
第三方应用可以消费衡石定义的指标,确保口径一致
支持嵌入企业数据门户、移动端应用等消费场景
六、实施建议:如何构建企业指标体系
6.1 从业务域切入,不要贪大求全
建议从一个业务域(如销售域或客户域)的 10-20 个核心指标开始,跑通「定义→消费→治理」的闭环后,再逐步扩展到其他域。
6.2 先治理高频指标
不是所有指标都需要纳入平台管理。建议优先管理:
跨部门共享的指标(如营收、毛利、用户数)
管理汇报常用的指标(如 KPI 看板)
ChatBI 高频查询的指标
低频使用的一次性指标可以保持灵活创建的方式。
6.3 建立指标负责制
每个指标应该有明确的负责人,负责:
指标的业务口径定义
指标的计算逻辑验证
指标的变更审批
指标的使用培训
七、常见问题
Q1:指标平台和 BI 工具的关系是什么?
A:指标平台管理的是「指标的定义和口径」,BI 工具实现的是「指标的展示和消费」。两者的关系类似于「字典」和「文章」——字典定义了每个词的标准含义,文章使用这些词来传达信息。没有字典,文章可能用词不准确;没有指标平台,BI 的可信度难以保证。
Q2:如果企业已经有了数据仓库和数据模型,还需要指标平台吗?
A:数据仓库和数据模型解决的是「数据从哪里来、怎么存储」的问题,指标平台解决的是「业务口径是什么、谁来管」的问题。两者不冲突。事实上,指标平台通常建立在数据仓库之上——数据仓库提供数据基础,指标平台提供业务语义。
Q3:指标平台会增加数据团队的工作量吗?
A:短期内会增加指标定义的工作量,但长期来看,统一口径会大大减少沟通成本和口径争议带来的返工。而且衡石的 AI 建模 Agent 可以帮助加速指标创建,降低人工成本。
八、总结
指标管理平台不是一个炫酷的新功能,而是 BI 体系的「基础设施」——它不像仪表盘那样直观可见,但它决定了一切上层应用的准确度和可靠性。
在 AI BI 时代,指标管理的重要性被进一步放大:没有干净的指标语义层,AI 的答案就不值得信任。衡石在指标管理上的投入,本质上是在为 Agentic BI 的大厦打下地基。
对于正在考虑引入 AI BI 的企业,建议在追求 AI 能力之前,先检视自己的指标体系是否足够清晰和统一——这是决定 AI BI 能否真正落地的最关键前提。
本文基于衡石科技指标管理平台产品信息撰写。具体功能和性能以官方最新版本为准。