导读本文将分享小米指标体系建设及管理的最佳实践。
今天的介绍分为五个方面:
1. 指标体系概述
2. 业务痛点和指标体系的解决方式
3. 指标体系的搭建方法
4. 小米的最佳实践
5. 总结与展望
分享嘉宾|王浩 小米 高级软件研发工程师
编辑整理|苏基宗
内容校对|李瑶
出品社区|DataFun
01
指标体系概述
1. 指标体系的定义
- 首先,指标体系需要分两个方面来讲:一方面是指标,指标是对业务单元进行细分后的度量值,用于对业务进行描述、度量和拆解,是对业务量化的过程,以评价业务的好与坏;
- 另一方面是体系,由不同的维度组成。光有指标是不够的,还需要通过不同角度(维度)去思考业务,不同的维度最终构成了一个体系。
所以,构建指标体系最核心的就是要构建一套合适的指标,以及它应该有哪些维度来帮助我们做好业务。
02
业务痛点和指标体系的解决方式
构建指标体系主要面临三方面的困难和难点:
- 业务视角:业务上主要面临两个问题,一是数据出口多,指标不统一,需要反复确认业务口径和反复核对数据;二是系统多、平台多,各种各样的系统中存放了各自割裂的数据。
- 技术视角:技术上主要面临三个问题,一是指标定义和命名混乱,不同的技术人员和业务部门的理解和定义的指标不一致;二是指标生产,因为系统多,不同的团队都在建设自己的指标,导致指标重复建设、混乱;三是指标消费,指标出口不统一,输出口径不一致。
- 产品视角:目前没有一个产品能把整个数据流,从业务系统到数据仓开发、到指标管理、到BI 可视化展示全链路可见和管理。
03
指标体系的搭建方法
面对以上的指标体系痛点问题,小米形成了一套方法论解决问题。
1. OSM 模型
OSM 模型全称为 Object-Strategy-Measure 模型,包含业务目标、业务策略、业务度量。OSM 模型的核心思路是首先需要确认业务目标(O),以及北极星指标,基于明确的业务目标和北极星指标进行向下拆解;为了达到业务目标,制定相应的业务策略(S);制定了业务策略需要进一步的跟进执行进度和评价执行效果,即业务度量(M)。
以小米关注的库存周转效率指标为例,库存周转效率越高,意味着业务成本越低,每年可以为公司节省上亿成本。基于以上业务目标,制定了 2 个业务策略,一是要把老品尽快清除库存,减少资金占用;二是满足手机销售情况下,尽量降低库存数量。基于以上业务策略,设置了 2 个指标度量,一是货龄保持在 X 天以下,二是 DOS 低于 X 天。
2. MECE 法则
MECE 分析法是 Mutually Exclusive Collectively Exhaustive 的首字母缩写词,中文意思是“相互独立、完全穷尽”,即所谓的”无重复、无遗漏”。MECE 法则是金字塔原理里面一个经典模型,它的核心是“相互独立、完全穷尽”,主要用于如何划分业务领域,以及确定应该关注哪些维度。
- “相互独立”意味问题的细分需要在同一个维度上,并有明确的区分、不可重复;
- “完全穷尽”则意味着全面、完整,没有遗漏和缺失。
MECE 分类方法主要包括二分法、流程法、要素法、公式法及矩阵法等。
- 二分法:二分法在日常生活中比较常见,其实就是把事物分成 A 和非 A 两个部分,如“白天、黑夜”、“男人、女人”、“国内、国外”、“内部、外部”等;
- 流程法:按照事情发展的时间、流程、程序,对过程进行逐一的拆解,例如,小米销售业务涉及五个环节仓储、销售、物流、售后、客服;
- 要素法:主要用于事物由哪些要素(或部分)组成,把一个整体分成不同的构成部分。但是,在拆解要素时要保持维度的一致性,否则有可能出现有重叠和遗漏的问题,比如某图书馆可以按楼层这个维度来划分:一楼、二楼、三楼;
- 公式法:按照公式设计的要素进行分类,公式若成立,那么要素的分类就符合MECE 原则。比如 GMV=客流量X客单价;
- 矩阵法:把事物按二维矩阵进行分类或划分,例如说时间管理中常用的紧急且重要、紧急不重要、不紧急但重要、不紧急也不重要的分类方法就是典型的矩阵法。
04
小米的最佳实践
小米主要参考 OSM 模型和 MECE 原则,沉淀了集团数仓,并进一步形成了小米指标体系。
1. 小米指标体系建设-实现路径
小米指标体系的建设过程,主要包括模型设计、数仓建设、指标管理以及数据应用。
- 模型设计:根据 MECE 原则划分数据域,采用维度建模方法构建核心模型;
- 数仓建设:按照统一数据架构和规范,构建稳定安全的集团数仓;
- 指标管理:建设统一的数据字典,保障口径统一。实现快捷找数,高效用数;
- 数据应用:基于统一指标,快捷搭建看板,快速共享,实现高效数据消费。
2. 小米指标体系建设-模型设计
小米基于 MECE 原则,将核心业务进行了划分,包括研、产、供、销、服、用。业务线确定后,根据一些规范确定原子指标,再基于一些描述(比如时间、渠道等)来产生派生指标。指标确定后,再采用层级建模的方法构建数仓,最终实现模型设计的落地。
那如何评价模型设计的好与坏?
小米在设计模型的时候遵循以下7个原则:
- 高内聚和低耦合:包括业务特性和访问特性。业务特性:将业务相近或相关的数据设计为一个逻辑或者物理模型;访问特性:将高概率同时访问和低概率同时访问的数据分开存储;
- 核心模型与扩展模型分离:建立核心模型与扩展模型体系。核心模型应包含被多个业务高频访问的字段;扩展模型应包括个性化或少量业务访问的字段;
- 公共处理逻辑下沉及单一:底层公用的处理逻辑应在底层进行封装与实现,避免暴露给应用层;同一个公共逻辑避免在多处同时存在;
- 成本与性能平衡:适当的数据冗余可换取查询和刷新性能,不宜过度冗余与数据复制;
- 数据可回滚:处理逐辑不变,在不同时间多次运行数据的结果需确定不变;
- 一致性:相同的字段在不同表中的字段名必须相同;
- 命名清晰可理解:表命名规范需清晰、一致,表命名需易于下游的理解和使用。
go
3. 小米指标体系建设-集团数仓建设
基于设计好的模型,小米搭建了集团数仓。首先按照统一的规范和标准进行管理,集团关心的数据沉淀为集团公共数据资产,单一业务关心的数据由业务自行建仓;其次所有核心数据由集团统一管理,纳入集团数仓;最后集团关心的核心指标统一由集团数仓产生,由平台部门负责维护,以保证数据的客观和准确,做到数出一孔。
4. 小米指标体系建设-指标管理
数仓建好后,怎么给业务使用呢?小米将数据汇聚到数据湖中,并构建了语义模型,对数据湖中数据表进行解释,转化为业务可以理解的大宽表。基于此小米构建了“数据百科”产品,系统化的定义了指标和维度、指标描述、服务于哪些业务以及负责维护人等。同时“数据百科”与“小米办公”进行了打通,业务人员可以随时查看高亮显示的指标,并自助式生成所需的 BI 看板,也可以分享给他人。
想把指标做好,最难的不是技术,而是业务。如何让业务都用同一个指标,对集团指标认可呢?小米集团设置了集团考核指标,通过集团数仓将所有考核指标做到线上化,并牵引各个业务部门使用,业务产生的任何指标都必须和集团考核指标对齐。
业务的最大痛点是用数据的成本非常高,小米是如何解决的呢?
小米构建了指标体系后,业务可以通过看板、数据表及数据地图直接搜索找到对应的指标,查看到哪些是集团级指标、哪些是业务级指标,以及指标的定义、口径、描述等,并且可以通过数据血缘看到从业务系统到数仓加工的全链路过程。业务找到指标后通过点击可以马上搭建 BI 看板,以及做数据探索应用。
05
总结与展望
-
小米目前数据开发(数据工场)->指标管理(数据百科)->数据分析 (数鲸 BI) 全链路已经打通,通过数据血缘加工链路全链路可见;
-
指标体系建设方法论和工具已经在小米内部进行推广使用,覆盖公司核心业务板块、55 个数据域、520 个核心原子指标,方法论和工具会持续迭代实践。
以上就是本次分享的内容,谢谢大家。
分享嘉宾
INTRODUCTION
王浩
小米
高级软件研发工程师
小米数据中台部集团销服数仓负责人,专注数仓建设、指标体系建设等领域。
限时免费资料
往期优质文章推荐
往期推荐
推荐多任务 2023 最新进展:用户生命周期视角下的多任务推荐模型 STAN
混合存储架构中的数据编排
大型制造企业智能决策场景解析
腾讯 PCG 数据治理体系
大模型视角下的因果推断
大模型分布式训练效能提升的必要性(万字长文推荐收藏)
火山引擎 DataLeap 计算治理自动化解决方案实践和思考
知乎是怎样进行埋点平台建设升级的?
字节跳动 Spark Shuffle 大规模云原生化演进实践
终于有人讲透了用户分析方法论
上新了!电子书下载 | 指标体系的建立实战手册
小米数据中台建设实践赋能业务增长!
点个在看你最好看