行业动态
今天我们来探讨一下关于数据治理的灵魂三问:
1、、数据治理治什么,,治的是数据吗????
2、、、数据治理在哪里治,,,中台还是后台???
3、、、数据治理到底怎么治????
一、、数据治理治的是“数据”吗???
数据是指对客观事件进行记录并可以鉴别的符号,,,,是对客观事物的性质、、、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。。。。其实在我看来,,数据可以分为两个部分,,,一是数字,,二是文字。。。数字是没有意义的抽象符号,,,数据是有意义的数字。。。文字表意,,,数字表量,,,,当两者结合起来,,数据就产生了。。。
在我们的生活和工作当中,,,,数据无处不在。。对企业来讲,,有很多数据是无关企业重大利益的数据,,,是没有治理的必要的。。。。数据治理的对象必须是重要的数据资源,,是关乎企业重大商业利益的数据资源,,这样的数据资源可以称其为“数据资产”。。正如北大教授王汉生先生所说:“数据治理不是对“数据”的治理,,而是对“数据资产”的治理,,是对数据资产所有相关方利益的协调与规范。。”
我们需要分开来理解这句话:
①什么是数据资产???
②数据资产的相关利益方是谁???
③协调与规范什么???
先说一说什么是数据资产。。我们说不是所有数据都是数据资产,,,那到底什么才是数据资产呢????
《企业会计准则-基本准则》第20条规定:“资产是指企业过去的交易或者事项形成的、、、、由企业拥有或者控制的、、预期会给企业带来经济利益的资源。。” 如果照猫画虎修改一下,,,不难获得一个关于数据资产的定义:“数据资产是指企业过去的交易或者事项形成的,,,由企业拥有或者控制的,,,预期会给企业带来经济利益的数据资源。。。。”由此可见,,数据要成为数据资产,,至少要满足3个核心必要条件:
①数据资产应该是企业的交易或者事项形成的;
②企业拥有或者控制;
③预期会给企业带来经济利益。。
数据资产的利益相关方是谁???
根据数据资产的定义,,数据资产的利益相关方,,,包括:
①数据的生产者,,即通过业务交易或事项产生数据的人或组织。。
②数据的拥有或控制者,,,生产数据的人不一定是拥有数据,,就像我们天天上网的各种数据都不归我们自己所有,,,而是落在了各个互联网公司的数据库中。。
③数据价值和经济利益的收益者。。数据治理就是对数据生产者、、、拥有或控制者,,,数据价值获益者的规范和协调。。
都什么是需要协调和规范????
首先是数据的标准化,,,定义统一的数据标准,,,,“写中国字、、、说普通话”让数据资产的相关利益方在同一个“频道”沟通。。。。数据的标准化包含几个层面:①数据模型标准化。。②核心数据实体的标准化(主数据的标准化)。。。。③关键指标的标准化。。。
其次是数据的确权。。。。数据一旦成为资产,,就一定有拥有方,,,或者实际控制人,,,可以把他们统称产权人。。。与实物不同的是,,实物的产权是比较明确的,,数据则比较复杂。。。产品在生产制造过程中,,,并没有与消费者交易之前,,制造商拥有完全产权。。产品生产出来后,,,消费者通过购买支付相应的货币,,,便拥有了产品的产权。。而数据的生产过程就不一样了,,,我们的各种上网行为每天都会产生大量的数据,,例如:网上购物、、浏览网页、、使用地图、、评论/评价……。。。这些数据到底归谁所有????控制权该如何治理????这是摆在面前的一个难题!!!我们看到近几年一些不良商家,,,利用我们的上网数据,,导致安全隐私泄密的事件也层出不穷。。。希望随着技术和商业的进步,,尽快能够找到解决方案!!!!
第三是流程的优化。。。数据治理的两个目标:一个是提质量,,一个是控安全。。。互联网数据的确权目前已经是一个世界级难题,,做好企业业务流程的优化可能会对隐私保护起到一定的作用。。。通过业务流程优化,,规范数据从产生、、、、处理、、、、使用到销毁的整个生命周期,,,使得数据在各阶段、、、、各流程环节安全可控,,,合规使用。。。。另外,,通过一定的流程优化,,,通过对相关流程进行监管,,,按照数据的质量规则进行数据校验,,,,符合“垃圾进、、、、垃圾出”的数据采集、、、、处理、、、、存储原则,,,,提升数据治理,,,,赋能业务应用。。
二、、数据治理到底在哪里治????
关于数据中台到底应该在中台治理还是应该在后台治理,,,,这个话题在笔者所在的数据圈子中引起了激烈的讨论。。。。群里参与讨论的都是业界的大咖,,,讨论内容也十分精彩,,我截了部分的截图,,先看看大咖们的观点:
数据治理到底应该放在中台,,,还是后台,,我个人的理解是:小数据标准化治理靠人工、、、、大数据预测性分析靠智能,,,,将两者结合起来:“人工+智能”形成了完整的数据治理技术体系。。。一个企业的数据治理既离不开小数据的标准化治理,,也离不开大数据的预测性分析。。。
这里的小数据,,,,是在承载事物实体的数据,,,,例如:人、、、财、、物等,,,是企业所有业务开展的载体。。。。其实说白了就是主数据管理。。对于主数据的治理笔者认为是一个后台行为,,,治理核心是“唯一数据源、、、统一数据标准”,,,而要达到这一目标是需要从数据的源头抓起的,,,并且需要大量的人为干预,,比如:数据标准的制定和落实,,,数据质量的清洗,,,数据的申请审批,,数据的分发和共享等。。。从这里也能够看出小数据的治理,,,追求的是标准化、、、精确化,,应该是一个后台行为。。。
而在大数据时代,,,得益于大数据技术的突破,,,大量的结构化、、、非结构化、、、异构化的数据能够得到储存、、处理、、、计算和分析,,,这一方面提升了我们从海量数据中获取知识和洞见的能力。。对于大数据,,传统的一味追求精确的思维受到了挑战。。。而对于大数据的治理,,,允许一定程度上的容错,,反而可以在宏观层面拥有更好的知识和洞察力。。对于大数据的治理更多的是采用AI技术,,,,例如:知识图谱、、语音识别等,,,对大数据的采集、、、处理、、使用过程加以控制,,使其能够合规使用。。所以,,,,大数据的治理放在中台似乎更为合适。。。。
三、、数据治理到底应该怎么治??
数据到底怎么治,,这确实是一个宽泛的话题,,,首先是要明确治理的内容。。。针对不同的治理内容采取不同的数据治理策略。。。。关于小数据和大数据的治理侧重点上文已经说明。。。。以下为笔者在数据治理领域总结的数据治理十大关键实践:
1、、、成立组织,,育人才
数据治理的根本目标的是提升数据质量,,,控制数据安全和合规使用。。数据治理涉及范围广,,,,参与人员多,,,,需要一定的组织和制度的保障才可能获得成功。。首先,,,依据行业经验来看,,,不论是基于后台的小数据治理,,还是基于中台的大数据治理,,,“一把手”工程是数据治理组织建设的最佳实践。。。。尤其是中台数据治理更是上升至企业战略层面,,,自下而上的治理几乎不太可能成功。。。其次,,,,数据治理组织的建立并是组建一个非临时团队,,而是要能够支撑企业数据化业务的一个完整体系,,,,包括:组织体系、、、管理体系、、、、执行体系、、技术体系等。。。。第三,,,,数据治理组织的人员选拔和人才培养,,,,不同企业应有不同的策略。。。一般来说,,建立数据治理组织从企业内部进行选拔相应的技术专家、、、、业务专家更为合适,,,要比从外部招聘更能够快速上手。。。。不过,,,对于传统企业,,其内部更偏管理,,,,数据治理团队建设更多需要借助外部力量。。
2、、、需求调研,,摸家底
与数据项目一样,,详细需求调研是开展数据治理工作的第一阶段的重要工作。。本阶段主要是理解企业的战略,,并按照从上而下的策略进行开展企业数据管理的现状调研,,摸清楚企业数据资产的分布、、、数据的质量、、、数据的管理现状、、、数据应用需求等情况。。该阶段的工作目标是确定数据治理项目的目标和范围,,评估数据治理成熟度,,,,确定改进内容和方向并与客户达成共识。。。。
3、、梳理数据,,建标准
按照业务主题进行数据资产的梳理,,,并制定数据资产的标准。。。首先,,,,定义数据资产元模型标准,,,,包括:数据资产的数据含义、、、业务规则、、、、质量规则、、、数据来源、、、、存储路径、、管理部门、、、管理人等,,,即数据资产的元数据标准,,,,定义好数据模型是数据治理成功落地的重要前提;其次,,重点对企业的核心数据资产——主数据进行标准化,,,,包括:主数据标准化定义、、、参照字典的标准化、、数据清洗、、数据服务共享等;第三,,,对业务指标的属性的标准化,,,指标的属性分为“业务属性”和“技术属性”两类,,业务属性包含业务人员通常认识的指标分类、、、名称、、、计算公式、、、、展现方式和查询权限等;技术属性包含技术运维人员所关心的系统来源、、、、取数字段、、、、取数频率、、加工规则等,,其核心也是元数据管理。。。。
4、、、、优化流程,,定制度
对于企业而言,,,,数据来源于很多方面,,,内部数据如财务、、、、人力、、、供应链、、生产、、销售等;外部数据如政治、、、经济、、、、社会、、科技、、、行业、、、市场、、、竞争对手等。。虽然数据来源广、、、数据量大是优点,,但如果不加以整理和关联,,,,杂乱无章的数据不仅不利于分析应用,,,,还将带来不必要的人财物的消耗。。。所以,,非常有必要对数据产生、、采集、、、、处理、、、、加工、、、使用等过程进行规范。。。通过统一数据标准,,,,制定合理的数据管理流程和制度,,,规范数据生产供应的过程。。。
5、、、、搭建平台,,接数据
数据治理平台的搭建要根据不同的客户需求搭建不同模块,,,数据治理平台主要涵盖功能模块有:元数据管理、、主数据管理、、数据质量管理、、、、数据标准管理、、、、数据安全管理、、、、数据模型工具、、ETL工具等。。。。数据接入是将各种来源、、各种类型的数据,,,,通过数据集成工具将这些零散的数据整合在一起,,纳入统一的大数据平平台或数据仓库中,,,这一过程需要符合数据治理平台定义各种数据标准、、质量规则、、、安全指标。。。。所以,,,,我们说数据治理项目不是为了治理数据而建设的,,,,而是配合大数据平台、、、、数据仓库、、、数据分析挖掘等项目,,通过提升数据质量、、、、控制数据安全,,,让数据发挥出最大的效益。。。。
6、、、、建立指标,,提质量
提升数据质量是企业数据治理的重要目标,,,也是企业进行数据分析挖掘、、、业务管理和决策的重要基础,,,只有建立完整的数据质量体系,,才能有效提升企业数据整体质量,,从而更好的为业务服务。。。。从技术面上讲,,,定义完整全面的数据质量的评估维度,,包括完整性、、时效性等,,,并按照已定义的维度,,在系统建设的各个阶段都应该根据标准进行数据质量检测和规范,,,,及时进行治理,,,避免事后的清洗工作。。
7、、、、优化模型,,,控安全
数据安全治理,,始于数据资产梳理。。。通过对数据资产的梳理,,,,可以确定敏感数据在系统内部的分布、、、确定敏感数据是如何被访问的、、、确定当前的账号和授权的状况。。。根据企业的数据价值和特征,,,梳理出企业的核心数据资产,,对其分级分类,,通过数据治理工具进行建模,,,定义敏感数据位置、、描述和处理方式,,,保证数据的合规合法使用。。
8、、、、开放服务,,,促应用
数据的治理是为促进数据更好的应用,,,,一切不以应用为目的数据治理都是耍流氓。。通过数据资产目录、、微服务等技术将数据进行开发共享,,,,促进数据在企业中的应用,,,使得数据作为企业的宝贵资产应用于业务、、管理和战略决策中,,发挥数据资产价值。。。。
9、、赋能业务,,,,抓创新
数据赋能是在管理和业务应用中发挥数据更大的价值,,以数据驱动业务的落地。。。。数据赋能核心是,,,①汇聚数据:完善企业内部信息数据化,,采集外部数据;②治理数据:整合数据,,,,清洗、、、、转换、、、分析、、、服务;③应用数据:以数据为驱动将洞察结果应用到实际业务中去,,,,推动企业业务和管理的创新。。
10、、、、持续优化,,再出发
笔者认为企业的数据治理是一个螺旋上升模型,,,需要不断的迭代和优化。。数据治理不能一蹴而就,,,需要建立起长效的持续运营机制,,,,要将数据治理变成企业的一种机制、、一种文化、、、、一种习惯,,而数据治理每一次迭代优化都预示着企业数据战略目标的再出发!!
原创石秀峰 转载自公众号谈数据
- 上一个:数据质量评估维度及方法
- 下一个:数据资产运营能力成熟度模型