专家深度解读《主数据管理实践白皮书1.0》

描述

在数据资产管理的领域里,主数据的管理是最为基础的部分,通过构建准确、唯一、权威的数据来源建立企业主数据标准管理体系,是提高企事业单位数据质量和数据资产价值的关键因素。

2018年12月13日,由中国信息通信研究院、中国通信标准化协会主办,TC601大数据技术标准推进委员会承办的“2018数据资产管理大会”在北京国家会议中心隆重召开。《主数据管理实践白皮书1.0》在此次大会正式发布。

为普及主数据和主数据管理的理念,中国信通院云大所联合石化盈科等企业专家共同撰写《主数据管理实践白皮书1.0》,由石化盈科共享创新事业部数据业务分部总经理蔡春久先生、陕西省延长石油集团有限责任公司科技部高级主管甘腊梅女士、中国一重集团有限公司信息中心副主任李学东先生,以及安徽省投资集团控股有限公司信息中心主任杨大寨先生四位专家共同解读了《主数据管理实践白皮书1.0》。

蔡春久,石化盈科共享创新事业部数据业务分部总经理

围绕主数据管理实践白皮书的挑战、两体系一平台、实施要点及案例四个方面进行了详细介绍。

甘腊梅,陕西省延长石油集团有限责任公司科技部高级主管

从流程工业企业角度出发,介绍了延长石油的主数据项目建设的过程。

李学东,中国一重集团有限公司信息中心副主任

作为离散型装备制造业典型企业,围绕中国一重的主数据项目建设经历分享经验。

杨大寨,安徽省投资集团控股有限公司信息中心主任

从自身从业20年经验出发,对主数据项目建设进行了归纳总结和经验分享。

《主数据管理实践白皮书》是国内首个正式发布的主数据管理指导文件,填补了国内在主数据管理领域的空白,能很好的指导企事业单位主数据管理相关工作。

以下为演讲实录

蔡春久:大家好,非常高兴在这个会议上发布主数据白皮书。大约30多位专家、来自20多个国内世界500强和中国500强企业,通过半年时间完成本白皮书编撰。主数据是数据资源、是数据资产的核心,是信息系统互联互通的基石,是信息化和数字化重要的基础,主数据的白皮书最核心的一个词来形容“源于实践”,来自国内近100多个大型集团主数据管理经验总结而来的。

人工智能

主要内容有四个方面,有主数据管理的挑战、两体系一平台、主数据实施的六阶段实施要点,以及来自于实践用于实践的十三个大型集团企业的案例。

人工智能

目前国内主数据最大的挑战来自四方面:第一,我们企业里面的高管领导或者我们的信息化部门不太重视主数据的总体规划,缺乏顶层设计。第二,我们有一部分主数据是来自国家层面的,有行业层面的一些主数据,由于这个在国家的各个部委管理比较分散,导致企业里面很难有非常好的渠道获得这些数据,像我们的行政区域、像我们的银行银联号等等都散落在各个部里面,数据获取困难。第三,我们企业内部已经存在的且分散管理的主数据,由于缺乏统一的标准和数据的关联,导致内部管理比较混乱。第四,一些大型集团企业由于系统众多,建设在不同年代,孤岛比较多,导致后面数据集成比较困难。

人工智能

主数据的重要性在企业的信息化过程中是不言而喻的。第一,做好主数据可以消除数据冗余和孤岛,通过主数据打通各个业务链条,统一数据语言和数据标准,实现数据共享以及数据资产最大化。第二,能够提升数据处理的效率。通过主数据管理实施数据动态自动整理复制减少人工整理数据的时间和工作量。第三,可以提升公司或者企业里面公司的战略协同,保证数据的一致性、完整性。

人工智能

我们总结了一个主数据的定义,这个定义更加接近实践,更容易懂:主数据是满足跨部门、跨业务协同需要的、反映核心业务实体状态属性的组织机构下面的一个基础信息。国外的一些定义非常抽象。这里面我们大概总结了五个特征:一是超越部门,我们所有的职能部门是所有业务过程中最大公约数的基础数据。二是超越流程,因为主数据不依赖于某一个具体业务流程,但是却是主要业务流程都需要的流程。三是超越主题,主数据不依赖于特定业务主题却又服务于所有的业务主题有关的业务实体的核心信息。四是超越系统,主系统管理系统是信息系统建设的基础,应该是相对独立的,像国内很多基础数据都是放在ERP或者放在核心系统里面做的,应该是独立的系统。五是超越技术,主数据为所有的系统提供一个共享的基础数据服务平台,面向微服务架构这种技术架构为所有的信息系统、所有的用户提供一个技术支撑。

人工智能

白皮书里,我们对主数据作了一个分类,分为核心主数据和配置型主数据。其中,企业里面的物料、产品、客户等,这是企业核心业务执行的对象。例如国家行政区域、货币等,这是配置主数据。

人工智能

白皮书里面最核心的内容就是两体系一平台,一个体系就是主数据的标准体系,是我们主数据管理重中之重,包括业务标准以及一些主数据模型标准。第二是保障体系,主要是保障主数据管理,由组织、制度、流程、应用管理、评价五部分组成。一平台指主数据工具,包括主数据建模、数据整合、数据管理、数据服务、基础管理、标准管理等功能。

人工智能

我们通过上百家500强企业项目里面总结出来一套主数据实施方法,首先要做主数据规划。其次是做主数据相关的标准,因为主数据在一个企业里面范围内容很多,第三建代码库,第四搭平台,第五运维体系,第六推广贯标。

人工智能

工作组未来初步计划

(1)适时迭代白皮书

诚邀业内各类贤达学者参与,共同完善国内主数据管理理论和方法论体系,适时推出《主数据管理实践白皮书2.0》,后续重点增加主数据管理水平评价体系和其他相关纵深行业经典案例。

(2)主数据从业人员培训,提升从业人员的技能

针对区域内的主数据管理、应用方面的从业人员开展MDM知识体系培训,并对通过考试人员颁发主数据管理人员证书,提升主数据从业人员的技能,确保主数据项目的建设效果。

(3)开展企业主数据应用评估

通过对于企业MDM应用情况进行评估,可以发现企业主数据管理过程中存在的问题,并且结合其他企业的最佳实践经验,给出针对性的建议。指导主数据管理、应用建设的思路和框架,规范和指导相关工作的开展

(4)推荐最佳实践,建立实地案例基地

依托大数据发展促进委员会、数据中心联盟等平台组织各类活动,推进企业对接、交流,标杆案例实地考察和参观,根据不同行业特征,推荐相关的最佳实践案例,使需求企业了解同业相关的行业经验,推动自身主数据管理、应用主数据管理水平的提升。

人工智能

白皮书里有我们从100个案例当中精心挑选的13个案例,涉及到能源化工行业,交通物流行业、装备制造行业包括军工领域等行业,涉及央企、民企、军工、投资管控等非常有代表性企业集团。

人工智能

本次白皮书是由中国信通院牵头,包括石化盈科这些公司共同完成,涉及20多家单位、30多名专家,在此对他们表示感谢。下面有三位比较典型的案例,一个是流程工业的,一个是离散行业的,还有投资管控型行业的三个案例,将由三位专家介绍。首先是陕西省延长石油集团有限责任公司的甘腊梅介绍案例。

人工智能

甘腊梅:谢谢大家。延长石油是集石油、天然气煤炭开发多种资源发展的大型能源企业。

人工智能

2015年集团公司启动了主数据项目建设,启动的原因一是因为标准不统一,信息系统集成困难,有很多信息孤岛,最重要的原因是为即将实施的ERP系统奠定基础,我们后期组织了30多家单位上百名专家集中现场办公,最终编制了60多万物料编码,为后期ERP成功上线奠定了扎实的基础。我们分别在2016年以及2017年下属单位炼化公司和榆林能化,在主数据平台上建设自己的专业数据标准。

人工智能

通过主数据项目我们一是构建了集团公司主数据标准管理体系,二是编制了集团公司的主数据标准,三是搭建了集团公司的主数据管理平台,四是形成了集团公司主数据标准及运维管理体系,五是编制了集团公司信息系统集成接口规范以及相关制度。延长石油在数据治理这方面还有很长的路要走,所以在此非常希望也非常欢迎各位优秀的企业走进延长,让我们来了解咱们的一些优秀的产品,了解大家的一个成熟的解决方案。所以今后欢迎我们相互的合作,为能源企业的数据治理贡献自己的力量,谢谢大家。

人工智能

李学东:首先给大家简要介绍一下一重,中国一重集团有限公司始建于1954年,目前由中央管理涉及国家安全和国民经济命脉的国有重要骨干企业,专项装备、核电装备、石化装备、新材料、高端装备、现代服务业和新能源装备,是目前公司主要发展的业务板块。

人工智能

人工智能

我们公司属于典型的离散型装备制造业,就是单件小批按订单生产,公司在六年前曾经启动过一次主数据项目,但是由于当时的规划还有相关的落地实施措施有一些不到位,后续的效果不是特别好。公司经过多年的信息化建设,在建成的信息系统在运行的现在有30多个,这些系统都需要进行整体集成和数据分析、数据挖掘。同时原来物料代码存在一些问题,在降低库存等各方面存在一定的问题和障碍。所以一重在2017年6月份的时候启动了主数据项目,采用集中办公的方式,项目启动时公司投入人力各方面的资源都是比较多的,当时集中了50多位专家制定的数据标准,120余人参与数据的清洗工作,这些专家不是一整年都在这个项目组上,是分阶段的,比如数据标准制定阶段需要50多个专家集中在一起办公一个月,剩下清洗三个月到四个月他们在一起。项目成立以后成立10人的运维团队,项目建成后主要是建立了公司的数据标准化体系,包括制度、组织、标准等,形成了七大类30余万条的规范的主数据代码库,与业务系统高度集成,前面说的30多个系统大多数都打通了,为公司十三五信息化规划打下了比较好的基础。

人工智能

我的经验主要是三方面,也是跟第一次实施相关的,通过第一次实施总结出来的。第一在规划方面要做好顶层设计和实施路线图。第二方面要抽调业务骨干进行集中办公,因为主数据建设不是信息化一个部门的事,需要多个部门来协调配合,而且需要他们抽调专业的骨干力量做这个事,同时各业务系统要同步改造才能把相关的主数据的成果应用好。第三方面就是在运维方面,系统建成以后要建立专业的运营团队,我们公司后续建立了一个10人的运维团队,就是把住主数据入口这一关,把住标准才能保证后续的主数据质量。谢谢大家。

人工智能

杨大寨:大家上午好,非常高兴和大家在这个平台上就数据治理方面的问题进行探索,我是来自安徽省投资集团控股有限公司信息中心的,安徽省投资集团控股有限公司是安徽省省委省政府最大的承接省委省政府投资的一个平台,它的业务范围非常广,我们涉及到金融、产业、基建,所以所有的数据的内容你们都可以见到。

人工智能

我是2016年来到安徽省投资集团控股有限公司来搞信息化工作,我觉得像这样的一个集团里面搞信息化工作难度是很大的,所以我就在做集团的建设的过程中进行体系化地来建设信息化的框架。首先就是标准体系的建设,其次是技术体系等等体系,但是告诉大家,最难做的是标准体系。我自98年进入IT行业的,在IT行业干了20年,可以告诉大家,这20年内我没有成功做过一个体系,虽然我一次次站在这样的讲台上,但是我可以告诉大家,我一次没有成功过,可能一个系统做成功了,但是确实没有做好一个标准体系。所以我来到安徽省投资集团控股有限公司以后,我有一个梦想就是一定要把它的标准化体系要做好。

人工智能

我们面临着什么样的一些问题呢?我总结下来,第一就是两张皮,大家都知道做标准很重要,但是不知道标准该怎么做。

第二夹生饭,为什么是夹生饭?因为做标准化通过这两年的实践,包括我20年信息化的实践告诉我们,信息化和标准化的建设必须高度吻合起来,正是因为我们做很多标准化的东西脱离了企业的一些实际,脱离了很多信息化建设的实践,所以很多东西做成了夹生饭,因为什么时候做标准、什么时候把它发布出来、什么时候起作用绝对有讲究,做得早系统起不了作用,做得迟系统起来了标准滞后,里面绝对有一个衔接的问题。

第三靠边站做标准是要花很多的时间,是一年、两年、三年一个长期持续的过程,但是没有任何一个管理者、我们的高层能够容忍你去做打基础的工作看不到效益,这个问题是非常严重的,所以很多人做标准的过程中是忍耐不了,管理层总是在催促你,你在打基础人家看不到东西,基础的东西是基础性东西,没有看到系统,办公没有方便,我没有看到业务数据,都没有看到,这怎么解决?所以很多东西标准最后没有办法只好去建系统,建完系统再搞标准已经来不及了。

人工智能

这些问题都是我20年内碰到的严重的问题,通过两年的实践我们建设了一个比较完整的一套系统,而且起到了作用,也使我自己的职业生涯的最后一站了,也比较完美的快要收官了。投资集团的一个做法,第一个就是数据化一定要与信息化的规划相结合,为什么要有一个标准化的结合,2016年我做了整个信息化的战略规划,为什么要做呢?我告诉管理层,这个标准是要持续五年的,不是一年就能完成的,所以我的标准是从2016年开始做一直做到2020年,一直往后面去做,为什么做呢?我要告诉管理层,而且我要成为我集团里面战略规划的一部分,让大家有这个思想准备。这是第一。

第二,数据的标准化一定要与系统的集成建设相结合,就是什么时候做标准,什么时候做,跟你的系统建设怎么衔接,做到什么程度,做到什么范围是一定有讲究的,这是第二。

第三,数据的标准化要与元数据的规范相结合,今天很多领导和专家都讲到了主数据元数据小数据,我们现在做的主数据就是和元数据结合起来的,因为只有元数据才能够很规范地把数据描述清楚,很规范地把主数据这套标准用到系统的建设和系统的开发中去。

第四数据的标准化要与主数据平台的建设结合起来,很多数据标准的东西束之高阁,但是通过数据标准化的平台管理这个系统,主数据管理平台就是管你所有系统建设的一个枢纽。

人工智能

我们投资集团的整体的系统的框架,这里面所有的系统都是一个很孤立的系统,代表了我们的一项职能,有基建、金融、产业数据量非常复杂,2016年整体是把所有的系统打包到我的平台里面去,打包在平台里面去我是通过信息资源的标准体系和其他的支撑体系把系统揉到一起了,具体怎么做呢?我现在所有做的标准是跟我所有的这些支撑体系是做到一块儿的,如果单独做一点用都没有,所以我的数据的标准和我统一流程的管理、统一用户的管理、统一数据的管理,这几个支撑层是完全融合在一块儿做的,所以我所有的这些系统之间都是一个完整的流程在管理。所有的用户体系是靠统一的用户管理中心去授权的,我没有第二个流程管理中心,大家注意,所以你们在做信息化系统的时候一定要做流程,但是我只有一个流程管理中心,而且我只有一个用户管理中心,在流程运转的过程中,把管理流程放到我的流程中去运转,运转过以后我通过统一用户授权给授权,在每个阶段授权。我的标准在哪里做?我就在每一个节点的过程中去做这个标准,让它的每一个系统很好地衔接起来,最后产生一个非常准确的、一致的、可以用的数据,这样就把这个系统的标准和我整个的系统融合起来了,所以我们觉得统一流程加上统一用户再加上统一数据,再加上我的标准化体系才能够把标准做好,才真正地能够把数据管理好。所以刚才很多的专家谈到了,我也非常赞同他们,看到上面都是大数据什么东西,底下是一堆垃圾。就是因为没有掌握一定的逻辑,怎么去建?怎么去搞?怎么起作用?所以这个也是我们探索的一条路。

监控中心也是对企业的数据进行监控的。这个就是刚才我讲的跟系统的建设跟规划相结合起来,另外我们建了一个数据的标准化管理平台,大家可以看看所有的标准我全部建在我这个平台上,以后所有的标准都是从我这个平台里面去引用,怎么样通过标准化平台去管理所有的这些系统的数据。就实现了信息标准化、标准信息化,而不会把标准放在那里束之高阁。

最后的成果是我们形成了一套企业主数据标准体系的框架,因为时间原因我不跟大家详细说了。第二我们形成了投资型企业的核心数据。第三我们形成了元数据和数据交换的标准,大家注意我前面讲的这些主数据的东西,因为时间的原因我们以后可以跟大家再探讨,我们所有的主数据全部是用元数据进行描述的。第四,搭建了集中统一的主数据管理平台,通过两年的实践我们发现确实是有效的,也给我的职业生涯最后一站带来了一定的欣慰。我的发言就到这里,谢谢大家。

人工智能

大数据资产管理-从传统到智能

随着信息技术的飞速发展,各领域的数据量都在爆发式增长。大数据的开发利用正在如火如荼的进行中,涌现出许多优秀的技术和激动人心的案例。大数据蕴含着大价值,这一事实已经得到社会各界的广泛认知。可以说,数据是社会的一项宝贵财富,是企业的一种优质资产。然而,大数据作为一项资产,就需要采用科学的管理方法进行管理,否则将会影响资产的价值。目前业界对于大数据资产管理的研究和实践相对来说还处于初级的阶段,还是面临着诸多挑战。

为进一步促进数据资产价值相关问题的研究交流,2018年12月13日,由中国信息通信研究院、中国通信标准化协会主办,TC601大数据技术标准推进委员会承办的“2018数据资产管理大会”在京召开。来自华为企业BG企业技术服务部大数据服务总监陈飚进行了题目为《大数据资产管理-从传统到智能》的演讲。

陈飚

他结合华为企业自身数据资产治理实际,分享华为数据资产管理解决方案相关经验,强调“平台+生态”,合作共赢,打造数据新生态。

以下为演讲实录

大家好,我是来自华为企业BG技术服务部的陈飚,负责华为全球政府和企业客户大数据相关的专业服务,包括咨询、规划和落地实施等相关工作。今天我在这里跟大家分享一下我们在做大数据资产管理上的一些体会。我从以下几方面给大家做一个汇报。

人工智能

第一是挑战。随着科技的发展,我们经历过计算机时代、互联网时代,现在号称进入了数据时代、智能时代。但是我们现在是真正进入到数据时代了吗?其实我们现在只是用上了数据,但是我们离真正进入数据智能时代还差很远。一般认为,未来数据加上AI会给所有的企业插上翅膀,未来所有的企业将是数据企业和智能企业,大数据驱动创新是每个企业的必经之路。数据加上智能将成为和计算机、互联网一样所必需的、基本的一个基础设施,而数据资产也会变成企业的核心的竞争力之一、核心资产之一。

但是,在我们数据管理已经走过几十年、大数据被提出十年之后的今天,采用大数据获得成功的案例有多少呢?Gartner的分析师在2015年曾经预测,未来60%的大数据项目会失败,到了2017、2018年我们发现这个数据太乐观了,85%的项目没有达到预期的产出。

我们遇到的问题不单单是我们想到的产品方面的问题、技术方面的问题,更多的是什么问题?更多的是与现有系统的对接困难,政策的阻力、管理的难度、技能的不足、安全风险等一系列的问题。这些问题导致项目遇到非常大的挑战。但是即使遇到这么多的挑战,有90%以上的企业还是决定以后加大在数据和AI上面的投入。

IDC统计显示,我们现在投入生产的AI项目里面,96%的项目遭遇到的问题不是AI的技术问题,而是AI的数据问题,为什么这么说呢?因为传统企业的数据都是来自于各个系统,缺乏统一的标准,相互之间的关联不起来,数据质量较差。

我们现在用的技术和工具,都不能很好地支持数据的管理,怎么办?现在来看,我们觉得真正用好大数据,比选择一个好用的大数据平台或者好用的大数据技术远远有更大的价值。做这件事情之前,我们回想一下为什么要做大数据,我们怎么用好大数据?在整个生命周期里面,我们以前只是在最初的一段,并没有用到大数据的全生命周期,全生命周期每一个阶段的目标和挑战是什么?这需要我们在方法论上的有所提高。

以前很多企业都认为数据资产管理只是数据信息化系统中间的一个软件的功能,另外有一些企业认为数据资产管理是一个技术,只需要搭一个数据管理的平台,在上面做一些开发,这样就已经做好了数据资产管理。其实经过我们的实施,发现这样的观念是不正确的。我们需要在大数据生命周期之间加入管理的环节,更重要的是在前面加入了规划环节,在最后加入使用环节。所以我们提出来五阶段的服务解决方案,这是我们第二个看法,数据资产管理不是一个软件功能,一定是一个服务的体系,要通过人、流程和制度来做。

人工智能

我们的解决方案主要包括的谋、聚、管、算、用,第一个是大数据的咨询,也就是大数据的规划,我们通过高级的具有前瞻性的一些顾问,做一个三年、五年甚至更长远的战略规划以及近期的落地计划。比如我们现在去做理财,我们首先做的是风险的评估,到底我们能不能承受这样理财的方式。现在我们管理数据资产,核心要回答两个问题,尤其在高层我们要统一两个认识,这也是刚才尚总提到的要得到高层的支持,怎么支持呢?首先我们要得到两个认同:第一,对于数据风险上面的认同,也就是说我们对风险的认识。到底这个数据的质量是不是有问题,数据出错以后如何感知,对于数据的要求是非常高还是一般高还是觉得不重要的,这个决定了我们的战略决策。第二个核心是什么?就要管理我们对数据的期望,认为我们整个数据工程达到什么样的目标,这个一定要不停地管理而且是持续的管理,才能保证后面项目的成功。

第二部分就是做大数据工程,就是聚,一个是计算资源的聚,另外一个是数据的聚。我们通过建设节约型的数据和计算中心,把来自不同系统的数据资源和计算资源进行合并,打造一个平台。在这里面我们做一个海量数据的存储。同时也在做一个海量数据碰撞机。这里面我们需要更多的是数据平台的建筑者,就是各种IT技术工程师。

在建好了平台之后,第三步,在数据进来以后,就要管理起来。这里的管就是数据管理。这是传统意义上或者狭义上数据管理或者数据资产管理的部分,在这里面我们要定标准、立规矩、明制度、行指令,保证我们的数据在是可用的,中间的计算是可靠的,最后它的结果也是可信的。

管理好了的数据就变成我们的资源,我们可以像炼油厂一样进行深化加工,挖掘数据的价值,有了价值的数据就成为资产,所以我们通过大数据分析把数据进行资产化,把数据的价值进行提高,让数据产生新的价值,让“废”的数据变成高价值的数据。这里面我们需要的是传统的数据科学家。这个阶段是“算”。

最后一个是用,是使用大数据的意思,但是这个用比我们想象的难度要大。首先我们要把刚才经过净化的数据让大家能够利用到,这也要求数据的质量要高。第二,算出来的数据也要让大家能够使用。就是我们的经验能够被复用。模型和算法能够所公开,能够在同业之间共享,能够进行迭代和积累。最后一个用就是让我们的合作伙伴愿意来使用,这是我们最重要的一点,我们很多的项目到最后,我们实施得很好,我们觉得我们搭了非常高质量的平台,但是最后我们得不到客户的认同,得不到业务方的认同,为什么?就是因为我们缺少了我们的合作伙伴,我们缺少了应用,没有形成百花齐放的局面。最后我们期望驱动数据的资产化、驱动数据的服务化,以数据开放驱动应用创新,跟我们的合作伙伴一起建造一个众创众包的数据生态,这是我们完整的包括大数据五个阶段的解决方案。

人工智能

怎么样做到这一点?我们在技术上选择做四个方面,数据管理是目标,同时也就是在做企业的数字化转型。数字化转型的核心无非就是用现有的科学技术,来感知现有的世界,并且真实记录我们过往的世界,形成数据。然后利用人的智慧和经验,就是算法。计算出来新的价值,并且把这个价值固化和传递,这就是我们的应用。如果能够智能、和谐地管理好这四个因素,这就成为企业数据资产变现、企业数字化转型的一个新的增长动力。

数据资产的核心分为这四个方面,我们要用人的智慧感知并且改变客观世界,需要发展四个核心能力。第一个能力就是大数据规划设计能力,这是大数据资产管理的可靠性保障。现在我们每年的数据和应用的增长超过15%,按照这个增长,平均三到五年系统的架构都要进行翻天覆地的改变。如果没有一个前瞻性的设计,三到五年我们就要做一次系统的大规模改造,就要做一次业务和数据的搬迁。不断的推到重来是积累不出来一个宏大的大数据体系的。所以我们一定要在刚开始的时候在平台层面做出一个有前瞻性的部署。而不是像打补丁一样,或者像修好了再搭马路一样。这些都是以往项目里面沉痛的教训。我们看到很多例子,很多企业有买大数据产品甚至数据库的产品,拿上来就能实施,但是用了一两年,换了一两个厂家以后发现达不到相应的目标。这是为什么?可能是就是前面的设计和规划出了问题。

第二是大数据治理能力。大数据治理是正确性的保障,保障数据资产是对的,算出来的数字是对的,在这里面做一些可信可靠的保障。那么大数据治理和传统数据治理、传统资源管理又有哪些不同?后面我们会通过案例详细来讲。

治理好的数据可以用来做大数据的分析建模,这是我们第三个核心的能力。大数据的分析我们认为是竞争性保障。不同的企业,不同的部门通过同样的数据产生完全不同的价值。我们需要有技术理念和有一定专业领域知识的人通过他们的经验把我们的资产变成高价值的资产,这就是我们大数据分析建模的一个核心理念。

最后是大数据的应用支持能力。为什么叫应用支持能力?因为我们认为这是一个赋能的过程,是大数据整个战略的可持续性保障。未来我们期望不是由一个单独的部门来开发,而是说数据的全民化,所有的部门都能够用到数据的支持,能够利用数据的技术达到自己想要达到的价值。这就是需要对客户进行赋能。以后还有专门帮别人打字的行业,现在打字已经变成非常基础的能力。十年以后数据的技术、AI的技术也会全民化,每一个人都会懂,甚至每个人都会用一些语言做一些力所能及的操作,能够挖掘出来一些价值。这就是我们觉得大数据分析能够为客户赋能,能够做到自主可控、自主发展这样一个目标。这是在技术方面的内容。

人工智能

接下来我们说生态。大家知道华为是坚决地要做生态的。在数据资产管理上面怎么做呢?华为在下面做一些平台,在上面有深度理解行业趋势和客户需求的合作伙伴。通过他们来做完整的方案。这就是“平台+生态”的战略。通过合作打造数据新秩序、数据新社会,有了新秩序和新社会,数据资产才有生存空间,未来才会有一个大舞台。我们在全球有超过200个在大数据层面的合作伙伴,包括在座的有很多厂商也是我们的合作伙伴。我们有各种渠道的厂商,已经有超过500个大数据和数字转型的成功案例。这是我们在生态上面的想法,一定要坚持“平台+生态”的概念。

人工智能

另外,我们还有一个观点是一定要找到场景。我们认为找到合适的场景才是资产变现的基础。数据不是收藏品,有价值的数据才是资产,没有价值的数据只是一种累赘。不同的数据在不同的人通过不同的处理方式在不同的场景下面做出不同的应用,产生的价值是不一样的,就决定了它是资产或者是累赘。所以我们做数据资产的管理一定要把数据资产管理纳入到长期化方案当中,数据资产管理的目标就是要把数据变为生产力。

举个例子,我们做数据驱动设计,数据驱动开发、数据驱动重构,通过数据看到运维上面的不足,看到架构上面的不足,从而为我们的客户每年节省到上千万元。那么给他们提供决策的数据值多少钱呢?这就产生了价值。

在业务方面,通过数据关联分析,我们甚至能够做到以前做不了的事情。举个例子,公安以前靠抓人都是靠人力,看图片和推断等都是靠人工。现在虽然有了人工智能,但其实很多时候很多事情还是要靠人来做的。有一个说法就是有了多少的人工我们才能够输出多少的智能。在这件事情上,我们用哪些数据在哪些方面能够产生它最高的价值?这是数据资产管理非常重要的一点,找到了这个点我们才能够把数据进行资产化。

再举一个例子,以前数据在政府里面的状态是不可知、不可取、不可控、不可联,通过华为大数据治理服务做了四个统一:统一规划、统一管理、统一标准、统一共享。让数据能够相互联通,这样数据从就变成了一个资产。

关于大数据资产管理与数据资产管理、传统的数据治理不一样的地方,我和大家分享两点。第一,数据的资产是和我们的场景相关,尤其是和大数据场景相关。举个例子,我们在这个项目里面有上百个委办局,里面还有各自的系统,每个系统里面都有一份数据,这些系统跑了很多年,里面的数据和业务的结合得非常好,支撑了业务的决策,所以每一个数据非常有用、非常重要。但是收集在一起以后发现数据之间有冲突、有些数据和另外的数据都对应不上,我宁愿不要这份数据可能还能够工作得更好。就好像我们有了很多个钟表反而不知道时间一样,这个时候数据变成了累赘。所以数据的资产是和我们的场景相关,尤其是和大数据场景相关。

第二,大数据的治理和传统的数据治理也不一样。在这个项目里面我们传统的厂商已经做了好几年的努力,为什么最后需要我们重新做呢?我们反思了这个问题,其实因为原本的数据治理体系对应传统的数仓架构和传统的企业组织,但现在要做几百个内外松耦合系统而非内部系统的数据治理的时候就遇到问题了。举个例子,我们经常说在数据领域一颗螺丝会打坏一锅汤,那么在大数据领域基本上找不到好汤了,我们不能保证数据是干净的。在这里面我们做了很多的努力,也积累了很多的经验,以后可以跟大家再做分享。这里我们想表达的是,大数据资产管理和传统的资产管理差别很大。

最后分享一下华为大数据专业服务,这是基于华为全球大型项目的迭代经验,总结出六阶段的方法论。基于这个我们开发出来18个服务产品,其中包括下面的工程、分析到最后的共享开放等等。前面的规划到后面的运维,运筹帷幄到决胜千里一整套的服务。我们需要和广大的合作伙伴共同构建这样的生态,我们希望未来在华为大平台的基础上,大家共同来参与打造数据的新社会,数据资产的新秩序,共同推动数据资产管理整体往前发展,这是我个人的想法,就分享到这里,谢谢大家。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分