导语
可信工业数据空间是在现有信息网络上搭建数据集聚、共享、流通和应用的分布式关键数据基础设施,通过体系化的技术安排确保数据流通协议的确认、履行和维护,解决数据要素提供方、使用方、服务方等主体间的安全与信任问题,进而实现数据驱动的数字化转型。
★可信数据空间★
系列科普
Q1
元数据是什么?
元数据是对信息资源进行描述、解释、定位或使信息资源更易于被检索、利用及管理的结构化信息。元数据也被称作数据的数据(dataaboutdata)或信息的信息(informationaboutinformation)。元数据管理是对数据的组织、数据域以及其关系信息的管理,贯穿整个数据价值流,覆盖从数据产生、汇聚、加工到消费的全生命周期。通过元数据管理,可以提升共享、重新获取数据和理解企业信息资产的水平。
Q2
元数据的作用机理是什么?
元数据管理实现了业务数据中实体和数据字段元素的定义、语义、业务规则和算法以及数据特征,便于完成业务数据的收集、组织和管理。元数据管理技术包括对元数据的采集、元数据的存储以及元数据的管理,如图1所示。
图1 元数据管理技术
元数据采集
在采集数据的时候,面对的大问题就是多种类数据源解析适配,以及数据调度任务的抽象,必须开发对应的工具来实现各种场景的元数据解析,对元数据采集的能力有两方面要求:
数据解析:适配解析各种数据源特点,文件格式,SQL脚本,抽象任务等,完成标准元数据的转换沉淀;
类型识别:十分复杂的一个节点,类型在描述数据的时候至关重要,结构化存储可以直接读取,文件类结构通常需要类型转换标识,任务流程会直接统一管理,依次保证数据在不同环境中的合理存储;
元数据的常见来源如下表:
表1 元数据来源
元数据存储
包括存储元数据以及元模型。元数据包含数据库信息、数据表信息、表的字段信息等元信息,元模型是描述元数据的元数据。这些信息梳理存储在关系型数据库中。
元数据通常分为业务、技术和操作三类:
业务元数据:描述业务领域的相关概念、关系和规则的数据,包括业务术语、信息分类、业务指标、业务规则、资产目录、Owner、数据密集等。
技术元数据:实施人员开发系统时使用的数据,包括模型的表与字段、ETL规则、集成关系等信息。
管理元数据:描述运营管理领域的相关概念,包括人员角色、岗位职责和管理流程、调度评率、访问日志等。
元数据管理
对收集到的元数据进行管理包含如下3个方面:
元模型管理:即基于元数据平台构建符合CWM规范的元数据仓库,实现元模型统一、集中化管理,提供元模型的查询、增加、修改、删除、元数据关系管理、权限设置等功能,支持概念模型、逻辑模型、物理模型的采集和管理,让用户直观地了解已有元模型的分类、统计、使用情况、变更追溯,以及每个元模型的生命周期管理。同时,支持应用开发的模型管理。
元数据审核:主要是审核采集到元数据仓库但还未正式发布到数据资源目录中的元数据。审核过程中支持对数据进行有效性验证并修复一些问题,例如缺乏语义描述、缺少字段、类型错误、编码缺失或不可识别的字符编码等。
元数据维护:对信息对象的基本信息、属性、被依赖关系、依赖关系、组合关系等元数据的新增、修改、删除、查询、发布等操作,支持根据元数据字典创建数据目录,打印目录结构,根据目录发现、查找元数据,查看元数据的内容。元数据维护是最基本的元数据管理功能之一,技术人员和业务人员都会使用这个功能查看元数据的基本信息。
Q3
元数据能解决什么问题
元数据管理作用于数据管理的全生命周期,能够有效促进数据资产的管理、交换、共享和开发利用,其在工业数据空间中可解决如下问题:
促进工业数据共享,元数据管理通过搭建标准统一的工业领域元数据体系,从业务、技术、操作3个方面,进行分类和定义,赋予数据意义,可帮助使业务人员快速获取可信数据。
提高工业数据的整合和溯源能力,元数据管理通过对所有的关键数据进行系统整合和处理,用户可以对数据处理流程追本溯源,了解业务处理规则,数据流通情况等。
激活工业数据活性:通过元数据管理,可以实现暗数据的透明化,增强数据活性,帮助解决工业数据资产盘点的问题。
支持工业数据增值变现:元数据管理通过分析表模型可敏捷响应海量增长的数据分析需求,支持工业数据增值和数据变现。
建立工业数据质量稽核体系,元数据管理通过建立筛选、核实、管理、报警、监控的机制,支撑业务管理规则有效落地,保障数据内容的合格、合规。
审核编辑:刘清
全部0条评论
快来发表一下你的评论吧 !