2.3 数据类型、构成及特性
电力大数据主要包括结构化数据、半结构化数据和非结构化数据。
结构化数据是指存储在数据库里,可以用二维表结构来逻辑表达实现的数据。如关系型数据库、面向对象数据库中的数据。结构化数据实体以发电设备、输电设备、变电设备等各类信息为中心,继承于设备实体,包含了资源标识、设备名称运行单位等各类结构化信息。
半结构化数据是指就是介于完全结构化数据和非结构化的数据之间的数据,例如HTML文档就属于半结构化数据。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。
非结构化数据是指无法用数字或统一的结构表示,包括所有格式的办公文档、文本、图片、XML、各类报表、图像和音频/视频信息等等。非结构化数据是与设备相关的一些非结构化数据实体或属性,如设备的操作手册、采购合同附件以及发票等信息,非结构化数据实体继承于文档,且于设备相关联。
实时数据是指与设备相关的一些测点信息,以及描述设备运行状态的一些曲线,如测量点、电量曲线、电网频率曲线,这些新与位置等空间数据和设备相关。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !