知识图谱的类别有哪些 数据存储的方式有哪些

今日头条

1142人已加入

描述

上期的公众号小编带着大家了解了什么是图数据库以及图数据库应用的十大领域。本期文章小编和大家分享下:

一、当前数据面临的趋势与挑战

二、知识图谱的类别有哪些

三、数据存储的方式有哪些

四、采用图数据平台可以带来哪些好处

五、如何借助图技术,创新零售业发展

当前数据面临的趋势与挑战

数据孤立

当前有些数据相互孤立。数据存储和应用通常为单个部门提供服务。如人力资源部门使用一个平台,而销售部门则可能会使用另一个平台。

数据扩张与数据湖

在深度学习的大背景下,大多数数据都有数据湖、数据仓库、关系型数据库,作为记录系统、客户数据、交易数据、产品数据和订单数据等基础。这种数据分散状态将导致数据扩张。

其中数据湖可存储大量结构化、半结构化和非结构化数据,且成本较低,因此备受欢迎。

从成本来看,数据湖具有很大的吸引力,在存储任何类型的数据时起着重要作用,包括应用和服务生成的日志文件。将数据存入数据湖的操作既简单又方便。然而,管理并了解这些数据则困难重重。

云存储

云计算具有颠覆性意义,但仍面临管理挑战,这主要归结于更多数据存储在更多系统中。个人云数据有可能存储在 iCloud、Google Drive、Dropbox、Evernote、Gmail 和 Notes 中。 

这时就需要处理大量数据,这些数据不仅格式不同,且部分数据是重复的,而且大多数数据都没有相互关联性。

历史数据将会被遗忘

历史数据为机器学习预测提供动力。随着新冠疫情的爆发引起经济动荡,导致历史数据过时。如历史数据通常被用来预测购买行为。但由于疫情期间的封控状态,网购成为市场主导购物方式,购买行为几乎在一夜之间发生了变化。由于消费者行为发生翻天覆地的变化,因此历史数据无法对购买行为做出准确的预测。

在数据有限的情况下,数据关联的重要性和价值日益凸显。将数据存入图数据平台可捕获数据关联和数据关系。当然历史数据是有价值的,但存储数据和数据之间已存在的关系可以提高预测能力,即使在没有相关历史数据的情况下也是如此。

这是因为数据关联和关系是数据中最具预测性的元素。以上所有因素都在推动企业向关联图数据平台中的数据转型,从而获取知识。

知识图谱类别

知识图谱就像知识本身一样,涉及方方面面,信息广泛。一般来说,知识图谱分为两类:行动型知识图谱和决策型知识图谱。

行动型知识图谱

数据管理是知识图谱的一个重要用例。很多知名企业使用知识图谱创建元数据中心,并以此捕获数据沿袭:数据源、转换方式以及清理方式。知识图谱针对复杂的数据传输管道进行建模,以便轻松识别数据的消费者和生产者, 并集成新的数据源。

借助数据源的相关强大基础,企业可以针对采集到的数据采取行动,准确了解数据源、数据生产者和消费者。

除了数据管理之外,行动型知识图谱还用于个性化推荐。行动型知识图谱将客户和产品等所有相关数据汇总到一个 360 度视图中,从而推动采取大量行动,如识别有流失风险的客户以及提供可说服客户留下来的有效建议。

用于数据分析的决策型知识图谱

知识图谱构成现代数据和分析的基础。凭借知识图谱捕获的数据,可以捕获及存储数据中固有的所有关系,无需猜测数据相关性。这样一来,知识图谱就代表对数据更忠实的表述,并使得企业能够解锁其预测能力。

借助决策型知识图谱,最终目标是做出更好的决策,无论该决策是来自人的决策还是算法决策。这些决策可以通过以下方式获得支持。

图查询

可批量回答有关知识图谱的任何问题。Boston Scientific 使用高级查询分析根本原因,并确定导致缺陷的故障组件组合(这是一种反向推荐)。

图算法

可识别数据中的模式,如两点之间的最短路径或最有影响力的客户。

OrbitMI 使用决策型知识图谱来执行复杂的集装箱船运航线规划。通过寻路算法,他们在不到一秒的时间内就规划出了海上航线。此外,他们的知识图谱还可支持 SaaS 分析产品。知识图谱不仅会产生经济效能,而且还能带来高效的复杂线路规划,并减少6万吨碳排放。

图查询图算法还可以解锁机器学习的预测功能。阿斯利康在其知识图谱中使用图算法和机器学习来识别患者病历原型和模式。这项研究使该公司能够为早期干预确定强有力的触点,从而改善肾脏等方面疾病的治疗效果。

数据存储方式有哪些?

众所周知,数据具有 “潜在” 价值,一些公司能够相较于其他公司从数据中提取更多的价值。要将数据高效地转化为信息、知识和价值,需要考虑很多驱动因素,如数据驱动的领导方式、 公司员工掌握的知识和技能、业务流程以及组织文化。但在从数据到洞见的过程中,另一个重要驱动因素是数据存储技术。从数据中提取价值的过程取决于存储方式、访问的难易程度,以及数据与组织内其他相关数据、信息和知识场景的相关程度。

数据库管理系统具有以下三种常见类型:

关系数据库管理系统

将数据存储在表格中。当数据之间的关系稳定并且可以在顶层表格定义中捕获时,常常会使用这种类型。关系数据库可以快速处理大量记录,使用的存储空间往往较少。但在处理场景可能随时间变化的动态数据时,灵活性略显不足。

非关系数据库管理系统

提供多种非表格形式的替代方法来组织、管理、存储和检索数据。传统上,非关系数据库管理系统针对特定数据类型进行优化,通常是旧式系统,难以处理更新、更动态的工作负载。

动态数据管理系统

比 RDBMS 更敏捷和高效,更广受关注,随着其不断发展成熟并克服潜在问题,2016-2019 的 CAGR 增长率达到 83.2%。图数据库就是一种动态数据库管理系统。随着图驱动分析和人工智能工具的需求不断增加,对图数据库和图数据库平台的需求也在增加。

图数据平台带来哪些好处?

揭示隐藏结构

图可以揭示数据中的隐藏结构,其中数据是未知的,不需要广泛的数据存储,也不需要有关数据组织方式的大量先验知识。

提高效率

在某些情况下,图数据库管理系统可以比传统 RDBMS 更快、更有效, 因为它们能够快速分析模式和关系。图数据库也简化了提取-执行周期, 可以更快地执行查询。

功能广泛

图可以应用于各种问题和应用。其中包括: 

发现人、地点或事物之间的关系模式 

映射或绘制事物位置之间的结构空间关系 

从人类语言捕捉语义结构以便系统地理解内容基于谱系、基于空间和基于执法/情报服务的“已知关联”分析

药理学研究、流行病学和效用网络分析

利用人工智能

图很可能在未来的人工智能中发挥关键作用。由于复杂系统中的行动和后果通常会导致数据关系模式发生变化,因此图数据库正在帮助推动机器学习和其他 AI 相关操作实现创新。

企业了解将数据转化为组织中的信息、知识和商业价值的核心途径。确定图数据库和平台如何帮助企业应对挑战数据库在促进组织将数据转换为信息、知识和商业价值方面发挥着重要作用。了解图带来的优势,利用这些优势来提高组织的学习能力。

蓝海大脑图数据一体机具有精简的高可用集群架构。软硬一体,高度集成。开箱即用。优于目前的集中式存储架构X3,高于集中式存储架构X5。专业的运维平台,深度监控管理一体机系统。分布式存储,高可靠性,全架构冗余设计,避免任意单点故障,以及跨节点数据保护等,更好地为各行各业服务。

零售业借图技术飞速创新

当今社会,零售商面临着许多复杂的全新挑战。由于开销小且销量高,亚马逊等线上巨头以较低成本快速配送产品,这导致规模较小的零售商接连倒闭。

想要站稳脚跟,零售商必须足够灵活,既要面对巨大的线上竞争,还要应对零售业的另一个新现状:客户现在处于价值链的中心。为了适应这些现状,零售商必须实时控制库存、支付和配送系统。然而,对于受传统基础设施拖累的传统零售商来说,实时响应十分困难。

为了重新设计从线性到环形的高度关联价值链,零售商需要迅速且低成本地对其基础设施进行现代化改造。此外,基于互联网的线上的零售商必须找到一种方法来处理规模和复杂性,以保持竞争优势。

下面我们一起了解下线下零售商如何利用图数据平台技术的强大功能来应对这些迫在眉睫的挑战。

个性化产品和促销推荐

向线上顾客提供实时推荐可实现收入最大化,既能改善客户体验,又能增加销量。然而,顾客想要的是经过精心设计的推荐,而不是一成不变或盲目的推荐。为了提升效果,推荐必须根据消费者的偏好、购物记录、兴趣和需求个性化。

实时推荐需要关联大量复杂的买家和产品数据(以及常规关联的数据),以了解客户需求和产品趋势。这无法通过关系型数据库技术来实现,因为SQL查询将会非常复杂,且实时提供推荐耗时过长。Hadoop 和 Spark 等大数据处理技术也面临着同样的问题,这些技术在电子邮件推荐等方面效果很好,每天发送一次推荐,但不是实时提供。

经过设计,图数据平台可快速查询客户的购买记录,并立即捕获其当前在线访问中显示的任何新兴趣,这两项都是提供实时推荐的关键。由于关系被视为图数据平台中的第一级实体,零售商可将客户的浏览记录与购买记录以及线下产品和品牌关联起来。这样一来,实时推荐算法就能够利用客户过去和现在的选择来提供个性化推荐。无需提前在线下进行计算,由此可以很好的解决延迟问题。

由客户 360 提供支持的个性化体验

零售商可以根据客户的愿望、兴趣和需求提供相关内容,从而个性化在线客户体验。这样不仅可以提高客户参与度,还能提高收入和客户忠诚度。例如,通过在产品描述旁边提供相关的博客文章,零售商可以将自己刻画成使用特定产品方面的专家。这样一来,客户认为自己从可靠来源获得有价值的信息,因此增加访问和购买。 

零售商还可以使用路径分析来帮助改善成效,包括分析导致购买的客户行为,并使用这些数据吸引客户走上更有利于盈利的道路。这可能需要调整内容,或者更改未来的客户点击链接后前往的目标位置。

零售商还可以识别由一组客户共享的维度,并根据这些属性对其进行分群处理。例如,可以围绕有或没有孩子这一属性对客户进行分群处理,也可根据职业和岗位进行分群处理,例如职业生涯早期的工程师与经验丰富的营销副总裁。不同维度的消费者有不同的职责和收入,因此购买习惯也不同。零售商可以使用这些信息为每个客户提供个性化内容。

零售商拥有大量数据,可以用来确定为客户提供服务的最佳路径和内容。这些数据包括与产品、市场、社交媒体、主数据、数字资产等相关的数据。然而,这些数据通常存储在信息孤岛中,导致整合并识别向客户提供相关内容的机会愈加困难。 

如需将所有数据源合并到一个个性化引擎中,关系型数据库将无法实时进行复杂的推荐计算。企业可以将数据移至 Hadoop 或数据仓库中,以便提前为每个客户计算推荐,但这些推荐通常会稍微有些过时。此外,如果在任意一天中只有少量客户访问网站,每天为整个客户群提前计算推荐则会降低效率。

图数据平台不是将所有客户数据集中到一个系统中,而是把数据留在原地,并添加图分析。可以为每个客户提供一个部门标识符,然后将其与主客户标识符绑定。每个部门或业务线的标识符由各个标识符组成,从而为每个客户生成一个双重叠加图。这使零售商能够更全面地了解客户关系,并在客户与公司进行交互时随时快速导航回原始系统。

利用图技术优化电商配送服务路线

亚马逊已经设定发货和配送标准。由于亚马逊 Prime 会员可享受两天免费配送,使得电商购物者都不愿等待两天以上才能收到网购商品。因此,零售商必须达到或超过这一标准,否则就有可能将顾客拱手让给亚马逊。

为了缩短配送时间,零售商必须了解店面和配送中心的库存以及运输网络。例如,需要了解路线问题是否会导致从离客户较近的配送中心发出的产品延迟送达,或者产品缺货是否会导致产品无法按指定配送日期送达。确定最快的配送路线需要支持大量复杂的路线查询,并具备快速一致的性能。

由于数据具有高度关联的特点,电商配送服务路线与图数据平台好比“天作之合”。这不仅是因为数据点之间需要大量“跃点”,而且可以有许多不同的路径以及任意数量的排列。即使在一个订单中,这些排列也可能进行优化,并成为一年中不同时间里针对不同产品的最佳路径。图数据平台可将这些不同因素考虑在内,并支持复杂的路线查询,以简化配送服务。

供应链可视性

供应链既庞大又复杂。产品通常由不同的原料或部件组成,这些部件在不同的供应商之间流通,其中每一个部件都可能由子部件组成,而子部件可能来自其他子部件和世界各地的其他供应商。由于这种复杂性,零售商往往只知道他们的直接供应商,这可能导致风险和合规方面的问题。

零售商需要公开透明地了解整个供应链,以检测欺诈、污染、高风险地点和未知产品来源。例如,如果特定原材料以某种方式受到损害,公司必须能够迅速识别每个受影响的产品。这需要在没有延迟或其他性能问题的情况下管理和搜索大量数据。透明度对于识别供应链中的薄弱环节或其他单一故障点也很重要。例如,以前一个零件或配料可从三个供应商处获得,但现在只能从一个供应商处获得,那么零售商就要了解这可能会对未来产量造成的影响。

要实现整个供应链的可视性,需要建立深层关联。关系型数据库不是用来处理大量递归查询或关联的,因此性能会受到影响。然而,图数据平台是专门针对搜索和分析关联数据而设计的。图数据平台的架构首先是围绕数据关系构建的,这使零售商和制造商能够在不出现性能问题的前提下管理搜索大量数据,并实现他们所需的供应链可视性。

借助图技术提升营收管理

对于消费者来说,货比三家从未像今天这样容易。几分钟内,消费者就可以在十几家店铺之间对比特定产品的价格,而且整个过程可以轻松方便地完成。他们甚至可以在不同零售商的实体店购物时比较价格,并从竞争对手那里购买商品。为了打价格战并优化盈利能力,零售商需要实时提供具有竞争优势的价格。 

有竞争优势的定价基于库存、地点、季节、消费者需求等各种因素,这些因素非常不稳定,变化很快。例如,如果一家酒店打算根据篮球锦标赛定价,且这场锦标赛共有七场比赛,那么那些举办比赛的城市的库存将减少,并进行相应定价。但如果锦标赛在五场比赛后结束,那么原本最后两场比赛的库存将会增加,且价格也应适当调整。

此外,每个零售网点可能会根据市场情况制定不同的价格。零售商对其微观市场的了解越多,并优化产品定价以匹配库存,适当提高利润率和销量的方法也就越多。然而,关系型数据库跟不上这些数据变化的节奏,且性能不佳会使其无法跨多个地点提供实时价格更新。 

图数据平台可以帮助零售商解决收入管理问题,同时提供实时定价引擎所需的处理能力和性能。许多变量之间的相互依赖关系可以用图表示,这为零售商提供了可确定并高效计算价格的方法,即使在这种依赖关系快速变化的情况下。

系统管理员:网络和 IT 运营

零售 IT 组织也受益于图数据平台。通常,公司拥有复杂的网络,并且越来越多的组件存储在云或多个云以及内部数据中心。在大多数传统的配置管理数据库 (CMDB) 中,要表示每一项 IT 资产并了解它们的关联方式十分困难。 

以运行多个虚拟机 (VM) 的物理服务器为例,这些 VM 可能托管运行不同进程并关联不同子网的容器。在这种情况下,可以使用图数据平台来查看所有组件的关联方式。

系统管理员还可以使用图数据平台来维护由所有不同网络资产组成的图。此图可用于更好地保护网络及检测漏洞或限制入侵风险的传播。

零售商面临着许多挑战,这其中很大一部分来自精通技术的线上零售商。从提供实时产品推荐到 态定价及优化配送路线,零售商必须迅速克服这些挑战,才能站稳脚跟并获得自身竞争优势。
 

此外,零售商还必须提高响应速度,以便赶在竞争对手之前应对不断变化的消费者和技术趋势。通过图数据平台可帮助零售商了解关联数据,且与传统技术相比,能够更深入地利用数据关系,以提供实时产品推荐、优化配送路线能力。

审核编辑:汤梓红

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分