今日头条
近年来随着非结构化数据的爆发性增长,由于IBM FileNet系统架构问题出现了明显性能瓶颈,杉岩海量对象存储系统(SandStone MOS)采用全分布式架构,针对海量文件场景提供可线性扩展的持续快速访问性能,同时提供全方位的海量数据保护支持和数据生命周期管理功能,能够完美替代IBM FileNet。
非结构化数据的爆炸式增长,使有价值的信息散落在各个“孤岛”。这些非结构化信息包括办公文档、视频影像与音频、HTML网页、电子邮件、文本、报表等等,这些信息通常被放在企业的数据库、文件系统、网站以及门户等等IT系统中。
企业运营中所使用的数据,80%以上是非结构的,它的增长率甚至是结构化数据的两倍。这些数据来自于每天拥有两千亿往来的电子邮件,再加上影像、办公文档、音视频文件等等,可见是海量数据。若能够有效利用海量数据,我们便可提早发现问题,提升对客户的服务,降低作业成本,能够发掘新的收益机会。杉岩数据谈到,“我们做了一个医疗界客户的POC(为观点提供证据),我们用SandStone MOS分析五千个病人的记录,其中一个项目是找病人抽烟的习惯判断他得心脏病的风险性。从有结构式的数据中,有35%的记录中找到了抽烟指标;在文本数据中从81%的数据找到抽烟指标,并且准确度高了很多。所以若只对来源数据进行分析也许会错过一些很重要的洞察。”
“企业内容分析的数据对象正在发生变化,从事务性的结构化数据转向交互性的非结构化数据已经成为趋势。” SandStone MOS能够对异结构数据源进行企业级搜索及文本分析。
杉岩NAS异构特性介绍
传统NAS设备在已经存放了数千万级别文件数量的情况下,性能急剧下降,读写延迟可达到5-10秒,在杉岩对象存储实施的过程中,由于NAS接口性能的瓶颈,导致现有数据的迁移周期长达数月之久,为此我们开发了NAS异构特性。
如图所示,SandStone MOS纳管NAS设备的元数据,无需立即触发数据内容搬迁,应用统一使用S3接口即可访问NAS和MOS的数据,通过生命周期转移策略,可以后期平滑迁移NAS文件到SandStone MOS,数据内容搬迁过程中无需停机,业务切割时间窗极短,完美替换IBM FileNet。
全部0条评论
快来发表一下你的评论吧 !