存储技术
当我们正在迈向大数据时代当中,很多专业的词汇不得不仔细的品味,理解它将帮助在实践中明确方向。从我们呱呱落地开始认识这个世界的时候,我们就与元数据密不可分,它是我们认识这个世界的基础。今天我们就共同理解一下什么是元数据。
元数据是一个咱们必须首要了解的概念。又称中介数据、中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。都柏林核心集(Dublin Core Metadata Initiative,DCMI)是元数据的一种应用,是1995年2月由国际图书馆电脑中心(OCLC)和美国国家超级计算应用中心(National Center for Supercomputing Applications,NCSA)所联合赞助的研讨会,在邀请52位来自图书馆员、电脑专家,共同制定规格,创建一套描述网络上电子文件之特征。
简单说,元数据是对数据本身进行描述的数据,或者说,它不是对象本身,它只描述对象的属性,就是一个 对数据自身进行描绘的数据 。比如,你想上网网购,买一件衣服,那么衣服就是数据,而你挑选你想要的衣服所介意的 色彩、尺寸、做工、样式 等等就是它的元数据;再比如,一幅画本身,是数据。而这幅画的作者、完成时间、尺寸、价格、类型等等,就是它的元数据。
你平常玩游戏的时候,判别一件配备是否强力,配备上显现的 力气、灵敏、智力 等等一系列的信息,这些也是元数据,他们的效果就是给你判别这个配备数据给你所带来的感觉,而配备自身这个数据却不是你选择的要害,由于其他的配备也是数据,但你是 靠元数据去选择和判别的。就像碰到一个只见过一面的人,但你对他有必定的形象,那么这个形象就是这个人的一个元数据。
在蜜蜂帮帮中,也是经过 类似于元数据这种细分化的数据形象方式 ,来达成一个服务所能给特定的人群带来优质体会的,因而经过渠道对用户的一个大数据分析然后达到严选的精准匹配。
元数据的价值十分的大,咱们日常的日子遇到的人或事根本都是经过元数据去进行一个判别。它的两个价值: 一是能从侧面描绘目标;二是能够做到结构化和信息化。
举个比如,咱们要判别一幅画值不值钱,除了找专家判定,还能够经过元数据来判别。
比如,这幅画是名家的仍是二流画家的?这幅画是画家鼎盛时期的著作,仍是年轻时的著作?这幅画是不是画家拿手的范畴?经过这些信息,咱们大概也能估量出这幅画的价值,尽管可能有差错,但这种办法是很科学的。
这就是在大数据上产生的价值了:对于非结构化的、非量化的对象本身,结构化的元数据可以用以快速计算和判断。
大数据应用第一个阶段是辅助产品,给产品提供支持,帮产品人员和市场人员做判断。过去做产品调研很麻烦,假设有个饮料公司,想知道那种口味市场最喜欢,他们不仅要设计问卷调查,还要组织很多人现场试喝,而且这么做结果还不一定准。有了互联网之后就不用这么麻烦了,只要有了真实的数据,很快就能分析出来。比如,腾讯知道自己的微信用户有多少人用朋友圈,每天发几条,发的内容是什么,这些都是真实的数据。再比如,现在有个用户每个月在网上买十箱水,留的地址是某个高档餐厅,我们就知道这瓶水的目标受众是谁了。
大数据应用的第二个阶段是创造价值。当数据积累到一定程度之后,数据本身就是有价值的。比如,中国最熟悉老百姓消费习惯的,不是某个机构或者协会,而是淘宝;拥有最全面个人信用信息的,不是银行或者咨询公司,而是支付宝。道理很简单,我们的所有消费和交易行为都在某个平台上,而这个平台又有所有数据的记录,那这些数据本身就是产品。如果把消费行为的数据卖给广告商,广告商就可以定向给你投送广告;如果把信用数据卖给银行,银行就可以判断出你的信用程度。
从另一个角度看,通过我们行为数据这些元数据,我们已经在慢慢被量化的信息给描述出来了。比如你一年花了多少钱、在哪方面花的钱等等,就能让别人通过数据对你有个大概的认识了。所以,大数据应用的第三个阶段是塑造我们。举个例子,如果你最近一直用微信联系一位同学,还一直在网上搜一部新上映的电影,那你很可能要和这位同学去看这部新电影。
全部0条评论
快来发表一下你的评论吧 !