×

基于危险理论的web文本挖掘研究

消耗积分:3 | 格式:rar | 大小:152 | 2009-08-22

分享资料个

web 挖掘是处理Internet 环境下数据挖掘的一个重要方向,本文在比较研究传统web
挖掘方法的基础上提出了一种基于危险理论的web 挖掘新方法,该方法具有很强的自适应性和更新能力,为web 挖掘领域提供了一种新的研究思路。
关键词:危险理论;人工免疫;web 挖掘
传统的免疫学的核心功能就是具有区分“自我”与“非自我”( SNS) 的能力。目前,
免疫学界又普遍流传着另外一个新的理论,那就是危险理论。 这个理论认为免疫系统并不是区分SNS ,而是区分危险信号的有无[1]。 这就打破了长久以来对自身免疫耐受的认识,并对传统的SNS 理论提出严重质疑。这个新的理论模式的提出对移植、肿瘤、胎儿、自身免疫响应等诸多问题做出非常好的解释,并由此修正了传统的免疫应答系统。 目前危险模式已引起各界学者的广泛关注并产生了一系列的研究成果。
随着Internet 的迅猛发展和普及,web 信息量飞速增长,而这些信息中也有相当一部分
是冗余甚至错误的,如何自动的从web 中发现、抽取和过滤信息,就成为了人们迫切关心的问题。Web 挖掘是从web 文档和web 活动中发现、抽取潜在的、用户感兴趣的有用模式和隐藏知识的方法。目前已有很多web 挖掘方法的研究成果,包括基于XML 的web 挖掘方法,基于粗糙集的web 挖掘方法,基于核方法的web 挖掘方法等,但这些方法在面对Internet 这个复杂多变的环境和繁杂的数据更新时,在自适应性和进化更新方面显的力不从心。经研究发现,人工免疫原理与web 挖掘方法有极为相似之处,具体体现在:(1)分布式数据(2)变量数据的高百分比(3)大容量(4)数据质量不等(5)数据多样化。在此基础上,本文提出一种基于危险理论的web 挖掘新方法,希望为web 挖掘领域提供一种新的研究思路。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !