×

Web文本表示及其分类研究

消耗积分:2 | 格式:rar | 大小:180 | 2009-08-28

张艳

分享资料个

Web 文本挖掘是Web 数据挖掘的一个重要研究领域。文本挖掘的主要方法是文本分类
和聚类。本文主要讨论了在文本挖掘中文本的表示,以及文本聚类的算法描述。
关键词:Web 文本挖掘,分类,聚类
随着 Internet 的迅速发展及Web 的全球普及,使得Web 上的信息量无比丰富,通过对Web
的挖掘,可以对Web 上的大量数据进行分析和处理,以便识别、分析、获取、存储有用信息,并将其转化为知识。Web 挖掘依靠它所挖掘的站点信息来源可以分为三类:Web 内容挖掘、Web 结构挖掘和Web 使用挖掘。
Web 内容挖掘研究的对象是网页本身的内容以及Web 搜索的结果。Web 的页面信息主
要包括文本信息和多媒体信息,所以挖掘主要包括对页面文本信息的挖掘和多媒体挖掘,其中以Web 文本内容挖掘为主。而网页中最主要的信息资源是文本,因此Web 文本挖掘又成为Web 数据挖掘的一个重要研究领域。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !