4.大数据分析及挖掘技术
大数据分析技术改进已有数据挖掘和机器学习技术;开发数据网络挖掘、特异群组挖掘、图挖掘等新型数据挖掘技术;突破基于对象的数据连接、相似性连接等大数据融合技术,突破用户兴趣分折,网络行为分析、情感语义分析等面向领域的大数挖掘技术。
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的、人们事先不知道的、潜在有用的信息和知识的过程。数据挖掘涉及的技术方法很多,有多种分类法。
根据挖掘任务可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等。
根据挖掘对象可分为关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库及环球网Web。
根据挖掘方法,可粗分为机器学习方法、统计方法、神经网络方法和数据库方法。机器学习,可细分为归纳学习方法(决策树、规则归纳等)、基于范例学习、遗传算法等。统计方法,可细分为回归分析(多元回归、自回归等)、判别分析(贝叶斯判别、费歇尔判别、非参数判别等)、聚类分析(系统聚类、动态聚类等)、探索性分析(主元分析法、相关分析法等)等。神经网络方法,可细分为前向神经网络(BP算法等)、自组织神经网络(自组织特征映射、竞争学习等)等。数据库方法主要是多维数据分析或OLAP方法,还有面向属性的归纳方法。
全部0条评论
快来发表一下你的评论吧 !