电子说
一、典型的学习任务包括:
分类(classification)
回归(regression)
聚类(clustering)
排序(ranking)
密度估计(density estimation)
特征降维(dimensionality reduction)
… …
1.1分类(classification)
基于已知类别标签的样本构成的训练集,学习预测模型;最终预测模型,对新的观测样本,预测相应的输出;预测结果为事先指定的两个或多个类别中的某一个,或预测结果来自数目有限的离散值之一。
两类别 vs.多类别
类别数C=2, 两类别分类(binary classification)
类别数C》2, 多类别分类(multiclass classification)
3.2回归(regression)
回归分析基于已知答案的样本构成的训练集,估计自变量与因变量之间关系的统计过程,进而基于该关系对新的观测产生的输出进行预测,预测输出为连续的实数值
3.3 聚类(clustering)
对给定的数据集进行划分,得到若干“簇”;使得“簇内”样本之间较“簇间”样本之间更为相似。通过聚类得到的可能各簇对应一些潜在的概念结构,聚类是自动为给定的样本赋予标记的过程。
聚类举例
1.4特征降维
将初始的数据高维表示转化为关于样本的低维表示,借助由高维输入空间向低维空间的映射,来简化输入。
– 特征提取,如PCA–高维数据的低维可视化
全部0条评论
快来发表一下你的评论吧 !