本文档的主要内容详细介绍的是斯坦福大学的机器学习课件资料免费下载。
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。
为了建立供将来使用的符号,我们将使用x(i)来表示“输入”变量(本例中也称为输入特征),以及y(i)来表示“输出”或我们正试图预测(价格)的目标变量。我们称之为训练示例,我们将用来学习的数据集-m个训练示例的列表{(x(i),y(i));i=1,。..。,M}-被称为训练集。注意,符号中的上标“(i)”只是训练集中的一个索引,与十六进制无关。我们还将使用X表示输入值的空间,Y表示输出值的空间。在这个例子中,x= y= r。
为了更正式地描述监督学习问题,我们的目标是,给定一个训练集,学习函数h:X 7_Y,使得h(x)是对应于y值的“好”预测器。从图画上看,这个过程就是这样的:
当我们试图预测的目标变量是连续的,比如在我们的住房例子中,我们把学习问题称为回归问题。当y只能呈现少量的离散值时(比如asif,给定居住面积,我们想预测一个住宅是房子还是公寓),我们称之为分类问题。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !