让我们从经典的线性回归(Linear Regression [1])模型开始这份教程。在这一章里,你将使用真实的数据集建立起一个房价预测模型,并且了解到机器学习中的若干重要概念。
给定一个大小为 n 的数据集 {yi,xi1,…,xid}ni=1,其中 xi1,…,xid是第 i 个样本 d 个属性上的取值,yi 是该样本待预测的目标。线性回归模型假设目标 yi 可以被属性间的线性组合描述,即
例如,在我们将要建模的房价预测问题里,xij 是描述房子 i 的各种属性(比如房间的个数、周围学校和医院的个数、交通状况等),而 yi 是房屋的价格。
初看起来,这个假设实在过于简单了,变量间的真实关系很难是线性的。但由于线性回归模型有形式简单和易于建模分析的优点,它在实际问题中得到了大量的应用。很多经典的统计学习、机器学习书籍[2,3,4]也选择对线性模型独。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !