×

机器学习是什么?机器学习入门《机器学习实战》中文版电子教材免费下载

消耗积分:0 | 格式:rar | 大小:0.00 MB | 2023-08-11

spanf

分享资料个

  机器学习是人工智能研究领域中的一个极其重要的方向。在现今大数据时代的背景下,捕获数据并从中萃取有价值的信息或模式,使得这一过去为分析师与数学家所专属的研究领域越来越为人们瞩目。

  本书通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效可复用的Python 代码阐释如何处理统计数据,进行数据分析及可视化。读者可从中学到一些核心的机器学习算法,并将其运用于某些策略性任务中,如分类、预测及推荐等。

  本书适合机器学习相关研究人员及互联网从业人员学习参考。

  本书没有从理论角度来揭示机器学习算法背后的数学原理,而是通过“原理简述+问题实例+实际代码+运行效果”来介绍每一个算法。学习计算机的人都知道,计算机是一门实践学科,没有真正实现运行,很难真正理解算法的精髓。这本书的最大好处就是边学边用,非常适合于急需迈进机器学习领域的人员学习。实际上,即使对于那些对机器学习有所了解的人来说,通过代码实现也能进一步加深对机器学习算法的理解。

  本书的代码采用Python语言编写。Python代码简单优雅、易于上手,科学计算软件包众多,已经成为不少大学和研究机构进行计算机教学和科学计算的语言。相信Python编写的机器学习代码也能让读者尽快领略到这门学科的精妙之处。

  本书讲述重要的机器学习算法,并介绍那些使用这些算法的应用和工具,以及如何在实际环境中使用它们。市面上已经出版了很多关于机器学习的书籍,大多数讨论的是其背后的数学理论,很少涉及如何使用编程语言实现机器学习算法。本书恰恰相反,更多地讨论如何编码实现机器学习算法,而尽量减少讨论数学理论。如何将数学矩阵描述的机器学习算法转化为可以实际工作的应用程序,是本书的主要目的。

  机器学习是什么?谁需要使用机器学习算法?简而言之,机器学习可以揭示数据背后的真实含义。这本书适合有数据需要处理的读者,也适合于想要获得并理解数据的读者。如果读者有一些编程概念(比如递归),并且了解一些数据结构(比如树结构),那么将有助于本书的阅读。尽管机器学习领域的专家不一定能从本书获益,但是如果读者具有线性代数和概率论的入门知识,那么也会利于本书的阅读。此外,本书使用Python语言进行编程,它过去也被称作“可执行的伪代码”。本书假定读者有一些基本的Python编程知识,不过不知道如何使用Python也没有关系,只要具备基本的编程思想,学习Python也不困难。

  数据以及基于数据做出决策是非常重要的,本书内容也是来源于数据——“数据挖掘十大算法”是IEEE数据挖掘国际会议(ICDM)上的一篇论文,2007年12月在Journal of Knowledge andInformation Systems杂志上发表。依据知识发现和数据挖掘国际会议(KDD)获奖者的问卷调查结果,论文统计出排名前十的数据挖掘算法。本书的基本框架与论文中提到的算法基本一致。聪明的读者可能已经注意到,虽然论文只给出了十个重要的数据挖掘算法,但本书却有十五章。下面我会给出解释,这里我们先看看排名前十的数据挖掘算法。

 

  论文选出的机器学习算法包括:C4.5决策树、K-均值(K-mean)、支持向量机(SVM)、Apriori、最大期望算法(EM)、PageRank算法、AdaBoost算法、k-近邻算法(kNN)、朴素贝叶斯算法(NB)和分类回归树(CART)算法。本书包含了其中的8个算法,没有包括最大期望算法和PageRank算法。本书没有包括PageRank算法,是因为搜索引擎巨头Google引入的PageRank算法已经在很多著作里得到了充分的论述,没有必要进一步累述;而最大期望算法没有纳入,是因为涉及太多的数学知识,如果它像其他算法那样简化成一章,就无法讲述清楚算法的核心,

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !