×

机器学习与数据挖掘教程之《实用的机器学习工具和技术》免费下载

消耗积分:0 | 格式:rar | 大小:8.08 MB | 2018-12-06

分享资料个

  技术现在允许我们捕获和存储大量的数据。在这些数据中发现模式、趋势和异常,并用简单的定量模型总结它们,是信息时代将数据转化为信息和将信息转化为知识的巨大挑战之一。

  数据挖掘和机器学习已经取得了惊人的进展。统计学、机器学习、信息论和计算的综合创造了一门坚实的科学,具有坚实的数学基础和非常强大的工具。Witten和Frank在本书和关键算法的伴随实现中展示了许多这样的进展。因此,这是综合数据挖掘、数据分析、信息理论和机器学习的一个里程碑。如果你在过去的十年里一直没有关注这个领域,这是赶上这个令人兴奋的进步的一个好方法。如果有,那么Witten和Frank的演示以及配套的开源工作台(称为Weka)将是工具箱的有用补充。

  他们提出了从数据中自动提取模型,然后验证这些模型的基本理论。这本书在解释各种模型(决策树、关联规则、线性模型、聚类、贝叶斯网络、神经网络)以及如何在实践中应用这些模型方面做得很好。它们描述了如何安全地擦洗数据集、如何构建模型和如何评估模型的预测质量。通过一个网站。这个Weka工作台有一个图形用户界面,可以引导您完成数据挖掘任务,并且具有优秀的数据可视化工具,可以帮助您理解模型。这是一个伟大的伴侣的文本和一个有用的和流行的工具,在其本身的权利。

 

  这本书以一种非常容易理解的形式呈现了这一新学科:既作为教材,培训下一代实践者和研究人员,又作为向像我这样的终身学习者提供信息的教材。威顿和弗兰克热衷于简单而优雅的解决方案。他们以这种心态对待每个主题,将所有的概念都放在具体的例子中,并敦促读者首先考虑简单的技术,然后如果简单的技术证明是不够的,则向更复杂的技术发展。

  如果你对数据库感兴趣,并且一直没有关注机器学习领域,这本书是赶上这个令人兴奋的进展的很好的方法。如果您有需要分析和理解的数据,那么本书和相关的Weka工具包是一个很好的开始方式。

  机器学习是从数据中挖掘知识的新兴技术,许多人开始重视这项技术。我们不想卖得太多。我们所知道的那种机器学习不是关于大问题:自主机器人仆人的未来主义视野,意识的哲学难题,自由意志的形而上学问题,智力从何而来的进化或神学问题,语言学辩论。超过语言学习,儿童发展的心理学理论,或智力是什么,以及它是如何工作的认知解释。对我们来说,它更平淡无奇:机器学习涉及从数据推断结构的算法以及验证该结构的方法。这些算法并不深奥和复杂,但它们也不是完全明显和微不足道的。

  展望未来,面临的主要挑战是应用程序。机会比比皆是。只要有数据,就可以从中学习到东西。每当有太多的数据让人们无法仔细研究自己时,学习的机制就必须是自动的。但是灵感肯定不是自动的!应用程序不会来自计算机程序,也不会来自机器

  学习专家,而不是从数据本身,而是从处理数据的人员以及由此产生的问题中学习。这就是为什么我们写了这本书,以及第二部分中描述的Weka系统——授权那些不是机器学习专家的人将这些技术应用于日常生活中出现的问题。这些想法很简单。算法在这里。剩下的就取决于你了!

  当然,这项技术的发展当然还没有完成。机器学习是一个热门的研究课题,不断涌现出新的思想和技术。为了展现研究的范围和各种前沿,我们结束了第一部分,查看了数据挖掘领域中的一些热门领域。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !