机器学习应用及数据集

电子说

1.2w人已加入

描述

【导读】本文介绍了包括图像分类、交易预测、情感分类、推荐系统、股票预测等在内的若干个机器学习应用及数据集。

1.鸢尾花分类

Iris Flowers数据集被视为ML的“Hello World”,因为它是分类的典型例子。这个数据集的好处是它只有四个属性:花瓣长度,花瓣宽度,萼片长度和萼片宽度,可加载到内存中。

该项目涉及使用四种已知特的不同种类的鸢尾花。

分类类型?这里使用多类分类。这意味着我们应该能够准确地预测数据点属于哪个类。

目标:根据花的特性对三种花进行分类:花瓣和萼片的尺寸。

2. 交易预测

GNY的小组发布了一个演示程序,展示了该平台如何通过其强大的神经网络预测零售交易组,并且该平台的完全可下载和可定制版本将在今年夏天推出。GNY将有一个可选择的机器学习代码集库,可以根据每个人的要求进行选择,并可以应用于他们的侧链(因为GNY将使用Lisk的侧链技术)。

为什么这个这么重要?几乎所有企业都在寻找一种经济实惠的方式来挖掘其数据中的隐藏价值,但是如果它将它们暴露给安全风险则不会。区块链的固有结构有助于控制数据一致性,并保持对数据的控制

性能提高,因为在前一个块仍处于活动状态时,已经可以为后续块启动验证。验证包括检查用户是否有足够的余额。只有错误预测的交易,才需要重做这项工作。

这个演示是一个有趣的入门项目,适合想要预测简单数字的人,今年夏天推出的完整平台应该为开发人员提供更多功能和定制。可以在MLWave找到一个好的数据集,用于使用购买历史来预测重复购买者。

目标:根据支出历史预测未来交易。

3. Twitter的情感分析

机器学习的一个有趣应用是情感分析。随着加密货币的兴起,情绪分析取得了重大突破。许多人试图建立包含情绪分析的交易机器人,以做出更好的交易决策。

还有许多其他平台可用于情绪分析,如Reddit,Facebook或LinkedIn,因为它们都提供易于使用的API来检索数据。但是,由于Twitter平台上数据的格式一致,这是机器学习的首选数据。由于推文主要由文本,URL和主题标签组成,因此预处理也更容易。

Twitter API知道许多可用于集成到项目中的API库。可以使用!pip install python-twitter通过pip安装Python的包装器。

分析几个有趣的例子:

围绕新发布的电影的评论,并将其与IMDB和其他评级网站上的评论进行比较。

围绕特定选举或任何其他趋势政治话题的情绪。

根据推文的情绪预测前50种加密货币价格的未来方向。

目标:情绪分析器学习一段内容背后的各种情绪。此任务可帮助您考虑设计各种模型以将推文标记为正面或负面。在后期阶段,我们可以用更加细致的方式标记推文,如“中性”,“愤怒”,“乐观”,......

4.使用Movielens的推荐系统

推荐系统是机器学习技术在商业中最成功和最广泛的应用之一。您可以在日常生活中随处找到推荐系统。例如,在观看Youtube视频时,Youtube算法会根据您的观看习惯向您推荐视频,同时也会根据观察运行ML算法的模式对全世界人们的观看行为提出关键见解。

我们可以为推荐系统找到两种算法:

基于内容:它寻找内容的相其与其他人进行比较以找到类似的行为/喜好。下图说明了这一点。

目前,Movielens提供了最受欢迎的电影评级数据集之一,这是初学者试验的理想数据集。

目标:根据评分,预测用户喜欢哪些电影。

5. Quandl股票价格预测

股票价格预测器是一个了解公司业绩并预测未来股票价格的系统。股票价格预测的问题是可以使用许多类型和数据来源:

波动率指数

历史价格

全球宏观经济指标

基本面分析

使用指标的技术分析

分析股票市场的好处是它具有更短的反馈周期,这使得更容易验证您的预测。如果您不了解市场周期,我建议您阅读有关此主题的内容,以了解典型周期的情况。

为了简单起见,您可以选择一个简单的机器学习示例,如根据组织的季度报告预测6个月的价格变动。

目标:使用基本和技术指标预测未来价格。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分