机器学习算法数不胜数,要想找到一个合适的算法并不是一件简单的事情。通常在对精度要求较高的情况下,最好的方法便是通过交叉验证来对各个算法一一尝试,进行比较后再调整参数以确保每个算法都能达到最优解,并从优中择优。但是每次都进行这一操作不免过于繁琐,下面小编来分析下各个算法的优缺点,以助大家有针对性地进行选择,解决问题。
1.朴素贝叶斯
朴素贝叶斯的思想十分简单,对于给出的待分类项,求出在此项出现的条件下各个类别出现的概率,以概率大小确定分类项属于哪个类别。
优点:
1)朴素贝叶斯模型发源于古典数学理论,因此有着坚实的数学基础,以及稳定的分类效率;
2)算法较简单,常用于文本分类;
3)对小规模的数据表现很好,能够处理多分类任务,适合增量式训练。
缺点:
1)需要计算先验概率;
2)对输入数据的表达形式很敏感;
3)分类决策存在错误率。
2.逻辑回归
优点:
1)实现简单,广泛地应用于工业问题上;
2)可以结合L2正则化解决多重共线性问题;
3)分类时计算量非常小,速度很快,存储资源低;
缺点:
1)不能很好地处理大量多类特征或变量;
2)容易欠拟合,一般准确度较低;
3)对于非线性特征,需要进行转换;
4)当特征空间很大时,逻辑回归的性能不是很好;
5)只能处理两分类问题(在该基础上衍生出来的softmax可以用于多分类),且必须线性可分。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !