最初我们面对提出一个自己认为比较典型的问题,但是面临各种算法的选择适合不知道如何下手,这个时候应该怎么做呢?
那么我们寻找的策略从下面几个问题出手:
1、数据的大小,占用的存储空间;数据的质量,归一化处理的难度和数据的分布情况;数据的性质就是数据所在行业中一般认可得参数和被忽略的隐含参数分类。
2、可用的计算时间,这个是计算复杂度和建模工程的时间耗散,计算复杂度是算法导论和计算机操作系统课程中的一章内容。
3、任务的紧迫性,如果做相关比赛或者要求可靠性比较高的问题,就用关键字组合的方法搜索相关文献然后统计分析此类问题应该那个和现在所处的水平。
4、我们要对数据做那些操作,主要是特征和数据所属行业。
即便是有经验的数据科学家也不能分辨那种是算法在测试时候是表现最好的算法,我们并不提倡使用一种固定的算法但是我们希望提供一些指导根据明确的因素尝试不同的算法
机器学习算法分辨表帮助您从各种机器学习算法中选择适合您具体问题的算法。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !