数据科学:Python VS R语言

电子说

1.2w人已加入

描述

对于数据科学初学者来说,实干才是硬道理。所以我们只需选择其中一种语言,并重点完成一些项目,接着便可品尝胜利的果实。这就是最快的学习方式。

笔者虽然很想直接推荐Python(笔者主要使用Python,不过也的确掌握一些R语言的工作知识),但还是想为初学者公正地评估一下这两种语言的有效性。这主要是因为选择哪种语言取决于你自己的具体情况。

你为什么想学习?

必须考虑的因素是:你想要学习的原因。例如,如果你是一个训练有素的生物学家,想学习一些编程技能以便更好地理解你的数据集,或者你熟悉其他科学编程语言,比如MATLAB,那么你应该考虑在YouTube上看一些R语言的教程,因为它对你来说比Python更简单、更直观。

或者,如果你是精通C/C++和Java等语言的软件工程师,并且准备转攻数据科学,Python将是适合你的一种语言。与大多数其他流行的编程语言一样,Python是一种面向对象编程(OOP)语言,它可能比R语言更直观。

又或者,也许你最近一直在阅读数据科学这一迷人领域的相关文献,并想涉足其中,在这种情况下,这两种语言都是不错的选择。因此,比起学习的理由这一因素,选择哪种语言将更多地取决于其他因素。

你是否有精通该语言的朋友或同事?

如果你正在学习一门新语言,那么获得社区的支持将会是一个巨大的优势。从社区获得帮助是程序员的一项非常重要的技能。

作为一名初学者,学习如何获得帮助有些棘手,很少有网络资源来教会人们如何从社区获得帮助。具备敏锐的直觉,并且知道当代码出错时应该询问些什么是非常重要的。

如果你认识一个精通Python的人,或者你实验室的另一个研究人员一直在研究R语言,那么你最好学习他们擅长的语言,因为这样你就可以在遇到困难时随时向他们求助。

你是只对统计和数据分析感兴趣,还是想学习其他领域,如机器学习和人工智能?

在应用层面上,Python和R语言的一个显著区别在于前者用途更广泛。Python是一种成熟的编程语言,这意味着你只用Python便可以收集、存储、分析和可视化数据,同时还可以创建机器学习工作管道并将其部署至生产或网站中。

另一方面,R语言则是只用于统计和数据分析,它的图表要比Python的更美观且个性化。R语言使用图形语法(Grammar ofGraphics)的方式可视化其ggPlot2库中的数据,这提供了Python所缺乏的大量直观的个性化设置。

或许这样说有些笼统,但如果你想成为一名数据分析师,R语言应该是你的首选。如果你想成为一名数据科学家,Python则是更好的选择。这便是泛化与专业化的两难选择。

作为一个在过去十年间兴起的领域,数据科学的进化日新月异。但不变的是越来越多的数据管道每天都在被自动化。

具备数据工程、数据可视化、机器学习工程、云服务集成和模型部署等多种技能的员工,总是比那些只专注于数据科学工作流程这一个方面的员工更受欢迎。该领域的发展已经在很大程度上实现自动化,只有编程技能出色的员工才能不被机器所取而代之。除非你极其擅长该领域,否则仅仅专注于构建优秀的机器学习模型在未来是行不通的。

目前的业内形势是:有太多初学者水平的求职者,能力虽然“较为”出色,而初工作经验则寥寥无几。对于那些略微高级的工作岗位来说,则没有足够多的经验丰富或技术对口的工作者。为了能够在工作中更上一层楼,你将需要去理解并实践工作流的其它阶段,为何不让自己的成功概率最大化?

如果你依旧举棋不定,笔者建议最好是现在就选择Python并开始学习。在你掌握了与之相关的工作知识之后,还可以学习R语言的基础知识。但如果你实在用不惯Python,那么接下来该做什么就无需笔者多费口舌了。

作为初学者,你的首要任务应该是了解数据科学的核心概念,并首先了解如何将这些概念应用于实际场景。对于那些没有编程或计算机科学背景知识的人来说,配置编程环境可能是件难事。然而,比起Python,配置环境并开始学习R语言的体验可能会更加流畅友好。

有太多人只是沉溺于成为一名数据科学家的空想,而真正脚踏实地采取行动的人却远远不够。所以,是时候开始你的数据科学之旅了。
责编AJX

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分