在数据科学领域工作前需要了解的事情

电子说

1.3w人已加入

描述

毫无疑问,数据科学如今已经成为并将持续是最热门的职业选择领域,很多人一个猛子扎进了这一领域当中。但是,这个21世纪最热门的职业并不一定适合所有人,这不是说数据科学不值得,恰恰相反它几乎就是为了解决实际问题而生的。

当然啦,本文仅代表作者观点,可能存在一定偏颇。不同国家地区的职业设置以及各人掌握的技能存在差异,因而每个人看世界的角度都不一样。我只从我的经验和角度聊聊我的想法。

入行以来,笔者每天花费10到12小时在数据科学领域中,撰写了将近100篇相关文章,自认为已有资格对这个领域里的某些现象发表一点见解,那些现象令人失望却鲜有人提及。对笔者而言,实用数据科学是最有趣的领域之一,尤其是在进一步深入学习之后更有体会。

然而,为了数据科学而从事数据科学的意义何在呢?这么说吧,除非是研究人员,否则全职从事这个行业几乎没有任何意义。花费大量时间训练模型的理由何在呢?模型会被应用在网页和/或者手机app中吗?是会被用来解决一些实际问题吗?还是只会被闲置在电脑上呢?

数据科学似乎正在成为软件开发的另一个分支。这不见得是坏事,现如今模型训练和优化(只要用对工具)几乎全部都是自动化的,而“数据科学家”需要做的,仅仅是以恰当的方式准备数据,以及向上级汇报工作。

这或许是件好事,你有了更多时间去做有趣的事情,从而交付整个数据包并实际解决问题,而不会将模型闲置在电脑上。

但是,如果计划在这个领域谋求一份全职工作,请先读一读本文,看看行业光鲜外表下的其它方面,了解进入这个行业的优势和可能存在的劣势是很有必要的。

1.不关心业务

先说明一下,除了在Medium和TDS上发表博文以外,笔者还是一个全职的数据科学家。笔者所就职的公司并不专门从事于数据科学的某个分支,仅仅是一家以咨询为主的IT公司。

这意味着笔者并不专注于一个项目或一个产品,而是同时推进三到五个不同行业的不同项目。是的,笔者并不精通于那些行业里的任何一个。这可能是很多人不喜欢数据科学工作的原因,你对所工作的领域了解不多,从业者也并不愿意去学习那么多东西。

不过,对于某些在相关领域从事数据科学的人而言,情况可能并非如此。假设一个人已经在X领域接受了专业教育,并且对数学和统计学掌握得不错,因而被聘用在该领域里从事大量重数据型工作,这就皆大欢喜了。

我所指的是通才型数据科学家,就是那种从一个项目转移到另一个项目工作,但是感觉自己从来没有做出实际贡献的人。

2.缺乏全局观

这个缺点对数据科学领域的通才和专家都适用。

假设有某个项目团队的app需要“数据科学魔法”的加持,于是邀请了一位数据科学家参加会议。这位数据科学家一定会被问到这些问题:

· 你的模型可以做到这点吗?

· 这些现代神经网络可以用在10KB的数据集上吗?

· 你能只用30行数据做一个预测模型吗?

这就是问题所在了。在完全不了解项目及其架构的情况下,就必须很快提供一个最先进的解决方案,也就是所谓的全局观问题。

对于专家型数据科学家可能还没那么麻烦,因为他们至少具备了某些领域的专业知识,并且了解如何去适应全局,这使他们能够相对轻松地完成工作。

3.老板是商人

外行领导内行这件事很容易闹出一些荒谬的困难。如果你的上级不是数据相关领域的专家,那么他们对于数据科学的了解与任何一个普通人从新闻里了解到的没什么两样。

不过,这个问题带来的影响大小在不同的国家是不同的,毕竟不同国家的工作和生活文化可能存在很大差距。

而这带来了一个潜在的问题,团队可能接到一项任务,其研究工作需要数月才能完成,但是从商业角度来说这不太可行。理想的情形是,部门主管能够理解特定解决方案所需要的时间之长和工作量之大,然后在上一级那边帮忙交流疏通,但这样的主管可遇而不可求。

这时就是良好的人际交往能力派上用场的时候了。给你的老板解释清楚为什么花一两个月去搜查100项用不上的东西,这不是一件轻松愉快的事情,但掌握人际交往和项目展示的技巧可能会让局面更好一点。

在笔者看来,只有在有实际问题需要解决时,只深耕于数据科学和预测建模的全职数据科学家才有立足之地。归根结底,数据科学只是一种技能,不应用于解决业务问题就毫无价值。如果不关心相关业务,或者仅仅是不了解业务情况,都可能让工作无法顺利开展。

所以,是否要入行,还请你三思。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分