电子说
编者按:SharpestMinds联合创始人Jeremie Harris分享了申请数据科学家职位的经验。
我仍然记得我兄弟决定卖出他的比特币的时刻。那是2017年,当时我们在星巴克。我们碰到了一个发传单的中年妇女。传单开头用黑体印着“比特币:通向提前退休的道路”。
当时我挺好奇的,就问了她对加密货币市场的看法,结果发现她对比特币以外的其他加密货币几乎一无所知。以太坊?“从来没听说过。”莱特币?“那是廉价版的比特币,是吧?”
从经验上说,如果毫无头绪的中年妇女都在当地的星巴克向你宣传最新的技术趋势,你大概正接近不实宣传的高峰,或者“泡沫”。
当然这算不上什么新发现。每个人都同意,投资的时候如果你做的和其他所有人都一样,那你不太可能得到多少回报。很奇怪的一点是,人们没能在投资自身上应用同一推理。
假设你想要应聘数据科学家职位。如果你做的全是标准的“我想要成为一位数据科学家”事情,那么这就意味着你不应该期望得到梦想的工作。目前市场已经充斥了初级水平的人员,因此,处于中位数水平的新手数据科学家不太可能得到太多认同。所以,你如果想要避免中位数的结果,为什么要做中位数的事?
问题在于,大多数人开始他们的数据科学之旅时不是这么想的。我在SharpestMinds工作的时候和数百名新手数据科学家聊过,其中大约80%的人告诉我的都差不多:
首先,他们学一些基础(Python + sklearn + Pandas,也许还学点别的,比如SQL)
接着,他们参加了千篇一律的MOOC课程
他们读了一些工作描述,担心不符合条件
也许去参加另一门MOOC,也许开始申请工作
没有收到任何回音(或者,最好的情况下,参加了一些面试,全搞砸了)
变得很沮丧,考虑是不是去读个硕士,或者再申请一些工作
到了抉择的时刻了:该不该重复第2-7步直到发生了不同的事情?
如果这符合你的情况,那么很可能你也处在一个自我提升的泡沫中:你正在做所有其他人都在做的事,但期望得到不同的结果。你需要做一件事:停下来。
如果你期望超出平均水平的结果,那么你不能做平均水平的事情。但是,想要避免平均水平的事,你需要知道什么是平均水平的事。
这里是一些例子:如果你需要参加一个MOOC课程学习一些基础,那很好。但不要陷入MOOC螺旋:MOOC,从定义上来说,基本上都是为平均水平的人设计的。所以你并不会因为上了多门MOOC就成为一个突出的人。类似地,如果你的GitHub上有4到5个Jupyter notebook,内容都是乏味的sklearn/Pandas/seaborn/Keras技术栈,不要再做一个新的了。
总的规则是:如果有一件事看起来是明显的下一步,因为所有其他人都这么做,这是一件很好的不去做的事。相反,你需要找到其他人不做的事,并且尽快去做。
那是些什么样的事情?根据我的经历,我想到5件:
复现论文。 如果你是深度学习爱好者,这一点尤其重要。人们不做这事,因为这比获取一个数据集,然后使用简单的人工神经网络或XGBoost进行千篇一律的分类要难。在arXiv上找一篇和你的领域相关的最有趣的论文(最近的论文最理想),阅读它,理解它。接着,复现它,可能是在一个新的数据集上复现。写篇博客总结这次复现。
不要呆在舒适区。 如果你开始一个新项目,最好学习一些新框架/库/工具。如果你正创建第6个Jupyter notebook,开头是df = pd.read_csv(filename),结尾是f1 = f1_score(y_true, y_pred),是时候改变你的策略了。
学习枯燥的东西。 其他人不做这事,因为没人喜欢枯燥的东西。但是,学习正确的Git流程,如何使用Docker,如何使用Flask搭建一个应用,如何部署模型至AWS或Google Cloud,这些都是公司很盼望申请人具备的技能,但大多数申请人低估了这些技能的重要性。
做头疼的事情。 1) 争取在当地的数据科学聚会上讲篇论文。或者,最起码,参加当地的数据科学聚会。2) 给LinkedIn上的人发冷消息。试着首先提供一些价值(“我刚发现了你网站上的一个笔误”)。不要直接向他们请求一份工作。你的请求越具体越好(“我希望你能给我的博客文章一点反馈”)。你正试图建立关系,拓展你的网络,那需要耐心。3) 参加会议和组织。4) 创办一个学习小组。
做看起来疯狂的事情。 每个人都用UCI仓库,或者使用某个股票数据集(没劲)来创建他们的项目。别这么做。学习如何使用一个网页抓取库,或者某个被低估的API创建自己的定制数据集。数据很难获取,公司常常需要依靠工程师收集数据。你的目标是成为那种痴迷数据科学的疯子,如果工作需要,会自己创建该死的数据集。
这些策略都是一种在雇主每天面对的噪声中突出自己的方法。它们都不是银弹,但它们是在数据科学工作市场上得到更多认同,成为更能干的数据科学家的万无一失的方法。
最后,记住,培养自己的技能是对自身的投资。那意味着适用于投资的经济学原则同样适用于此:如果你想要突出的结果,那么你需要做突出的事情。
如果你对如何优化自己的机器学习或数据科学轨迹存有疑问,我很乐意和你聊聊。在Twitter上给我(jeremiecharris)发DM :)
全部0条评论
快来发表一下你的评论吧 !