New Grad DS找工总结

avatar 157384
390386583
5753
10
18年底毕业的IEOR专业硕士,从十月底到一月初经历了三个月的找工季,目标tech行业的DS岗位,感触颇多。
背景:之前summer在药厂里的commerce部门做DS intern,其实工作略无聊。在传统行业的DS或者tech类岗位不受重视,技术栈也跟科技公司没法比,做了一些不疼不痒的toy project,当时根本没有上线production的意识,做完之后就是画画PPT提一些建议就完事了,至于manager或者别的business stakeholder有没有人听就难说了。传统行业还存在很多这种end-to-end data scientist,从数据收集,清洗,建模到presentation都是DS在做。而在科技公司DS的岗位已经明显分化成:1,做analytics的DS,infrastructure越来越好已经极大简化了工作流程,基本会写SQL就是唯一的tech要求,而这种岗位对product/business sense的要求很高,适合有工作经验的candidate。 2,做modeling/research的DS,这种岗位bar极高,很多minimum requirement就是phd,适合建模/research背景强的大佬。3,还有一些偏engineering的岗位,已经不太像DS了,叫machine learning engineer可能更合适,面试也是以算法+ML+system design为主。搞清楚自己背景,选择正确的track非常非常重要!

面试准备:1,机器学习肯定是DS类面试最核心的东西,各种常见算法的原理,loss function,优化方法都应该熟练掌握,以及模型之间的对比,推荐看CS229那个课程材料就很不错,基本抓住了大部分主要的高频算法。我在学校里学的ML很偏bayesian,花了好大时间力气搞懂这套框架,但是后来面试发现很少有面试官会从这个角度发问,基本还都是focus在经典模型算法上。2,编程算法。其实我感觉DS对这个要求还挺低的,涉及不到algorithm design这种深度,能达到coding proficiency就能解决90%的面试题了。把leetcode高频100题仔细写写,再辅以联系,基本刷200道就能搞定这块面试内容。 3,Data science case,就是应用ML解决一个实际问题。这是我觉得最难把握的一部分,因为貌似都是open end case但其实面试官心里已经有答案了。这些case会带你从define problem and metrics,data cleaning and processing,features engineering,modeling and evaluation都走一遍,一定要仔细跟住面试官的引导,如果你跑遍的话面试官一般会试图把你拉回来。这里面最难的部分往往,如何在定义有价值的问题上,反而模型部分很粗梳略过。如果遇到不熟悉的场景一定要搞清楚再开始说。这块不太好准备,建议就是多做各种project熟悉流程,多看看medium上面的blog和poster开阔下眼界思路。4,简历project,这个其实也是蛮重要的一部分,很多时候解释project in a clear,logical and well-organized way是非常重要的。自己做过的pj一定要跟同学多mock,没说清楚的地方一点点改进,抓住主干忽略次要细节,准备多个短/长版本的项目介绍。5,其他,偶尔还遇到过各种跟SQL,big data,stat,ab teasing,product,behavior相关的问题,这些东西特别杂而且频率不是特别高,只能靠平时多积累。

找工途径:内推和校招肯定是坠吼的!但是LZ后来整到一月时候,该推的都找人推过了,实在没啥可推了就只能自己投了。需要注意的是DS这种岗位opening不多,不像SDE那种都有new graduate program,有时候一些JD写着要求1~2年工作经验也是可以试试的,HR还是会根据你的背景发面试。

总结下就是这个找工季LZ大概面了快20个DS相关的岗位,大概一半多是tech行业,深深感受到了这个岗位对new grad ms还是很不友好的,尤其是如果没有很强的CS背景。最后意外接了一个MLE类的offer也是特别神奇。大家在冲刺DS的时候,一定也要顺便面面各种analytics,DE之类的岗位,有时候会有意外收获。如果没有很强的学术/research背景,建议走software engineer - machine learning这条路,相对会容易一些吧。

想到啥相关的东西会补充上来的,求大米大米!
  • 34
10条回复