猿族星球DATA岗之等级划分:DL Monkey >ML Monkey >DS Monkey >SQL Monkey

avatar 2
Warald
23762
33
instant.1point3acres.cn说:
听了很多留学培训机构讲座,听上去DS很有前途。。。感觉转DS做data scientist(data scientist我默认是做机器学习,会涉及到统计知识,但是我看过一些面试题,本科期间学的统计知识基本够用。面试拉差距主要还是机器学习和算法)会比直接转CS平稳。到研究生快结束找全职前,我已经有三份美国中小公司实习经历,两份机器学习相关,其中一份是Data scientist Intern。。。简历关全跪。无心插柳投的软件开发,倒是收了很多面试,最终我个人是软件开发上岸,认识的人没有数据上岸或者机器学习上岸的。我曾经在招聘网站上搜索关键字,软件开发岗位是数据科学岗位的五倍还多。另外,数据科学家岗位学历普遍要求更高。


Data Science是个很宽泛的概念,沾边的岗位和专业都跟多,很多说法也很模糊,比如这位同学提到的 Data Science = Machine Learning,相信工业界人士不会赞成;以及学DS的、学统计、学CS的、学EE的,都有人做ML,但是大家说的可能不是一回事。

在这里,Warald做个划分,帮助大家理解:当我们说DS、说ML的时候,我们说的是什么职位?

《1》Machine Learning Engineer

公司里很多做ML的职位叫 Machine Learning Engineer,可以认为是 Software Engineer with a specialization in Machine Learning,换言之,MLE跟mobile, front end一样,可以理解为是SDE的一个track。面试当然要刷题,最对口的专业当然是CS。

就工作内容而言,只有硕士学位、工作经验也不丰富的MLE,一般做不了model和算法,大多做的是实现。很多EECS PhD,做的也不是建模,依然是ML system development。

有的公司里也有专注做ML建模的组,一般要求phd,但是这样的职位很少。

《2》Data Engineer

data engineer这个title在不同公司意义不同。

有的是SQL,论收入 SQL << Data Scientist < SDE。

有些公司里,data engineer做data pipeline/platform/infrastructure的开发,是个软件开发的工作,跟MLE、mobile、 front end一样,也可以认为是SDE的一个technical track,这种职位我们称为DI(Data Infra),其收入当然跟SDE看齐 - 所有的SDE technical tracks应该都是同一个收入标准。

《3》Data Scientist

data scientist 情况更加复杂和混乱。

DS里最高端的是职位俗称“建模”,但公司里哪有那么多模型给人建?职位太少了。所以,学统计、学data science专业的同学们,找建模的工作非常难,即使有PhD。

在很多行业、很多公司,DS其实只是 data analyst or market/business analyst,无非是给了个好听的title。工作内容SQL为主、写点简单的R或者python就算高难度技术活了。这些是DS里的低端职位。尤其是非互联网公司,基本都是此类职位。

搁在中间的DS职位,在互联网公司里俗称 analytics。

在facebook, DS是二等公民,因为收入比 SDE低一级,也就是说, DS的level 5,收入参考SDE level 4。一亩三分地每日答题里有一道题目,就是针对这个情况设计的。

但在Airbnb, DS跟SDE同等级同收入。

在这两家,DS做的事情其实是类似的。既然类似,为什么A家地位高?DS们可以设计metrics来衡量一个产品的impact,但是DS工作本身的impact是很难客观衡量的,所以全看公司领导们怎么看待。

现在analytics待遇最好的地方,应该就是Airbnb了。你会看到不少人在FB工作几年去Airbnb,那怕在表面上是平级移动,比如 FB DS 5 -> Airbnb DS 5,用收入衡量,其实是 FB SDE 4 -> Airbnb sde 5,跳槽涨钱了。

去Airbnb做DS = 从各种公司去FB/Google做SDE。

无论FB还是Airbnb,都不怎么招 new grad,因为analytics最好懂有实践经验,工作内容不是 ”用某个统计方法解决某个问题“,而是诸如:

  • Facebook打算给用户的发text notification 告诉他们close friends 的Update, 如何评估这个feature 值不值得加?
  • 一亩三分地是否应该上每日答题这个feature?如何衡量其影响?


现在的data science项目课程应该没有哪家是解决以上问题的吧?然后学生们一脸懵逼,不知道怎么解决此类问题。只能去做低端的analyst,给个数据集写SQL,close ended questions更容易handle。

《4》未来的方向

Data Science:

个人感觉今后趋势是往FB靠近,往Airbnb远离。当然,这个还是要看公司、看职位,如果是一个写的了代码、做的了分析的人,其实是非常宝贵的。相信会找到适合你的职位。

ML:

最牛逼的人,会逐渐集中在Deep Learning。DL和ML是不一样的。Linkedin有很多MLE,它家的MLE质量很棒,但是大部分人不做DL。做DL比较多的行业,比如无人车 – 无论无人车啥时候落地,DL总归是技术前沿。

Software Engineer 里的track:Data Infra和 Machine learning 甚至前些年Mobile,都曾经出现过短时间的人才缺口,也都迅速填上了。MLE前两年奇缺,很多人公司也提供内部training,帮助员工做ML,坑逐渐填上了。DL门槛高很多,估计填坑速度会远比ML慢。DL Engineer目前很抢手。有机会入行的同学,应该毫不犹豫跳进。

总结:

  • DL monkey 是monkey中的monkey,拥有跟多个公司配对的权利。
  • ML monkey、DI money,跟mobile monkey, front end monkey等,作为主流,身强力壮者,也有跟多个公司配对的权利。
  • Analytics monkey,R monkey,市场需求会一直在,但在猿族星球里会逐渐变成 second class monkey,憧憬着可以去圣地Airbnb。那里据说香蕉很多,鸟语花香,还跟 engineer monkey平权。
  • SQL monkey 是最不值钱的monkey – actually,猿族里很多人认为SQL非我族类,也好意思叫monkey?


作者:一只名叫Warald的老monkey~~
  • 251
置顶回复
收起
avatar 151
modifiedname
搞data 并且跟SDE同pay 的是data infra. 因为那也是infra

绝大部分公司里data eng 过不了data infra 的代码和设计面。

data infra 应该不会使劲考SQL。应该构架为主。
33条回复