登录
  • #数据科学

Data Science相关岗位全面解析(DS vs DA vs MLE vs DE)

ZeZheng
17258
82
楼主现在MS毕业不到两年,在硅谷从事data scientist工作。最近在换工作,面了FB,Google,LinkedIn,Airbnb,Apple,Uber等公司的data science岗,也拿到了满意的offer。在找工作的过程中我发现data science这个市场对不同的岗位并没有一个很标准的定义,不同公司甚至同一个公司的不同组的叫法都会不一样。所以希望发一篇帖子来说说怎样找到自己想去的那个岗。

先来说一下行业中大家普遍接受的定义:

data analyst:工作重点放在怎么分析数据来找到如何可以提高产品的insights,并和PM一起工作来改善产品。也有的DA需要做dashboard来检测核心指标。核心技能是sql,python等数据分析工具,以及tableau等数据可视化工具。交流沟通能力很重要,因为一直和PM一起工作。然后有很多ad hoc的活和data request。

data scientist:data scientist的目标也是改善产品。但我觉得scientist和analyst的差别有两点。第一个是ds使用的技术手段一般更高级,比如用到很多machine learning和statistical modeling的方法,对数学统计理解的要求也更高。第二个区别是项目的类型,ds一般做长期偏研究类型的项目,而da一般做一个很简单快速的分析,一两天之内就要给PM结论。

machine learning engineer:mle和ds比起来更偏engineer一些,也就是说要写很多production code。这是因为mle一般做的是实现产品中的ml feature,比如说怎么样把ml算法应用到提高Google地图ETA精度。因为是实现产品功能,所以对写代码的要求相应ds来说要高一些。ds也做ml model,但是区别是ds要么做的model是给商业组提供insights的,比如怎样找到sales的目标客户这种。要么就是做产品相关ml 功能的poc,但最终产品上线还是mle做,因为他们coding更强。

data engineer:data engineer的关注点主要在怎样提高数据获取流程上面。他们会写很多data pipeline,比如有一个数据集是大家经常要使用的,data engineer就会写一个流程创造这个数据集,并且一段时间自动更新一下。再比如da要做一个dashboard或者ds要做一个model,data engineer都会帮忙他们获取相应的数据。也有的data engineer是做data infra,比如设置好Hadoop环境和工具让ds和da使用。

但是事情并没有这么简单,现在市面上很多公司并不是严格按照这个定义来给他们的岗位命名的。比如Facebook弄出来一个data scientist analytics,听起来是DS但做的事情更像是analyst+pm。再比如Google有个岗叫做quantitative analyst,但事实上这个是他们的data scientist。所以说光看一个title不能说明什么问题,最重要的是要看岗位的描述!在投一个工作之前先看看他们要求的核心技能是什么,和他们解决的问题是什么,这个都可以在工作描述里面找到。比如analyst岗一般会说很多soft skills,比如有很强的分析技能,有很强的交流能力,熟练使用sql之类的。data scientist一般会提到很多ml或者causal inference方面的技能。mle则是会提到很多编程以及model serving方面的技能。看了工作描述已经基本知道了这个岗位是做什么。在面试的时候也可以多问问hr,组员,和hiring manager他们平时主要是解决什么问题,这样可以有一个更清楚的了解。我面试很喜欢问的一个问题是:现在data science里面主要有三种活,analytics,ab testing & inference,和ml modeling,你们平时的项目里面这三种占的比例大概是多少?通过这个问题就可以基本上了解他们的工作性质。下面我总结下我了解的一些公司的岗位区分。

Google:quantitative analyst是他们的核心data scientist,product analyst data science是analyst,software engineer machine learning是mle,也有的software engineer是做data engineering。他们也有data scientist岗,一般比较偏QA,但也有偏PA的,需要面试和组里确认。

FB:data scientist analytics是analyst,core data science组和infra组的data scientist做的活更偏scientist。research scientist是phd swe/scientist,并不一定做research。mle也在software engineer里,有的组会做到ml项目。

Airbnb:他家的data scientist是分track的,analytics,inference和algorithms三个。analytics就是analyst,inference主要做ab test,algorithms做model。他们也有专门的mle和de岗。

LinkedIn:很多人不知道LinkedIn的ds也是和airbnb一样分track的,我也是面试的时候才知道。他们也有三个track,一个叫strategy and insights,这个就是analytics,第二个track叫做inference and algorithms,从名字就知道更偏ab test和ml,第三个track叫做data engineering,据说这个track比较新现在人还很少。LinkedIn也有software engineer ML,但是和data scientist不在一个org,他们在AI org。LinkedIn家的mle还是很硬核的做很多算法,他们的这个岗有很多phd。

Apple:Apple因为都是组里招人所以比较乱,他们也没有track。同样是data scientist,有的组做dashboard有的组做ml engineering。他们家ds和mle有时候也混着用,所以只有看工作描述区分和面试的时候多问问。

Lyft:他们data scientist其实就是analytics,research scientist才是scientist。他们的一个medium blog就说了这个问题,他们本来有analyst和scientist,但发现analyst不好招人,因为有的公司(估计是FB)把analyst叫做scientist然后大家都更喜欢去这种岗。所以他们干脆也把analyst改成scientist title,把scientist改成research。其实工作内容没有任何改变。

Uber:Uber家的product analyst是analytics,data scientist干的活一般是scientist类型的,比如ab test和ml。Uber也有单独的mle。

Amazon:BI Engineer是analytics和data engineer的结合。data scientist做一些analytics也可能做一部分分析相关的ml。research scientist做ml但是coding少。applied scientist是他们家要求最高给钱最多的岗,需要ml和coding都很强。

Twitter:Twitter我没有面,但感觉他们就是mle做ml相关的项目,ds还是偏analytics。

Microsoft:M家ds感觉也是看组,有的是analytics,有的做DL。他们还有个data & applied scientist,看工作描述比较硬核,但我也没有面过。

一般来说大型公司特别科技公司分工比较明确,一般一个岗位focus在analytics,inference和algorithms其中的一种。其他行业(比如零售医药之类)或者科技startup公司的ds比较偏full stack,什么都要做。但不管怎样,按照我前面说的方法也基本上能知道这个岗具体是做什么的。欢迎大家讨论!
82条回复
热度排序

发表回复