登录
  • #数据科学

数科统计类职位 - 按面试难度排序

K姐
21600
36
大体按hiring bar排序,大体叫数科的职位

1.

IT公司Data scientist 职位,大部分仍然是针对会一些统计的码农(production level code),而不是会一点编程的统计师。大部分需要的仍然是data engineer.

越是小公司越是需要编程,因为一个人需要做的事情很多,你必须有能力从头做到尾。不像大公司更有分工。

哪怕大公司也只有比较少的地方真的会找偏统计方向的人,目前看的有:G, M, Apple(不需要刷题), 其他地方貌似没有大面积见到过。L坚持需要要能编程(需要刷题水平)。F虽然不明说但是对编程要求也是比较高(略低于刷题),但是对统计和Hive的要求较高。

MSR 当然有招ML的,但是要求超高,不懂,不多说了。ATT labs, IBM labs, 这类,不太清楚如何分类,招的人数好像不太多,不同地方要求也不太一样,不懂。。

Machine learning scientist 有时候也被认为是数科职位,其实就是有偏向性的数科,显然这个对ML的要求,远超过(我用weka做过一个classification),一般要求比较深的理解,能改进算法,至少要能prototype你改进的东西,最好能写production code. 这种职位有时候也不肯招ML PhD - 有些人虽然会做理论,但是亲自动手写实用代码的能力不够。

这些职位,可以想象,hiring pool 其实不小:

Fresh PhD in CS, EE, ML, Stat/Biostat, BME,OR, IE, Math, AppliedMath, Bioinfo, or

researchers from institutes, 没有拿到 tenure的AP,

or 已经在以上这些位置就职的人(这些公司都极其喜欢相互挖墙脚,这类墙角一般也的确命中率最高)。

They can afford to be really, really picky.

有的地方必须你每道题都答对才会要你。

这类职位会看重

编程

统计

分析能力

缺一不可。

会有所谓的technical interview

在这个band的好处是,这些技能彼此通用,如果在这些地方做的还可以的话,会有类似公司的HR经常的来挖你墙角。各个IT公司都在奋勇建设数科部门,L的合并数科,M新开设数科职业道路(M从前的3条是SDE, SDET, PM,不久前跟着裁员一起去掉了SDET track,新添加了Data Science track)可见数科的热点是正在到来,而不是什么”已经饱和“。

厚着脸皮引用我发在另外帖子的一段“能扒拉数据洗数据,能统计建模,机器学习,数据挖掘,能写production code,能设计数据模型,能优化数据库,懂MapReduce从应用到实现,能随手出个小网站demo/prototype新研究idea,能发paper能给讲座,能砍倒engineer能抡晕MBA,手下还能带几个小兵,估计就full stack data scientist了 :)” 这个是full stack data scientist终极要求,不是自我描述啊。。。我自己估计在这里面能做到15-20%.

赶脚在这个band希望做好,最终只怕难免还是需要有能刷题或者接近刷题水平,才吃的开。

2.

做SQL为主的,在有些地方也被称为数科,但是更正规的还是BI analyst,这类职位对编程要求比较低,job description 经常都不提需要会Java之类的compiled language,有些虽然也提R/Matlab or py/perl但是要求其实不高。这类工作内容可能约等于从前药厂的SAS programmer,都属于要求不太高的,一般适合master level 统计数科。

3.

Walmart, target, disney, consumer products公司的analyst,经常在marketing之类部门。对统计本身要求会更低(面试官本身也许也根本就不懂多少统计),更多是靠侃。但是由于现在对数科的重视,这类职位现在pay的其实还挺不错的,对于不想一直搞技术的人来说,其实是很好的机会。

4. 其他适合统计的还有

保险

银行

药厂/biotech/CROMarket research

研究所之类非工业界职位,好像pay比较低,这个不太清楚了。

这些未必有technical interview,很多就是随便聊聊。

NA

花街投行 -- 这个方面个人不熟悉,不多说了

===================

我自己认识的人的小样本分析,大体统计方向的找工作的时候很多人会cover以上这些行业,随便拿药厂的offer但是被IT挂的最常见。

===================

关于技术准备,其实另外帖子里面已经有了,还是自引用一下:1point3acres.com

分析解决问题的能力

这到底什么意思,还有人会没有这种能力吗?为什么需要培养?

具体说,就是面对一个问题(不是你教科书里面的那种别人已经给归闹好了的习题),而是实际问题,比如常见的是(这个产品是否值得开发,面对两种产品,怎么选择去买哪个)你需要自己从里面抽象出可以用数据解决的问题来,比如:要看是否值得开发,就需要知道cost and benefit,然后cost包含什么方面,benefit包含什么方面,这两点经常包含了暴多的方面。然后你需要有什么数据来看这两方面,如何确定平衡成什么样子,这件事就是值得做的。你分析这件事用了什么假设,这些假设经得起推敲吗?有没有什么问题没有考虑到?这些假设如果调整一下,对最后结论会有影响吗?至于产品A和B哪个更好,可以有暴多个方面需要考虑,哪些会更重要?为什么?历史数据支持你的看法吗?需要什么数据去支持?你的看法做了哪些假设?这些假设经得起推敲吗?当然这些需要一定的domain knowledge,技术面试的一部分,也就是面试官给你提成这类问题,等着你去问出所需要的domain knowledge,然后根据这些提示,你进一步分析问题,直到解决为止。

面试人一般会觉得,你公司做的东西我之前又不知道,你凭什么要求我提出这些思路?可是有没有思路,正是考察的方面之一。除了最初级的职位,是做出别人让你做的事情职位,很多稍微高级的职位都需要你自己去“解决问题”,而不是仅仅照别人的指示做事。这些么当然就是多思考。脑筋灵活,不要narrow focus。现实生活里面没人有空给你把问题清晰的定义好了,只让你求解。这种事情其实又不难。
36条回复
热度排序

发表回复