非ML方向统计PhD苦逼找实习经历

avatar 52837
RR1
19566
27
16 summer的实习终于是申完了开始纠结offer,感谢在准备面试中的地里的各种面经,现在来回馈一下地里并附上教训总(tu)结(cao)。。

因为找实习开始的太晚,我一月份开始好好翻linkedIn的时候很多公司的data scientist intern都已经招满了。。一度纠结了不少奇奇怪怪的公司海投了一堆,又懒得花时间写cover letter,而且research主要在social science和health上和大家希望招的ML specialist可能不大对路。。满打满算也是攒了一手的拒信。。暂时来说收到了几家的面试在最下面简单总结一下。以及求对收到的两个offer的建议 T T

结论先行:不做ML实在是没优势; 申请要早;申请要早;申请要早!另外可实习可不实习的同志们务必早点想清楚,不要像我一样一边申请一边纠结暑假要不要好好留校安心写呸爬。。。

结果:
Offer:MSR, LinkedIn
Reject:太多不一一列了。。。

两个offer还可以纠结到周一 >.< 两个都分别与我的research有部分交集,LinkedIn的project比较有趣但是空泛一些,MSR的project具体很多但是不会太exciting。。至于生活条件L家应该提供的很不错而且整个intern program更social,然而M家就在我出门公交二十分钟。。太过纠结。。到时候再上来更最后结果吧。。求建议。。

------------------------以下为分别总结-------------------------

好好准备了的三家:Google, MSR, LinkedIn

Google QA,
这个大家都是海投。。效率很不错,很快就match到了NYC的组,两轮面试被刷。。第一轮吹水讲research和讨论project,第二轮Google doc写R,这个流程大家都差不多,虽然面完我把google doc悄悄存了下来,但是因为签了NDA就不透露具体题目了,总之很简单常规,没有遇到奇门遁甲型的R问题。。非coding的问题也很简单做过consulting的同学应该都不成问题。个人很喜欢Google的项目,感觉是我面过最statistician(而非computer scientist或者data scientist)的地方。。我match到的project与Adwork有关,Anyway,如果拿到NYC那个组的大神在这里受我一拜。。。

MSR Redmond,
这个是一个collaborator帮我内推的,MSR实在是个一个萝卜一个坑的地方,之前用心网申写材料结果因为一个推荐信的邮箱填错需要给support发邮件人工后台改折腾了好几个月才提交上去,当时主要是想去NYC做social computing的组,老板也给那边认识的人推荐了我。。结果最后还是杳无音信。。还好后来合作的另一个教授收到Redmond这个Econ组招intern的消息帮我又推了出去才最终拿到offer。面试过程很简单就一轮,面之前就给我发了project description,准备起来也有的放矢,没有问一点基本知识,直接讨论project,对于我这种考试无能星人也是个利好。

LinkedIn Economic Graph,
LinkedIn的DS intern在我还没来及申请前好像就招满了。。这个是后来开的,给chief economist干活。我联系了去年没有面了我但是没录的data scientist,算是有半个内推吧,也是两轮面试, 第一轮讨论project和问了我一些简单的case study类型的问题看我用data解决问题的思路,虽然基本也是吹水。第二轮问统计问题和写码,不过因为当时已经有offer了所以第二轮就没准备。 裸面被问到的貌似是L家的经典题目:What’s your favorite binary classifier? 水了水logistic regression和一些后续property的问题。。然后用java写shortest pat。。面之前告诉了面试官和recuiter我刚刚拿到MSR offer希望他们尽快做决定,结果当天下午就给我打电话说good news了。。

-----------------------------我是玩票申的几家的分割线---------------------------------

Amazon Machine Learning Scientist,
这个是和上面MSR同一个教授帮我推的。之前网申好几个星期没有动静,推完之后从系统里又把我调出来赏了一轮面试。。感觉还是太偏CS了,focus主要在build system而不是modeling上。而且可能是CS和STAT的差异吧,面试官上来打了一句招呼就开问'what is overfitting?’这样的问题。。此处省略一万字反问和内心吐槽。。。身为statistician by training,这类问题实在是不会高效回答对方想要的答案,sigh。 最后结果也不出所料我们互相感觉不fit,电话一挂就看到网上系统里变成了not selected。。

Disneyland data scientist,
这个有点不好意思,占了地里各位的面试名额,本来我是完全没打算去,只是申着想如果有面试可以拿来练手(也的确很快被拒了)。。因为时差问题面试时间是早上7点。。于是我就穿着睡裤喝着茶接受了两个面试官一小时连续轰炸。其实说实话这个面试的focus非常statistician,感觉应该会比较有意思,祝福地里拿到offer的各位。。以下是部分我当时面完边吃早饭边回忆记下的题目(他家没有签协议,而且感觉有些问题可能对其他地方面试也会有用所以记得详细一点,侵删。。):
  • a lot of question related to projects, including very early ones
    • what is poisson process
    • what properties do poisson process have
    • describe your model in more detail (a few times I finished and was asked to go on..)
  • A lot of questions related to regression
    • diagnostics, error term distributions, what if errors are i.i.d non-normal
    • check normality,assumptions
    • nonlinearity, multicollinearity
  • Weird question
    • what is continuous function, describe property
  • SAS question
    • what does a data step do
  • Case study
    • set price to optimize revenue, under models of quantity ~ price

IBM Watson bioinformatics,
海投着玩的结果拿到了一个online interview。。本来还以为IBM只招内推的。。没有什么好说的,不过给以后申请的人留一点经验,他家给我的online interview包括了short question和video question,video question大概有三四个,每个限时3到10分钟不等,给出question之后会有1到3分钟准备时间,有点久违的考托福的感觉。。建议在一个背后有白板的地方回答,必要的时候可以写公式帮助口头表述。问的问题倒不难,都是基础的regression之类,具体记不大清了,不过很多留了很长时间的问题感觉很快就可以说完。。可能这也是为什么我面完就再也没有消息了吧。。。

RAND cooperation,
这个其实没有给我面试,不过因为没怎么看到地里有人提他家所以提一下。他家每年都会有summer associate的项目,感觉项目和设置都不错,而且在Santa Monica也是利好。但是真是太!慢!一月份就截止申请一直审材料到四月。周围有同学都接了别家offer之后四月初受到他家面试邀请,还是个奇葩的不能透露太多细节的国防项目(同学是美国人)。。Anyway,过去去过RAND的很多都成了日后各种applied领域的大牛,有机会去的话应该还是不错的。。。



补充内容 (2016-4-12 08:41):
update: MSR it is. Best luck to whoever gets the LinkedIn ECON internship!
  • 34
27条回复