找呀找呀找工作 -- 统计跨地域找工作经验总结 [Updated on 09-04]

avatar 108889
earlgrey
50961
85
开篇先感谢论坛里的各路大神(W 大, 小K姐姐) 还有许多小伙伴们的帮助,内推以及包容了我找工作期间各种脑残问题和负面情绪.

现坐标:东海岸
理想坐标: 面向全国, 特别想去 Silicon Valley 感受下那边tech people’s passion to change the world

个人介绍 ( 这个是id 是多人公用 小马甲, 请勿人肉)
统计小硕, 有一点工作经验, 工作有modeling 的成分 也有client facing 的成分,算是比较平衡technical 和 business, 对于product management 也有些了解. 技术比较渣, 在学校期间靠抱学霸大腿过活. 唯一的优点是, 英语口语还行, 日常交流没问题, 脸皮厚, 面试不容易紧张.

为了吸引眼球, 先上面试公司名单.
Tech: Google,Facebook,Amazon, Microsoft, LinkedIn, AT&T Research Lab, Optimizely (湾区某start-up) Orbitz (某在线卖机票的网站)
Consulting: McKinsey
Banking: Capital One
不知道怎么分类: Disney

面试准备:

怎么写简历, 参见 W 大 的文章1point3acres.com

基本知识, 因为工作以后很多基本统计知识都不需要用的, 面试前要重新pick up . 按照这次的经验,统计的面试比较杂, 根据面试官本身的背景(大多数面试官都不是统计背景的) 问的问题跨度比较大. 我尽量总结, 如果你有被问到其他的更奇葩的问题,欢迎分享!

概率: dice poker coin-flipping, Russian roulette, 贝叶斯啥的 都是常规问题, 请自行复习本科probability.

brain teaser: 给大家推荐本书 a practical guide to quantitative finance interviews. 里面有个chapter 给出了很多经典的brain teaser question, (还有个chapter 是概率题, 也推荐看, 其他的章节感觉和统计面试没有很大相关, 可以选择性略过) 我真还撞上过情景不同但思路一致的题目.
amazon.com

Linear regression and GLM, Mixed Effects Model:

还是再推荐本书, 虽然很厚, 作者有话唠的毛病,一个观点重复表达多次, 但是你要忍住往下看, 还是有干货的, 各种assumptions 和 为啥要使用某个model 都讲的很到位. 而且使用的语言比较通俗易懂, 特别适合面试之前现学现卖,抱抱佛脚

Data Analysis Using Regression and Multilevel/Hierarchical Models
amazon.com

Machine Learning / Data Mining:
Coursera 上 Andrew Ng 的 Machine Learning 虽然很入门,很基础, 但是用一个星期把lecture 和 exercise 过一遍, 应对一般面试足矣.更深入地学习可以看这本书, 大名鼎鼎的 Elements of Statistical Learning 作者网站有免费下pdf
statweb.stanford.edu

Database basics 和 SQL:
Coursera 上 Stanford 的 Intro to Database. 这个也是一个星期能搞定的. 学完这个基本Amazon 和Facebook 的基础面试SQL 题 就没问题了. data base principal 啥的也可以适当学一下, 有时候CS 的面试官会丧心病狂的问一下.
class.coursera.org

Big Data and Hadoop:
这个topic 非常火, 也有面试官喜欢问一问, coursera 上 也有课, uw 开的, 第三个作业 map reduce abstraction, 写完可以应付面试. 最起码 别人给你一个task , 你能告诉他 mapper 和 reducer 的input 和output 是啥. 还有了解下Distributed File System 和 map reduce process 的流程. 这两个部分基本是Hadoop 的核心了.
class.coursera.org

Java/Python, 还有啥白板coding, 问BFS, sorting algorithm complexity, 怎么implement linked list, hashmap
哎, 我一个学统计的,面试碰到engineer 总是不太能镇定的, 尼玛 我又不是要来抢你饭碗 你要不要这么为难我. 这个知识点比较分散, 要补课是个长期工程, 大家都注意平时积累, 我个人推荐Berkeley 的cs61a,b series. Coursera 上 也有 standford 和 princeton 上开的algorithm 课程, 听朋友说都不错. coding 这个事情, 要手熟, 多练习. 我答这种题目也是每次都磕磕绊绊, 求面试官放过我这个自学编程的统计小硕士.

Business Question:
各家问题不一样, 总体都比较和自家产品相关. 建议面试前看看行业新闻或者注册个账户使用下产品,了解下有啥feature. 还有再推荐本书 (我真的不是卖书的) data science for business 写的非常好, 非常适合我这种techinical 差, 一看到大量复杂公式就打瞌睡的**阅读.
amazon.com

先告一段落. 面试篇下次再发. 嘿嘿, 求表扬, 求RP 暴发,求offers!


#############################

Updated on Sept. 2, 2014

本帖隐藏内容需要登录后才能查看。

#############################

Updated on Sept. 4, 2014

AT&T Big Data Team:

看到版上有人内推,正好我又面过他们家的data scientist 职位,就先写点经验出来。 如果有同学拿到面试,希望可以有帮助。

他家的data science team 专门搞统计的人不多,相反有很多人有牛校物理phd 背景。 牛 means 斯坦福,加州理工,哈佛 这个等级, 并且很多人有多年(大于等于10年) 行业经历。 算是technical很牛的组。

面试内容,非常学术。 很注重简历,问的很细。 也很注重学校背景,楼主不是fresh graduate, 但还是问了很多在学校里上了哪些课,用了哪些教科书,还有学校的哪些老师在哪些area 比较牛什么的, 总之都是非常详细的问题。 问这些问题的面试官和楼主毕业于同一个院校,所以根本没办法蒙混过去。 我只好凭着模糊的记忆回忆了n 年前用过那些教科书的作者, 还有学校的大牛professor。 这算是个特色,别家基本没有遇到过问教科书的。

ML 和统计: 问了些基本的classification 和 clustering algorithms 的比较和应用。 统计概念问的比较基础,问了p-value,t test, 怎么算某些基本的distribution 的 sample mean , variance 之类

Database 和map-reduce: 问了很多关于database 的原理, 比如啥是eventual consistency, sql 和noSQL system 的区别, hadoop 的原理, 要求写了两三个map reduce task。 当时我还没有开始学 hadoop, 毫无悬念地挂了。

办公室,在palo alto 市中心, 感觉是新搬过去的,我去的时候到处都是搬家的大纸箱。很多位子还是空的, 会招很多人的样子。这个组的远大目标是帮助AT&T 从传统的电信公司转型,从各种途径挖掘有效的生财之道。 所以做的东西方向还是很广的。 面试我的人确实都是那种super smart super 牛逼的, 想要挑战自己的同学大胆滴尝试吧。他们家还有个big data 的组 office 在 texas plano。 我面palo alto office 挂了之后被问愿不愿意去texas。不负责任地猜测 texas 可能hiring bar 略低一些。 不怕热的同学或者德州土著可以考虑这个option
  • 274
85条回复