Data Science@Columbia 介绍

avatar 94701
capri
11708
21
楼主15fall Data Science,最近哥大Data Science发了AD,自己找intern也基本告一段落,来地里回馈下。
[align="left"]Data Science 职位:[/align]
[align="left"]楼主了解到的Data Science的职位主要有Tech Company FinanceCompany Tech CompanyData岗位有不怎么偏CSDataAnalystBusiness Analyst和偏CSDataEngineer Machine Learning之类的岗位。楼主并没有投Tech CompanyAnalyst岗位,也对这方面没有很了解,主要来说一下Tech Company里面偏CSdata 岗位。有些Tech Company会开设DataScientist Data Engineer 有些TechCompany并没有专门开Data Scientist的职位例如Google,把DataScientist的岗位划分到了SE下面。Tech Company下的Data Scientist岗位要求大致是Machine Learning, AlgorithmsDistributed Systemsprogramming skills 一般说来BignameTech Company的偏CSData岗位bar都比较高, 例如Google下面专门做Machine Learningteam里基本都是PHDAmazonResearchScientist也基本都是PHD。如果是Master有很强的research背景,也是有可能进去的(但也很少)。大体来讲基本在Tech Company专门做偏CSData 的都是PHD或者有多年workexperience的。另外也可以去Tech CompanySEdatascience的方向(楼主主要考虑的就是这方面的工作)。Finance Company相对来讲门槛没有那么高,至少以DataScience Mastertitle还是可以比较容易拿到面试的。Finance CompanyData的面试基本都是Machine LearningDB的基础知识,概念,STAT,语言可能倾向于R,较少用python,编程和算法要求都不高,也并不要求research experienceTech CompanyAnalyst职位要求应该跟Finance CompanyData职位要求差不多(楼主基本没怎么面FinanceCompany,了解可能片面,以上对于Finance Company的了解都是基于身边同学的经历)。[/align][align="left"]项目课程设置:[/align][align="left"]之前已经有帖子介绍过哥大Data Science的课程。大家可以参考之前帖子,楼主有几点想要补充下 :第一学期修的基础课程algorithms for DS, probabilitystatisticalinference应该是Data Sciencefoundation,本身对于打data science基础还是很有意义的,只是这部分在找工作面试中可能比较少被考察到。第二学期的三门课程Machine Learning for Data ScienceprofessorCS的,数学理论深度足够 ,作业布置也贴近industry,是好课),computer systemDB,distributed system, Big Data三个方向知识的混合,因为很多方面知识都有涉及,讲课深度肯定有所影响。关于选课难,其实除了CS的课,EEStat的课都能选到。CS的课因为选的人很多(即使是哥大CSmaster选课也是需要抢)。其实选CS的课可以之前麻烦CS的同学代选,最后一天wl全部清空的时候麻烦别人退课给你就可以(楼主修的CS的课基本都是这么选的)。关于课程设置的弊病,楼主觉得是美帝Data Science项目的通病,并不是哥大这一个Data Science项目的问题,大部分的data science项目都会把Machine LearningDistributed Systems这种面试经常考察的课程放在第二学期上,已经错过找intern的高峰期。另一方面如果项目本身不分track,因为DataScience项目本身是CSStat混合,本科Stat的同学会觉得上的Stat基础的部分太简单,本身CS的同学会觉得CS基础的部分上的简单,而且都没有project可做。楼主本科CS,上第一学期stat inference前半段理论的时候感觉被虐哭(太久没学数学。。。)。哥大 Data Science项目本身并没有分出有侧重点的track,项目在读的人的 diversity又比较厉害,项目也很难做到CSSTAT难度都兼顾, 导致部分课程为了兼顾大家的background,有些时候并没有讲的很有深度,楼主觉得这是哥大DataScience项目的弊病(也许是大部分Data Science的通病)。但是学校的Advisor说下一届会把probabilitystat inference合并成一门课(想waive的也可以waive),会把NLPDB之类的课程开成elective,楼主觉得课程情况会比我们这届好(毕竟是新的program,各方面会有不完善的地方,department也在努力改善)。[/align][align="left"]实习工作[/align][align="left"]关于找工作,楼主觉得最重要的一点是自己尽早做准备,好好利用暑假(自己哪方面有缺陷可以及早弥补,如果目标是想进tech compamy的偏Data SciecneSE的岗位最好来之前把Leetcode题都刷一下,各方面知识都复习下。其他方面的Data Science岗位自己也多了解下,及早为找intern做准备)楼主来的时候没刷题,只能哭晕在地板。因为一旦开始上课,楼主觉得兼顾学业和找intern面试是一件压力很大的事情。另外今年美帝就业有缩招过冬的倾向,其实去年就有这种迹象,今年更加严重。很多大公司股价大跌,intern名额缩水。因为一些公司intern名额缩水,也直接导致另一些即使intern名额不缩水的公司竞争也更加激烈,position消耗的更加快(例如AmazonSE去年四月还在面试,今年三月初就群发邮件说所以position都满了)。[/align][align="left"]关于哥大Data Science找实习的情况,因为本身在读的人的diversity比较高,有人找偏向tech industry的(主要是做偏Machine LearningData Science方向的SE),也有偏向financeindustryanalyst。如果本身尽早做好准备,楼主觉得找intern的前景还是光明的。此处仅针对tech类型的,因为就整个大环境而言,tech industry是需求量最大的, 相对来说最容易找工作。偏向于stat类型的,因为整个行业大环境没有tech好,面试之类的可能并不好拿。例如今年哥大Stat往年可能进入big namefinance companyintern的还是比较多的,但是今年来说光拿面试的难度就比较大。针对big nametech companyflag),都建议第一学期就投简历。如果是第二学期才开始找,鉴于今年的就业形势不好,找的时候也许大公司就没有什么position剩下了,这个时候就需要自身实力非常强才有可能拿到offer(此处仅针对tech 类型的)。例如GoogleData Science项目楼主知道有三个过了Googletechnical interview,时间都很晚,第二学期初才过,那时候Googleintern pool相对来说position比较少,比较难match 最后只有一个有多年工作经验的matchGoogleproject。总结来说因为就业形势不好,找intern都尽早做好准备(即使是念CS的今年的实习情况比往年都难)。 [/align][align="left"]关于项目选择,如果考虑的仅仅是找工作这一方面,楼主觉得如果是CS科班出身,也有相同学校level的不错的CS的ML track的program录取,还是去CS的ml track,楼主觉得针对Tech Company方面的偏CSData岗位,一般Data Sciencemaster title可以拿到的tech company的面试机会CSmaster title一定可以拿到。实在因为Data Science岗位少门槛高至少还能找到SE的工作留在美帝,反之拿着Data Sciencemaster title去投SE限制可能比较多。[/align]
  • 47
21条回复