Columbia MA STAT 哥大统计入学半年总结

31024
63
楼主从申请开始之前就一直关注地里,感觉这里分享的干货真的帮助很大。所以我也想这里多分享一些我的想法,给大家一些帮助。特别是那些和我一样,申请结果很不如意的同学。申请只是很小的一步,未来还有很长的路要走。一时的失利可能会改变挺多的,机会也好、心态也好,但这些都挡不住想改变、不服输的意志。即便上了大水硕,生活总还有转机的,也还是要努力做好每一步。哎,又鸡汤了好像。但真的挺想鼓励一下的,楼主很懂那种拒到最后的绝望,只想哭什么都不想做的那种日子真的很黑暗。这个坎还是要跨过去的。

当然前面说了大水硕,其实是算自黑吧。外界对哥统的评价真的挺烂的,wei博啊,某乎啊,黑哥统已经成了老生常谈。因为这个被刷简历应该也不是没有。但楼主不是想批判这个项目,手里有offer的同学,不想来这里自然会去别的地方。来这些项目的学弟学妹也不用太有负担。名声是有点问题,但这不影响他可以提供的很多资源。

上面说了挺多,这里楼主在集中说说上课和找工作以及一些建议吧

1. 上课
统计系算是在GSAS下面的MA项目,毕业要求30学分,也就是10门课。GSAS算学费的方式是学期,也就是每学期交固定的钱,然后可以选20分以内任意的课。这应该是广受诟病的一点。学费这一届,应该是3.5+4+2,差不多读下来是10w刀的学费。再加上房租,每个月按coso的1300算,18个月下来也有2.5w快。这个成本可想而知。当然如果能抽抽宿舍或者i-house的话,成本可以降一些。另外,第二学期开始可以做grader,有3000刀可以拿。
但既然,学费都是必须交的,选课就快乐一些。统计的项目要求4门必修课,5203 Probability, 5204 Inference和5291 Advanced Data Analysis。除了这4门外,还要求修至少3门统计系开的选修课,另外3门可以按一个list里的选。总的来说,和DS系学的内容很像,然后自由度很大。不过和DS比,统计的课坑点也很多,必修课没有他们的好。前些年还有入学后那个学期,直接申请DS spring入学的,有申请成功的。但这两年好像没有这样的了。不过这个也确实是个思路,也有人读完这个项目然后在读哥大cs spring入学的。除了成本有点高,别的都挺好的。路还是很多的。
选修课,系里面的list给提供了好几个方向,Finance、DS、精算、PHD。想申phd的同学肯定就博士课走起了,这个楼主没什么经验。倒是听说每年都有申的很好的,上上届还有申上JHU的CS PHD的(大佬哈哈)。走Finance的话,我感觉这个真的值得吐槽。说是finance,课都是随机过程、时间序列之类的。这些确实和finance有关,但感觉这些挺尴尬的。去做ib、行研的话,这些课不如去商学院学点那些accounting相关的。但话说回来,想走金融的来读这个有点奇怪。想做quant的话,倒是该学一些随机。但是,统计吧第一学期只能学哪几门必修课,学随机都是第二学期的事情了。这会学随机,大行的机会早没有了,可能回国会有一些用。但是还是感觉做quant还是去mfe项目好很多,统计这个项目,在这边找bb行很难过简历,回国又备受歧视。(感觉国内金工部挺多都是MFE回去的,对哥统和各种MFE的层次还是了解的)总之,感觉走finance留美的话,不是很推荐。路太难走了。
DS的话,统计系有3门课,5206 Intro into DS,5241 Statistical Machine Learning,和5291 Advanced Machine Learning(好像上学期在教data mining)。下面一门一门说说楼主上的课和当时考虑过的课吧。0
第一学期:
第一学期基本没有选择,选课要有advisor同意才给选。很多同学运气不佳,advisor不给批,那第一学期就没有操作的余地。我的话,选了5203-5206以及ecbm 4040,五门课。选课的逻辑是,必修课反正是浪费时间,找省事的好拿A的。省下来的经历找一门能做大的pj的课,填充一下简历,另外刷刷coursera。

STAT 5203 Probability
这门课和国内本科概率论差不多,讲的内容也不深,不是带测度的那种。开课的老师有很多,我上的是michael sobel的。之前都听大家对他评价不高。但上了发现,某种意义上讲,这老师很好。什么意义呢?这老师事情很少,他的课只有一次期中一次期末,没有作业。后来上别的课发现,这老师简直是神仙好吗。既然是浪费时间的课,那就应该力求浪费的时间越少越好,收获越大越好。权当复习probability的基础知识了,看看茆诗松、陈希儒什么的扎实一下挺好的。这课大部分人会选那些只上半学期的section,这样期中就考掉这门课。最后压力小一些。

STAT 5204 Inference
顾名思义这课就是讲数理统计,内容depends on老师。我选的victor,这老师事情比较多,除了midterm,final还有quiz、作业、甚至还有pre。这老师也是聪明,让同学10个人一组,做pre,pre的内容就是后半学期老师要讲的内容。然后老师就不来了,都是同学在讲。。迷惑

STAT 5205 Linear Regression Model
这课真的就只讲线性回归,本科计量学过的话,基本可以躺着了。我从这个课发现一个路子,就是可以选那些给hybrid开课的老师,这样的话,这课是有录像的。所以可以不去上课,偶尔看看录像就可。老师的话,我选的Young,还可以其实。

以上三门都是必修,为了学ds的课,第一学期得选5206,这课真的一言难尽。

STAT 5206 Intro to Data Science
这课就是学一下R怎么用,老师会根据advanced R和data science 什么什么的两本书来讲R的各种用法。但这课的核心是用Ed平台,每周大概有100道作业题。(100道指100小问,一小问就是进行一些操作,比如画个图之类的)这个作业量还是很大的,而且我个人之前R不是很熟,很多参数规则感觉很诡异,也一直不是很想学。就都敷衍了事了。作业的话,其实我感觉就是把助教写的instruction翻译成R,很花时间很花时间很花时间。考试倒是没那么难,和做作业类似。我个人不是很喜欢R,感觉没啥用,还是好好写python了。但如果上统计系的课多的话,大部分都是用R的。比如很热门的5243 ads。

除了这四门课,我当时主要关注了cs类可选的课。

ECBM 4040 Neural Network and Deep Learning
这课是ee系开的,老师还不错,提供的材料、作业很赞。整体上下来还是挺好的,楼主是和coursera上吴老师的dl课同时上的,感觉这课讲的更难一些,吴老师的更好理解。这课的作业比较硬核,作业参考了斯坦福cs231的那些,手动写ann cnn之类的。期末的话,有考试,也有一个小组的project,主题是复现一篇论文。题目老师提供了一些,然后也可以自选。哈哈值得一提的是,楼主很早盘算着学DL,就自己搞了个服务器,然后开学的时候找同学收了一块1080,折腾起来还是挺有意思的。最后搞pj帮助很大,因为当时楼主很懒,想着也不认识ee系上这个课的人,还是自己做掉算了。于是就个人完成了这个,真的是肝爆了。当时还天真的憧憬着做quant,选了个国人写的小波变换+自动解码机和LSTM的模型,加上tf 2.0刚发布,一拍即合就开始写。结果坑越写越多,这论文引用倒是挺高的,但方法论不是很清楚,别人也没有复现成功的。调参、未来函数各种问题。最后还是复现结果和原论文差距很大。但练了一波搭建模型、写论文,还是很有收获的。
这课还有个后续课程ECBM 6040 deep learning research,跟着上下来应该蛮好的。但是他这学期上课时间是早上8点到10点,真的太早了。加上楼主拿了de的intern,还是想着转码了。就没有继续搞DL。如果跟着上,是可以很深入的。
另外值得一提的是,通过这个课,楼主发现gsas的人选课除了正式的系统里选课,还有很多途径。比如这门课系统选不进去,老师让我去找ee系的老师,签了表,在选课结束后2天也还是选进去了。第二学期发现,不管是什么课,有多少人在里面。在选课结束之后,都可以选,然后只要老师给批,advisor给批,就能硬加进去。所以感觉,统计系的选课可以不那么看能不能选进去,应该更关注课程的内容,因为总有办法进去。

CSOR 4246 Algorithm for Data Science
这门课是DS系的必修,讲的内容就是算法。老师是个希腊人,口音比较重。但是讲课还不错感觉,内容设计的很完善。主要是参考算法导论在讲,算是比较难的一门课。作业是两周一个,工作量很大。算法课上上还是不错的,配合着刷刷题。 哎,楼主本来计划着上这个和DL。但无奈,5门课的话,advisor要求上5206,然后这两个课只选一个。没办法,当时选了dl。不过第二学期可以上4231,和这个课类似,后面会讲。值得注意的是,这门课统计系是可以在开学前就选进去的,早点下手可以容易很多。

STAT 5243 Applied Data Science
这门课是做project的一个课,一共做5个,包括shiny app之类的,都是用R。具体的内容可以去github上搜搜,有课程主页。这门课的话,评价高可能是因为之前那个老师确实很棒,系主任Tian Zheng。但我看来,这课比较适合简历很空需要填充的。本身2周一个project也不会做太深,而且还要随机分组来合作,坑不坑又是个概率的问题。此外,用R做我本人很讨厌哈哈,就是一点R也不想写。所以还是选了4040,最后做pj,而不是选这门。
值得注意的是,这门课第二学期会很难选进去,大家都想上。第一学期上会容易很多,我感觉第一学期课业压力更小一些,因为课都学过不怎么需要花时间,而第二学期的课就没那么简单了。

IEOR 4525 Machine Learning for OR And FE
这课统计选不进去,但是可以找老师加canvas旁听,这课也有录像,加了canvas除了作业没人批改外没啥差别。我是因为女票在上就一起上了。这课还是挺好的,老师组织的材料真的很棒,内容很好。讲的数学也足够深入,也有例子,作业也难度适中。总的上下来,体验很棒除了老师的口音很重,看视频基本都不知道他在说什么,最后也放弃了。就看看ppt,做做作业,收获很大哈哈。

STAT 6701 Foundations of Graphical Models
这课是cs和stat的博士的一门课,讲图模型,老师真的是大牛,David blei。课业压力也挺大,每周要读paper写essay应该是,最后要做个project。当时没什么信心,就没有直接去选。打算留到最后一学期去学了。

我第一学期关注的就这些,感觉当时还是很年轻的,学校的资源利用的少。当然,这样可能也是最优解了。因为第一学期大头是找工作。我个人是比较幸运,正好有统计系的学长在fb做intern,然后内推了一波de。刷刷lc,两轮电面就结束了。但如果没找到的话,第一学期花在job search和做各种OA的时间还是会挺长挺煎熬的。找工作真的是个系统工程,地里方法论的各种帖子很多,我这里就不多讲了。

第二学期:
这学期选项真的太多了,而且本身楼主第一学期选了5门,这学期可以上一些不算学分的课。这学期选课的逻辑是,既然找到了de的intern,那这学期就要做好准备,数据库、分布式、各种cs的课走起。

首先是发现,哥大本科生的课可以随便选。这样去补一些CS基础还是挺方便的,很多理论课。首先考虑的是算法课,COMS 3134/3136/3137,这几个课都是算法,3136是c++的,另外两个是java。上起来体验比研究生的好很多,讲的也很清楚。毕竟是大一大二的人上的基础课,我感觉如果作为没有学过算法的来上这个挺合适的。楼主上了几次之后,还是去上了研究生的4231。另外还有一个COMS3157,是讲C的。提到这个课,是因为楼主当时想着得去选一选CS的4118OS,但又很虚自己的C(之前学过一些)。后来由于时间冲突最后没选,但看评价这课评价很高。上这个课的老师开的OS也是神课。被称为cs系的"the" course。还有一些离散数学、计算机理论之类的,选项还是挺多,楼主最后一学期再多探索一下。下面说说选了的课

COMS 6998 Cloud Computing and Big Data
这课真的太热门了,cs的人就没有人退课。楼主进WL排了2周,纹丝不动。。。最后还是找老师加了canvas。结果发现,地里都说这个老师很好说话,求求他就进去了。。早知道就试试了。不过话说回来,这老师口音是烙印那种,很难听懂。讲的内容很实用,主要就是用AWS,然后这课和同学合作做个app或者web app。感觉还是挺有意思的。

CSEE 4119 Computer Network
老师ppt弄的还可以,主要就是上那本 Computer Networking - A Top Down Approach。作业一半理论,一半socket 编程,应该算是规规矩矩的计网的课了。当时看了很多fb上cs同学的评论,这课还是评价不低的。

STAT 5241 Statistical Machine Learning
凑毕业,没得选了。这课又学一遍ML,参考书是ESL。这学期换成了Young来上,哎 溜了溜了,没怎么去上过课,无法评价。

STAT 5291 Advanced Data Analysis
这课说是capstone 毕业设计,但就一直一种shit的感觉。早些年,都是十几个人一组做个pj糊弄了事。今年换了老师,成了个人PJ,然后讲的内容就是复习一下,统计检验、试验设计之类的。很迷幻,也没有ppt,都是板书讲课本上的例子。没办法,为了毕业只能硬着头皮上了。
本帖隐藏内容需要登录后才能查看。
PS: 之前发的改简历贴是帮女票发的,希望没给大家造成疑惑。
  • 181
63条回复