哥大 Statistics v.s. Data Science 课程介绍

avatar 224764
tomchen29
14893
15
[align="left"]最近又到了申请/录取季,感觉地里对比哥大统计和DS课程的帖子似乎很少。由于楼主经常去听DS的课,这学期也选了他们的一门必修,因此在此分享一下对两个项目课程的感受~希望对学弟学妹们择校选项目有所帮助。[/align][align="left"]首先我们先看下选修课,因为必修肯定逃不掉~[/align][align="left"]DS的课程安排相对直接,毕业要求7门必修+3门选修,其中选修几乎没有限制,只要是grad-level的课都能算毕业学分;此外,DS项目对CS选修课的优先级似乎跟CS项目是一样的(必修优先级肯定还是低一些),而咱统计的选修一般都能挤进去。这基本能保证你选到想上的3门选修。[/align][align="left"]统计的选修设置非常神奇,自由度服从某个均值方差未知、x轴区间在0 - 正无穷的人品分布{:4_88:}。原因如下:[/align][align="left"]1. 首先毕业要求4门必修+6门选修,其中公认的选修可以到这里查看:stat.columbia.edu至于名单以外的选修是否可以算作毕业学分,是由Advisor说了算了(插播:统计的学生入学后会自动分配一个系里的教授作advisor, 负责解答课程/学术问题;分配过程完全随机,是好是坏完全运气)。有些advisor特别好,基本是你想上啥就给你批啥;但也有一些比较保守的advisor,认为统计学生就该好好学统计,所以不怎么批清单上没有的外院的课。[/align][align="left"]2. 续上。假设你福星高照,分配到了一个开明的advisor, 那么GSAS学院有一个Bug级的选课神器你必须知道:Add/Drop Form。只要你的advisor批准你上某门课, 并在这个Form上签字,那无论这门课是哪个学院的、满没满,GSAS registar可以在系统里把你硬加进这门课(朋友亲测有效)。那个,CS/EE的同学请放下你们手里的砖头...[/align][align="left"]3. 总而言之,统计项目的选修自由度非常看(混)脸(乱),有种either你被规则利用,or你利用规则的即时感...然后由于选修课总体较多,学生还是比较容易根据自己的兴趣(DS, CS, Quant, Econs, BioStats,,,)进行定制化的学习。[/align]
[align="left"]聊完了选修,我们再简介一下两个项目的必修:[/align][align="left"]DS Program[/align][align="left"]STAT GU4203 PROBABILITY THEORY[/align][align="left"]CSOR W4246 ALGORITHMS FOR DATA SCIENCE[/align][align="left"]STAT GR5703 STATISTICAL INFERENCE AND MODELING[/align][align="left"]COMS W4121 COMPUTER SYSTEMS FOR DATA SCIENCE[/align][align="left"]COMS W4721 MACHINE LEARNING FOR DATA SCIENCE[/align][align="left"]STAT GR5702 EXPLORATORY DATA ANALYSIS AND VISUALIZATION[/align]
[align="left"]ENGI E4800 DATA SCIENCE CAPSTONE AND ETHICS[/align][align="left"]
[/align][align="left"]Statistics Program[/align][align="left"]GR5203: Probability[/align][align="left"]GR5204 Inference[/align][align="left"]GR5205: Linear Regression Models[/align][align="left"]GR5291: Advanced Data Analysis[/align][align="left"]
[/align][align="left"]以下是对两个项目的课程点评和对比[/align][align="left"]GU4203/GR5203 Probability,GR5703/GR5204 Inference:这两门是DS和Stats 都需要修的基础课Probability和Inference。我觉得除了课号不同,教的内容是高度相似的。因为楼主本科读Business Analytics & Management(暴力转专业),很多统计的基本概念都是第一次接触,不好评判课程难度。但很多陆本数学/统计同学都表示很简单,估计跟国内高校的基础课水平类似吧。[/align][align="left"]统计必修 - GR5205 Linear Regression Models:每个统计项目都会开设的线性回归课程,要求语言R/Python。Linear Regression应该还是目前使用最广泛的模型,我认为这方面的理论基础非常重要、也非常有用。只是这门课没有统一大纲,教学内容/难度/质量完全取决于教授,高者收益终生,低者...请问学费能退吗?[/align][align="left"]统计必修 - GR5291 Advanced Data Analysis:毕设课,最后一学期才能上。目前听上届学长学姐的说法,课程偏理论,但能给到很多统计方面的启发。期待ing[/align][align="left"]DS必修 - W4246 ALGORITHMS FOR DATA SCIENCE:感觉跟我本科辅修CS时的算法课很像。要求语言Python,作业量大、有挑战性、收获很多、对找工作帮助极大。配合LeetCode/LintCode一齐使用效果更佳。[/align][align="left"]DS必修 - W4121 COMPUTER SYSTEMS FOR DATA SCIENCE:楼主正在上,大水课;截止目前,讲了整整半学期的Database基础,关键cover的内容还没我本科上databas课一个月讲地多 {:4_105:}[/align][align="left"]DS必修 - W4721 MACHINE LEARNING FOR DATA SCIENCE: Machine Learning, 要求语言Python. 我对这门课不太清楚,但看了Syllabus, 和统计项目的“必选修” GR5241 Statistical Machine Learning 非常相似,感觉也非常实用。主流的regression, classification, clustering, ensembling models都会介绍到。[/align][align="left"]DS必修 - GR5702 EXPLORATORY DATA ANALYSIS AND VISUALIZATION:DS项目唯一一门用R的课,主要内容也是教你如何用R画图。旁听过几节,其实觉得不是很有意思,毕竟Matplotlib/Seaborn/Bokeh/D3.js 可能更主流...[/align][align="left"]DS必修 - ENGI E4800 DATA SCIENCE CAPSTONE AND ETHICS:毕设课。这个真不了解了。[/align][align="left"]
[/align][align="left"]恩,课程对比大概就是这样啦~个人感觉总地来说,统计更偏重理论(选修代表课Bayesian Statistics, Non-parametric, Stochastics...),DS更偏重应用(选修代表课Applied Machine Learning, Algorithm, Cloud Computing)。两个项目都存在不小的自由度,因此哪个项目更适合、最后想走什么样的路,还是要看自己的技能树是怎么点的啦。祝大家求学顺利、offer 连连![/align]
  • 39
15条回复