数据科学(Data Science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。数据科学技术可以帮助我们如何正确的处理数据并协助我们在生物学、社会科学、人类学等领域进行研究调研。此外,数据科学也对商业竞争有极大的帮助。
数据科学是一门结合计算机科学+数理统计+具体领域应用的交叉学科
二、美研数据科学项目开设情况
目前已经在美研院校大范围开设,我统计了一下,目前综合排名前30的院校中有24所学校开设了26个相关项目,总体选择丰富。数据科学项目多数开设在统计系下,也有开设在计算机系下,或者统计系和工程学院联合授课。
数据科学最常见的学科名称是Master in Data Science,也有部分学校命名为Master in Analytics,基本就这两类命名方式。
在学制上,所有数据科学项目都是1-2年完成,3个学期毕业,即秋季-春季-秋季这种学制安排最为常见,多数项目毕业要求为30个学分,修完10-12门课程毕业。
基本只提供秋季开学,只有约翰霍普金斯等少数几个学校提供春季开学。
三、美研数据科学项目本科申请背景要求
总体以数学、统计、工程、经济学这几类专业为主,没有绝对的本科专业要求,本科开设数据科学专业的学校数量相对没有硕士多,以杜克大学2021级学生为例:工程类背景占比34%;经济学占比24%;自然科学类占比10%。
西北大学这个项目对于纯数理背景的申请者偏好明显更高。
对于申请先修课程有严格要求,最常见的要求为:
- 两个学期的微积分课程,对应美本Calculus I & II,要求掌握多元微积分(Multivariable Calculus)
- 线性代数(Linear Algebra)
- 统计与概率论(Probability and Statistics)
- 编程语言(Computer Programming Language),以Python和R最为常见
四、数据课程项目申请材料
各个项目申请材料比较类似,总结如下:
1. 成绩单。这个最为重要,申请前30的项目总体建议不能低于3.5/4,竞争激烈的项目不低于3.7,个别学校比如范德堡需要提前做WES评估。
2. 托福。申请前30项目必须要考到100+,大部分项目托福要求100,哥伦比亚大学公布过2017级平均托福录取分为106.5,斯坦福公布过录取平均托福分数在110左右。
3. GRE。这两年因为疫情,大部分的项目对于GRE要求为可选,建议目标分数325+,NYU公布的平均录取GRE各部分平均分数:159.3(阅读)+167.4(数学)+4.14(写作)。
- 个人陈述。我举例宾大对于个人陈述内容的要求如下:
To help us better determine your candidacy for admission into the Data Science Program, your personal statement should clearly discuss your background while placing special emphasis on your coursework and/or your professional experience relevant to the Data Science Program. It should further elaborate your future plans and how they make you an ideal fit for the program.
主要讨论三部分内容:一是过往在数据科学方面的课程和经历,二是对于该项目的理解和认识,三是对于未来的规划。
三封推荐信
简历
先修课程要求
五、数据科学项目的主要开设课程
数据科学项目都会以核心合成+选修课程两部分组成,以哥伦比亚大学为例,核心课程包括以下七门:
1. Computer Systems for Data Science/数据科学中的计算机系统
2. Machine Learning for Data Science/数据科学中的机器学习
3. Algorithms for Data Science/数据科学中的算法
4. Probability and Statistics for Data Science/数据科学中的统计与概率论
5. Exploratory Data Analysis and Visualization/探索性数据分析和可视化
6. Statistical Inteference and Modeling/统计推理与建模
7. Data Science Capstone and Ethics/数据科学大作业
除了以上七门核心课程,哥大还要求学生完成三门选修课程,一共十门课程毕业,这也是数据科学项目常见的课程开设模式,大家上的主体课程内容相近,差别不大。
也有少部分学校比如纽约大学和乔治亚理工大学,将培养计划还分成了不同方向,也就是大家在相同的核心课程之上,通过不同方向的集中选修确立了自己的方向/Track,纽约大学的数据科学项目分为了三个Track:Data Science Track/数据科学,Data Science Biology Track/生物数据科学,Biomedical Informatics Track/生物医学信息学。乔治亚理工的分析学项目也分为了三个Track:Analytical Tools track/分析工具,Business Analytics/商业分析,Computational Data Analytics/计算数据。
六、数据科学项目毕业就业情况
数据科学总体就业情况还不错,市场需求比较大。常见的就业职位包括:数据分析师,数据工程师等。