什么是数据科学呢?
维基百科说:
In general terms, Data Science is the extraction of knowledge from data, which is a continuation of the field data mining and predictive analytics, also known as knowledge discovery and data mining.(一般来讲,数据科学就是从数据中提取信息知识,即是数据挖掘与预测分析的延伸,亦是发掘知识与数据的过程。)所以,通俗来讲,数据科学,就是通过分析数据,来挖掘获得这些数据中的潜在信息。
Data science还有其他几个类似的别称,比如Data Mining(NJIT)、Data Analytics(Cornell University)、Data Studies、Data Science and Management(Imperial College (London, UK))、Predictive Analytics(DePaul University)、Business Analysis(NYU/Fordham University)、Business Intelligence and Data Analytics (Carnegie Mellon University)等等。
所以,在针对这个专业选校时,一定要注意,不要只看名称,而是要重点看课程设置。
那么,Data Science的主要学什么呢?
根据对于一些课程的整合,大概是以下三个方面:
1.模型,算法;
2.数据结构
3.visualization(可视化)。
由此课程设置,可以预测该专业的背景要求。仔细观察,可以看出这些课程,都是与计算机密切相关的。并且,比如可视化,目前应用比较多的,当属machine learning,也就是通过计算机图形与图像处理,从而将我们所需要的数据在电脑屏幕上显示出来。所以,整个过程,需要一定的计算机技能,如编程、算法。另一方面,通过数据,分析挖掘出有用信息,因此,如果申请者具有一定的数学、统计分析基础的话,更有利于获得申请成功。
根据这个专业的开设情况,一般是开设在计算机相关院系下,或者商学院下,所以其就业方向,大多是计算机领域,或者商业领域。
哈佛大学的数据科学专业(Data Science)
Data Science Courses
共需要修12门课程,学时3学期
·Data Science 1: Introduction to Data Science
·Data Science 2: Advanced Topics in Data Science
·Advanced Scientific Computing: Stochastic Methods for Data Analysis, Inference and Optimization
·Systems Development for Computational Science
·Critical Thinking in Data Science
·Computational Science and Engineering Capstone Project
·Computer Science elective
·Statistical elective
·Research Experience
·Other Data Science electives
·Seminar course
·Research course
申请要求
无最低语言成绩和标准化考试要求;
希望申请者具备微积分、线性代数、概率和统计相关知识,精通至少一种编程语言,如python或R,以及对计算机科学有一定的理解。