什么是数据科学(Data Science)?
随着科技的发展,每天每时每刻都有大量数据被产生和存储下来。如何才能把这些数据变成有用的信息价值被人类所利用,就会通过一系列的收集、统计、整理、分析、挖掘等方法和技术来实现整个过程。数据科学是一门交叉的学科,涉及到很多的领域包括统计学、数学、计算机、人工智能、机器学习、数据库、模式识别、可视化技术等多学科的知识。大数据时代的到来,为各个科学领域带来了新的改革。
数据科学专业的就业前景
对大数据处理需求最旺盛的行业包括:制药业、计算机软件、互联网、科研、IT技术服务、生物技术。事实上,大数据工作者可以施展拳脚的领域非常广泛,从国防部、互联网创业公司到金融机构,到处需要大数据项目来做创新驱动。数据分析或数据处理的岗位报酬也非常丰厚,在硅谷,入门级的数据科学家的收入已经是6位数了(美元)。
数据科学的三类职业方向
机器学习、数据分析和数据科学家
(1)机器学习工程师 Machine Learning Engineer
代表了技术含量较高的方向,工作内容主要是开发机器学习系统和用这些系统解决实际问题。一般需要ship prouction coe,做出来的是数据产品。
(2)数据分析员 Data Analyst
工作内容俗称analytics (prouct analytics or business analytics),从数据中提取insight,估计投资回报比,为产品方向提建议,所用工具一般较基础,比如写SQL query取数据、用R/Python做简单的分析、用Tableau/Excel作图比较常见,能自己开发Dashboar算是analyst里面技术强的;工作需要产生各种形式的报告;在统计层次上,懂基本t-test和线性回归即可。
(3)数据科学家 Data Scientist
很多人说,我想做数据科学家,我想做机器学习,而这类职位就是大家想象中的那种。此类职位工作内容以高级建模为主,会针对复杂的问题来设计技术方案,比如Uber叫车的ETA、各种定价系统、Airbnb和金融行业的Frau Detection、Amazon物流管理,FB/Linkein的社交网络或者ebay/Airbnb/Uber这样供需双方Marketplace市场规模的实验。这些例子,听上去就不是写SQL能解决的,也不是会写代码就能做出来的,都需要比较深的领域知识。
美国数据科学硕士申请背景及定位
申请MS Data Science 需要什么样的背景?
不论是陆本还是美本,在本科阶段就开设Data Science这个专业的学校并不多,所以大家不要一看自己专业名字和数据科学不搭边就觉得是转专业申请。
首先,本科是计算机科学CS的同学,是最符合申请条件的,因为大多数数据工作都是通过编程和数据库的相关手段进行的,同时学过统计、微积分、高级语言;
例如哈佛大学对于MSDS的本科背景要求是:希望有微积分、线性代数,熟悉概率和统计干涉、能使用至少1种编程语言,例如Python或R,了解计算机科学概念。
其次,本科背景是统计、数学或应用数学,且有一定编程基础的同学也可以申请,这都是很好的专业匹配。
最后,商科背景出身,但量化背景较强的商科专业,比如金工,但又希望能选择一个STEM专业的同学,那DS显然也是个非常好的选择。
所以说,如果你有比较强的编程背景,又有比较好的数理基础,那你就很有竞争力;而纯商科背景的同学,如果没有强的量化背景,或者不懂编程,那建议还是数据科学DS和商业分析BA混合申请,因为商业分析更加偏商科,开在商学院,对商科背景接纳程度大很多。
如何加强背景?
建议可以从科研方面加强,在大学期间最好找和量化相关的科研,如果实在没有,可以把相关的课程大作业拿来用。再退而求其次,也可以是计算机软件、数据库相关。如果没有科研经历,那将是极大地硬伤。
此外,可以参加一些竞赛。竞赛的平台有很多,比如Kaggle、阿里的天池、SODA、WID、数据嗨客等。
最后就是实习。实习最优选择应该是数据公司的数据岗,然而现实是这样的岗位由于太过重要,基本不会招实习生。所以建议找一些统计量化相关的或者计算机相关的实习。
MSDS 怎么定位?
热门的MSDS数据科学专业基本上分布在大城市和名校,但因为专业较新,并没有一套可信的排名。这里罗列一些最热门、也是大家最常申的学校:
美国TOP30院校
开设Data Science项目情况
■ 2 Harvar University 哈佛大学
Grauate School of Arts an Sciences
Master of Science in Data Science
■ 3 University of Chicago 芝加哥大学
Graham School of Continuing Liberal& Professional Stuies
Master of Science in Analytics
■ 5 Columbia University 哥伦比亚大学
① Institute for Data Sciencean Engineering
M.S. in Data Science
② School of Professional Stuies
M.S. in Applie Analytics
■ 5 Stanfor University 斯坦福大学
School: Department of Statistics
Master of Science in Statistics: Data Science
■ 11 Johns Hopkins University 约翰霍普金斯大学
Whiting School of Engineering
Master of Science in Data Science
■ 11 Northwestern University 西北大学
McCormick School of Engineering anApplie Science
M.S. in Analytics
■ 14 Cornell University 康奈尔大学
① School of Operations Research &Information Engineering
Master of Engineering-Data Analytics
② School: Department of StatisticalScience
MPS in Applie Statistics (Option II: DataScience)
■ 20 Georgetown University 乔治城大学
Grauate School of Arts an Sciences
M.S. in Analytics
■ 21 University of Southern California 南加州大学
Viterbi School of Engineering
MS in Computer Science – Data Science
■ 25 Carnegie Mellon University 卡耐基梅隆大学
School of Computer Science
Master of Computational Data Science (MCDS)
■ 25 University of Virginia 弗吉尼亚大学
Data Science Institute
M.S. in Data Science
■ 30 New York University 纽约大学
Center for Data Science
Master of Science in Data Science