数据科学介绍和美国TOP50大学开设情况
数据科学(Data Science) : 是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。 从广义上说,数据科学就是和数据相关的科学研究;具体来说, 数据科学可以从字面上的数据,通过统计推导的知识,计算编程的过程,数据管理策略,相关领域知识和理论,去获得在工作学习中得到结论的能力。
美TOP50数据科学专业开设情况:
USNEWS美国综合排名TOP50中, 有35个学校设置了数据科学硕士专业 。有开设在计算机信息学院下,比如密歇根安娜堡大学,也有开设在统计系下作为统计专业的分支,比如杜克大学,加州大学圣巴巴拉分校,也有在工程学院下。
值得提到的是,在TOP50的数据科学专业设置中,其中南加大和卡耐基梅隆,DS的专业种类和分支是最多的, 卡耐基梅隆一共有六个数据相关专业 ,包括:Master's of Computational Data Science、M.S. in Data Analytics for Science (MS-DAS)、ISM信息系统管理分支下 DATA ANALYTICS、Master of Information Technology Strategy其中一个分支Data Analytics、MASTER OF SCIENCE IN PUBLIC POLICY & MANAGEMENT (MSPPM) 分支Data Analytics、 Master's of Statistical Practice Program分支:Data Analysis,南加大的专业设置类似。
入学时间:
M.S. in Data Science/M.S. in Statistics an Data Science /Master of Science in Engineering (MSE) in Data Science/MS in Analytics/Master of Information an Data Science等,都是数据科学在不同学校的专业名称,DS大多数为秋季入学,也有少部分夏季入学和春季入学。 学制: 数据科学专业院校中,1.5年的学制是最常见的,学制跨度是1-2年,也有同一个学校不同DS专业有1年的课程,也有两年的课程,比如卡耐基梅隆大学。
卡耐基梅隆的统计:数据科学学制:
数据科学VS统计学VS商业分析-之区别
三个专业都是硕士申请的热门专业,申请数据科学的较多会带上统计,而申请商业分析的也会看一看数据分析或数据科学。统计学、数据科学、商业分析专业都需要一定的数学能力和计算机能力。 但从从属院系、先修课程、专业技能、课程设置、升学导向、统计学家和数据科学家、商业分析的职业发展角度来看,都有区别 。
从属院系: 统计学多数都有独立的系,大多归属于文理学院。 数据科学只有少部分有自己的系,大部分属于计算机学院/工学院,或统计系/数学系下。 而商业分析大部分设置在商学院下。
先修课程: 统计学 要求申请者在本科阶段学过基础数学课程,比如线性代数/微积分/数理统计/概率论等,高阶课程比如回归分析/多元统计/时间序列等,其对于计算机技能的要求并不严格,只要有R或Python知识就可以。 数据科学 对于计算机技能方面的要求和数据的背景都比较严格,比如Database/programming/C++等。 商业分析 先修课程要求基本上包括:微积分、线性代数、概率论和统计、计算机语言课程(C语言R语言Python比较常见)、SAS/SPSS软件,部分学校还会要求金融、市场营销和运筹相关课程。
专业技能: 统计更注重计算能力,数据处理能力以及根据数据得出的结果来预测和评估的能力; 数据科学更偏向计算机能力的技能,是凭借计算机的操作来处理数据; 商业分析更偏向利用最佳分析模型来研究和提取有价值的信息,为企业提供和解释解决经营问题方案。
课程设置: 以哥伦比亚大学举个例子
数据科学硕士专业课程列表: 课程涵盖较广,必修课就包括了CS\EN\Statistics:
哥大的统计学硕士课程列表: **** 主要是概率统计等课程,但在Captone里面会 涉及 DA和机器学习的内容。
哥大的商业分析专业课程设置:
升学导向:
统计学可以申请统计学的博士学位,而DS是以应用为导向,如要读博士,多数会转到CS博士学位就读,商业分析也是以应用就业为导向。
统计学家和数据科学家、商业分析就业的角度 :
总的来说,统计学家的工作就是搜集数据,用统计的方法来分析数据,并且进行统计推断。其研究重点在于根据现阶段的统计困难和需求,在理论上对于统计方法进行研究与改良,在用基础的计算机技能建立模型之后,对数据进行描述和解释,给出结论和建议,类似于某个公司的科研顾问。
而数据科学家是用过科学的方法,用数据挖掘工具找寻新的数据。数据科学家要求掌握数据库、软件开发甚至是编程的能力,对于基本的程序语言 R, Python, C/C++, SQL 和 Haoop 都要有了解,要求的能力更为综合。
而商业分析更多的是通过把多方面数据分析中的业务洞察力转换为有形资源,并将统计分析转换为数据驱动的商业只能,从而改善经营业绩。
总的来说,由于商业分析在对学生背景要求来说比较宽泛不严格,课程难度没有统计数据科学来得深,也成为这三个专业中的最“香饽饽”,但申请量太大,特别是美国英国香港新加坡近两年,申请要求水涨船高,面试后拒的也是一大把。
数据科学硕士的申请要求分析
1)申请背景要求
不只一个学校表示,无需特定背景,但是大多学校也表示 招生目标是具有强大数学和统计知识背景和计算机经验的学生 :targets stuents who have strong mathematical an statistical proficiency, an some programming experience。
当然也得看不同学校的DS分支和具体专业,比如刚刚说的南加大和CMU的数据不同专业或分支,有对数理要求更高的,比如 Master's of Computational Data Science 就比 MASTER OF SCIENCE IN PUBLIC POLICY & MANAGEMENT (MSPPM) 分支Data Analytics要求的数理课程更高。在此主要谈DS,有些学校的Analytics专业对于背景和课程要求比较宽泛。
密歇根安娜堡 对于背景的要求: 任何本科背景(主要是统计数学计算机物理工程),但是主要是满足先修课程:
*纽约大学* 对于背景的偏爱: 除了列出的基本数学计算机要求, 更偏爱有机器学习、计算统计、数据挖掘等知识的学生
2)先修课程要求
虽然大多学校没有表明需要特定背景,但其实也是只有部分专业的课程满足DS先修课程的要求(虽然可以通过网课学习,但学习深度大多比不过本科四年的课程),DS的先修课程主要包括两个方面:
1、数理量化 :Calculus微积分, Linear Algebra线性代数 an/or Statistics an Probability 统计概率论
2、计算机 :Python, Java, C+等 有部分学校官网有在线的先修课程可以修读,比如斯坦福,杜克,也有部分可以接受学生在入学前修完先修课程,极个别在入学后的研究生基础课程可以修读,比如密歇根安娜堡。
纽约大学DS对于先修课要求 :(可以通过网课修读)
3)托福和GRE要求 在前40的学校, 托福100+的要求极为常见 ,部分还要求单项25+,对应雅思为7分,单项6.5,极个别的学校也可以接受最低90和雅思6.5的成绩。 GRE来看, 对于2022年秋入学的学生, 不只一个学校表示不需要GRE或者optional ,比如哥大、耶鲁、宾大、杜克等,但是对于2023年,杜克就表示:还没有决定要不要GRE,其实就算不要求,递交申请的90%的同学,毫无例外的其实都有G,DS卷起来还是费劲的。
总体来说, 建议325+为目标 ,弗吉尼亚大学公布的是:均分是80th percentile on the quantitative section an 60th percentile on the verbal section。哥大公布的是:Average GRE: 168 (Q), 158 (V), 3.8 (W)
4)面试和Essay 绝大多数学校没有面试* ,但极个别还是有要求,比如哥大:不仅要求 Vieo Interview 后面还可能要求An interview may be requeste。
Essay大多都是Personal Statement,长度1-2页纸,1000-1500。
CMU的PS要求 : Your Statement of Purpose shoul be a well-written, 1-2 page essay that etails: your motivation for pursuing the MS in Data Analytics for Science egree; prior internship, research an/or programming experience, if any; future career intentions.
5)文书和背景提升 对于文书来说,写作PS和CV来看,软性背景优势很重要,实习和科研是很有效的背景提升方式 ,建议在本科期间或者本科毕业后申请前多参加实习和科研项目 。 这个也可以寻求我们的帮助。
录取案例
学生一:
背景:211大学本科,数学专业,GPA3.4,托福93,GRE325,两实习一科研,programming技能
录取:南加州大学、罗切斯特大学
学生二:
背景:211大学本科,计算机科学专业,GPA3.6,托福106,GRE322,一实习一科研
录取:哥伦比亚大学,纽约大学