哪些专业背景适合申请数据科学专业?
首先,本科是计算机科学 (computer science)的同学,无异最符合大多数数据科学项目申请条件的,因为大多数数据工作都是通过编程和数据库的相关手段进行的,并要求学过统计、微积分、高级语言,如哈佛大学对于mss(master of science in ata science)的本科背景要求是:希望有微积分、线性代数,概率和统计等相关课程,能使用至少1种编程语言,例如python或r,了解计算机科学概念。
其次,本科背景是统计、数学或应用数学,且有一定编程基础的同学也可以申请,这都是很好的匹配专业。
最后,商科背景出身,但量化背景较强的商科专业 ,比如金工,但又希望能选择一个stem(science,technology,engineering,mathematics)专业的同学,那数据科学专业显然也是个非常好的选择。
所以说,如果你有比较强的编程背景,又有比较好的数理基础,那你就很有竞争力;而纯商科背景的同学,如果没有强的量化背景、完全不懂编程,那么可以考虑数据科学(ata science)和商业分析(business analytics)混合申请,因为后者相较数据科学更加偏商科,多开在商学院,对商科背景接纳程度大很多。
数据科学家是什么人?
数据是冰冷的,只有专业人才能使数据有生命有价值
怎样才是数据科学领域的专业人才?什么是数据科学家?
google首席经济学家、加州大学伯克利分校教授哈尔·范里安(hal varian),在2008年10月与麦肯锡总监james manyika先生的对话中,曾经讲过下面一段话:
“我总是说,在未来10年里,最有意思的工作将是统计学家。人们都认为我在开玩笑。但是,过去谁能想到电脑工程师会成为20世纪90年代最有趣的工作?在未来10年里,获取数据——以便能 理解它、处理它、从中提取价值、使其形象化、传送它 能力将成为一种极其重要的技能,不仅在专业层面上是这样,而且在教育层面(包括对中小学生、高中生和大学生的教育)也是如此。由于如今我们已真正拥有实质上免费的和无所不在的数据,因此,与此互补的稀缺要素是理解这些数据并从中提取价值的能力。”
范里安教授在当初的对话中使用的是statisticians(统计学家)一词,虽然当时他没有使用数据科学家这个词,但这里所指的,正是现在我们所讨论的数据科学家。
朝乐门在《数据科学理论与实践》中的定义为:
数据科学家是将现实问题映射或转换为数据问题之后,主要采用数据科学的理念、原则理论、方法、技术、工具,通过将数据尤其是大数据转换为知识和智慧的过程中,为解决 "现实世界中的问题" 提供直接指导、依据或参考的高级专家。
简单的概括,就是能用数据讲故事,能用数据解决问题的人。
数据科学家做什么?
有研究人员以linkeln和百度百聘为数据来源,搜集了2020年3月18至5月28期间,中国、美国、英国、德国、加拿大、日本、澳大利亚和韩国八个国家五种语言的数据科学家招聘公告,挑选出206则具有代表性的招聘公告,提炼出数据科学家的能力要求和岗位职责。
这些职位的主要岗位职责包括:
(a)提出以数据为中心的解决方案;
(b)从海量数据中发现有价值的信息;
(c)面向具体业务的算法和模型研发;
()进行假设检验与试验设计;
(e)数据治理与数据质量控制;
(f)数据产品的研发及基于数据的传统产品的创新;
(g)跨部门和跨领域合作。
具体的能力可以分为与数据科学相关的能力要求以及综合能力要求两类:
数据直接相关的包括计算机科学、数学、统计、数据挖掘、数据可视化、数据管理等等具体能力。
上述与数据非直接相关,但是是数据科学家所需要具备的素质,同时也是企业招聘中所非常看重的能力:包括团队工作中的沟通与合作能力、解决问题的能力、自学能力、细节导向型、抗压和应变能力、领导能力和 数据科学家的3c精神。
所谓数据科学家的3c精神,包括解决问题的原创性﹙creative﹚、思考问题的批判性﹙critical﹚和提出问题的好奇性﹙curious﹚。
部分招聘公告将数据科学家的3c精神称为 "喜欢有挑战的工作" ,且特别提到上述三种精神的“天生"特点,强调应聘人才 对数据问题的热爱和天生才华。
如stanley black & ecker公司要求数据科学家要有天生的好奇心以及对实证研究和解决问题的强烈热情;loblaw companies limite要求数据科学家应具备精湛的分析和批判性思维能力。
这和托马斯和帕蒂尔在《哈佛商业评论》杂志上发表的《数据科学家:21世纪最性感的职业﹙ata scientist: the sexiest job of the 21st century﹚》文章中数据科学家应该具备的基本知识结构与综合能力高度匹配: 他们沉浸在大数据中时能有价值发现,会编写程序代码,永远对数据充满好奇心,并且具备数据分析和交流沟通能力。
作为该专业的申请者,可以反思一下,你是否符合这些特征:
(a)热爱数学,具有良好的数学、统计学基础
(b)敏锐的数据嗅觉,可以不仅可以数据视觉化更能数据“故事化”
(c)优秀的语言学习者,当然“计算机语言”也是其中一种
()充满好奇心,喜欢有挑战性的工作
(e)有能力把想法与其他人去交流 ﹙不是用数学的语言介绍,而是用商业的语言给别人进行交流沟通﹚
如果答案是yes,那么恭喜你,你将会是潜在的优秀数据科学家。
据统计,数据科学家一般都具有高学历—— 88%的数据科学家至少是硕士学位 ,46%的数据科学家是博士学位。
这表明想要成为一名数据科学家需要非常好的教育背景,那么取得此相关专业的硕士以上的学位将会是必须,接下来你只需静下心来,了解关于数据科学研究生硕士申请的更多信息,并做好相应的准备,稳扎稳打,朝着你的目标前行。
美国数据科学硕士专业介绍
在过去10年里,美国大学陆续开设200多个与数据科学有关的硕士专业。尤其是近几年,开设了数据科学、商业分析和数据分析专业的学校数量更是井喷:
开设数据科学硕士项目的美国大学保持持续增长。目前top 50院校中开设数据科学硕士专业的学校达21所。
美国的数据科学硕士专业一般开设在计算机学院、工程学院、数学、统计学院或者系下。设立在多个学院是因为这个专业本身属于交叉学科,包含了计算机,统计,数学,和应用领域的学科。
如果要说区别的话,计算机学院的培养方案当中,可以更多利用学校计算机的资源。
比如卡耐基梅隆大学的数据科学专业开设在计算机学院下,学生除了5个核心课程外,其余的课程可以在卡内基梅隆的计算机学院下开设的超过600门课中进行选修,当然项目对学生的计算机背景会有相对更为严格要求,卡内基梅隆的数据科学硕士要求其必须在项目开始前完成相应的计算机系统的课程,包括对往年录取学生的背景分析,具有更强计算机背景(包括本科专业,以及计算机实习或者项目经验)会更受招生官的青睐。
数学学院的培养方案,多从数学学科出发,更注重的数学方面的理论基础, 因为院系的师资力量就决定了课程设置。
例如纽约大学的数据科学硕士(master’s in ata science)就是设立在纽约大学数据科学中心下(the center for ata science ,简称cs),cs附属在著名的库郎数学科学研究所 ,对申请者数学背景(本科数学科目gpa、gre数学部分的成绩)较为看重,往年录取者gre数学平均分在168分以上。
总的来说,数学给到大数据的理论性支撑会更多,而具体的大数据平台开发等,需要依赖于计算机语言去实现,比如说java、python等。
大家在进行院校和项目选择时可综合考虑院校的师资力量、课程设置、就业等等各方面因素去抉择。
数据科学课程设置
有研究人员针包括加州大学伯克利分校、纽约大学、卡内基美隆大学、哥伦比亚大学在内的授予数据科学硕士学位(master of science in ata science)的18所高校的课程设置进行了研究,针对其课程设置,可以将其分为四类:
①理论类 ,包括数学与统计学原理、数据科学概论、计算机科学概论等基础理论课程;
②技术类 ,包括系统构建、数据计算,以及数据采集、存储、组织、检索、应用等过程所需的技术;
例如机器学习、数据库、数据挖掘和数据建模,旨在帮助学生掌握python/java/pig/hive等编程语言,提高学生应用分布式文件系统工具的能力,提高学生的数据分析能力。
③应用类 ,指数据科学的跨领域应用研究课程;
因为数据科学可用于各个行业,因此方向类课程也是每个学校的特色,例如哥伦比亚大学的mss有开金融量化大数据分析、可持续发展智慧城市大数据分析、生物信息大数据;斯坦佛大学开的数据驱动医疗课程,视觉识别神经网络、地理统计信息等都非常有趣。
④实践类 ,包括课程实验、专题研讨与实用技能培养相关的课程。
调查的高校共开设必修课程202门,其中,理论类课程47门、技术类课程122门、应用类课程14门、实践类课程19门。美国数据科学硕士专业重视基础理论知识和学生技术能力的培养,其中,特别重视数学与统计学原理、机器学习、数据挖掘、数据分析、大数据相关课程。
而应用类及实践类课程在数据科学专业人才培养中具有重要作用。大多数高校要求学生在结业之前完成类似于国内的毕业设计、毕业实习的 顶点项目﹙capstone project﹚ ,学生以小组或个人的形式直接参与项目,待项目完结后上交项目报告并进行项目汇报。
如纽约大学要求学生对工业、政府机构、非政府机构或学术界存在的真实问题进行研究,学生需要参与项目的整个流程,从数据采集、数据处理、数据分析到提供解决方案。同时,学校为每个团队配备1名项目咨询老师,并且大部分的原始数据由项目赞助人﹙企业、机构等﹚提供。

如果您有任何留学、签证疑问,欢迎您的咨询,希望我的专业能帮到您!