大数据(big ata),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产
通俗地讲,是在海量的数据中找出数据的规律和价值。这其中就包含了数据的采集及分析。
数据科学主要研究内容有以下三类:
- Preictive Analytics:分析数据来预测未来可能发生的事情。
- Descriptive Analytics:分析数据找出过去事件的特征和正在发生事件的趋势。
- Prescriptive Analytics:分析数据来找出最佳措施、取得最优化的结果。
数据科学和统计的比较
统计学和数据科学这两个专业都要求一定的数学和计算机能力。部分DS专业开设在统计或者数学系下面。但是两个专业也有一定区别。
先修课:统计专业要求学过除了线性代数、微积分、概率论等等基础课外,还要求掌握统计的高阶课程,比如回归分析、多元统计、时间序列等。而数据科学对计算机背景和技能要求更高,同时要有数学背景,先修课程包括计算机导论,SQL数据库,C++等,数学要求微积分、数学建模、线性代数、概率论等等以及最好有一定工作经验。
从申请角度,统计学大多有自己独立的院系,而DS多数没有,多数在工学院或计算机学院,少数在统计学院。
深入学习角度,统计学比较偏科研,也设有博士学位;而DS则应用导向,如果要读博士一般转到CS。
从就业上差别也不小,统计学家侧重统计和分析数据,进行统计推断。研究重点是对统计方法进行研究和改良,用在计算机建模之后对数据进行描述和解释。而数据科学家则是通过科学的方法,用数据挖掘工具寻找新的数据。数据科学家要求掌握数据库、软件开发等等,对于程序语言R, Python、C++,SQL和Haoop等都要了解,对技能要求更综合。
申请要求
1、 专业背景
常见的专业名称有Data Science,Data Analytics,Big Data等 ,各大学对申请学生有较为明确而统一的要求,大多数倾向录取数学、统计等计量学科背景的学生,同时希望申请人有软件编程基础等。仅仅上过高数、线性代数和概率统计这三门基础课是不够的。如果没有非常强的数理基础,建议申请BA等要求没有这么强的专业。
除此之外,希望申请人有比较强的解决问题和交流沟通能力。工作经验在申请的时候会是加分项。文书中需要注意结合工作,表达对这个专业的理解和看法。如果没有工作经验,建议文书中相关内容强调背景和能力可以胜任这个专业。
2 、先修课
美国大多数院校的数据科学硕士要求:
- 修过计算机基础
- 数学基础(比如微积分、线性代数)
- 熟悉概率论或者统计
转专业的同学可以通过辅修学位、暑期课程、网课等方式尽可能的多学习以上课程,提升自己的竞争力。或者多参与相关科研也对申请数据科学有很大帮助。