数据科学(下面简称DS, Data Science) 从学科角度出发,它是结合了应用数学,统计,模式识别,机器学习,数据可视化,数据仓库以及高性能计算的交叉学科。数据科学是一门交叉的学科,涉及到很多的领域包括统计学、数学、计算机、人工智能、机器学习、数据库、模式识别、可视化技术等多学科的知识。大数据时代的到来,为各个科学领域带来了新的改革。
核心课程包括数据挖掘、应用回归分析、分析决策工具、商业分析战略等
Programming for Scientists an Engineers为科学家和工程师编写程序
Data Structures for Scientists an Engineers科学家和工程师的数据结构
STATS 510: Probability an Distribution概率与分布
STATS 511: Intro to Quantitative Research Methos介绍定量研究方法
BIOSTATS 602: Biostatistical Inference 生物统计推论
All Stuents must take the following core courses:
EECS 409: Data Science Colloquium数据科学学术报告
就业情况:
数据科学的三类职业方向:机器学习、数据分析和数据科学家
对大数据处理需求最旺盛的行业包括:制药业、计算机软件、互联网、科研、IT技术服务、生物技术
- 机器学习工程师 Machine Learning Engineer
代表了技术含量较高的方向,工作内容主要是开发机器学习系统和用这些系统解决实际问题。一般需要ship prouction coe,做出来的是数据产品。 - 数据分析员 Data Analyst
工作内容俗称analytics (prouct analytics or business analytics),从数据中提取insight,估计投资回报比,为产品方向提建议,所用工具一般较基础,比如写SQL query取数据、用R/Python做简单的分析、用Tableau/Excel作图比较常见,能自己开发Dashboar算是analyst里面技术强的;工作需要产生各种形式的报告;在统计层次上,懂基本t-test和线性回归即可。 - 数据科学家 Data Scientist
很多人说,我想做数据科学家,我想做机器学习,而这类职位就是大家想象中的那种。此类职位工作内容以高级建模为主,会针对复杂的问题来设计技术方案,比如Uber叫车的ETA、各种定价系统、Airbnb和金融行业的Frau Detection、Amazon物流管理,FB/Linkein的社交网络或者ebay/Airbnb/Uber这样供需双方Marketplace市场规模的实验。这些例子,听上去就不是写SQL能解决的,也不是会写代码就能做出来的,都需要比较深的领域知识。
无论是从Finance、Energy、Travel,还是到Government,都应用到了这个学科。
具体岗位可以是:
1.Business Analyst:业务分析师
2.Data Analyst:数据分析师
3.Data Architect:数据架构师
4.Data Engineer:数据工程师
5.Data Scientist:数据科学家
6.Marketing Analyst:市场分析员