什么是数据科学(Data Science)?
随着科技的发展,每天每时每刻都有大量数据被产生和存储下来。如何才能把这些数据变成有用的信息价值被人类所利用,就会通过一系列的收集、统计、整理、分析、挖掘等方法和技术来实现整个过程。数据科学是一门交叉的学科,涉及到很多的领域包括统计学、数学、计算机、人工智能、机器学习、数据库、模式识别、可视化技术等多学科的知识。大数据时代的到来,为各个科学领域带来了新的改革。
数据科学专业的就业前景
全球最顶尖管理咨询公司麦肯锡(McKinsey)出具了一份详细的分析报告,大数据或者数据工作者的岗位需求将激增,其中大数据科学家的缺口在140000到190000之间,对于懂得如何利用大数据做决策的分析师和经理的岗位缺口则将达到1500000!
其中对大数据处理需求最旺盛的行业包括:制药业、计算机软件、互联网、科研、IT技术服务、生物技术。事实上,大数据工作者可以施展拳脚的领域非常广泛,从国防部、互联网创业公司到金融机构,到处需要大数据项目来做创新驱动。数据分析或数据处理的岗位报酬也非常丰厚,在硅谷,入门级的数据科学家的收入已经是6位数了(美元)。
数据科学的三类职业方向机器学习、数据分析和数据科学家
(1)机器学习工程师 Machine Learning Engineer
代表了技术含量较高的方向,工作内容主要是开发机器学习系统和用这些系统解决实际问题。一般需要ship prouction coe,做出来的是数据产品。
(2)数据分析员 Data Analyst
工作内容俗称analytics (prouct analytics or business analytics),从数据中提取insight,估计投资回报比,为产品方向提建议,所用工具一般较基础,比如写SQL query取数据、用R/Python做简单的分析、用Tableau/Excel作图比较常见,能自己开发Dashboar算是analyst里面技术强的;工作需要产生各种形式的报告;在统计层次上,懂基本t-test和线性回归即可。
(3)数据科学家 Data Scientist
很多人说,我想做数据科学家,我想做机器学习,而这类职位就是大家想象中的那种。此类职位工作内容以高级建模为主,会针对复杂的问题来设计技术方案,比如Uber叫车的ETA、各种定价系统、Airbnb和金融行业的Frau Detection、Amazon物流管理,FB/Linkein的社交网络或者ebay/Airbnb/Uber这样供需双方Marketplace市场规模的实验。这些例子,听上去就不是写SQL能解决的,也不是会写代码就能做出来的,都需要比较深的领域知识。