有一句话是这么说的:
“过去四十年,决定经济发展的是摩尔定律,而在未来二十年,真正改变经济发展的是大数据。”
因为数据分析,就是传说中预知未来的超能力,所有的公司未来都会是数据公司。
专家预测,到2020年将有40千兆字节的数据存在。德勤机器人的诞生,各大名企裁人风暴的侵袭,CFA新增FinTech考试内容的新政策,高盛转型科技公司的传言…无不证明这个新兴行业所蕴藏的巨大潜力和价值,也无不证明这个行业在商业金融领域正在成为强势的刚需。
2017年是互联网等行业全面转向技术驱动的一年,技术类人才招聘需求已经占到整体人才需求的25%。麦肯锡研究预测,到2018年,仅美国就讲面临14万到19万数据分析人才的空缺,以及全球将有超过150万能够通过大数据分析做出决策和管理的人才需求。在人工智能和金融科技大肆兴起之后,Data Science作为一切的根基,该方面的求职者更是变成了最千金难求的人才!
大数据的时代已经来临,无论哪一个领域对Data Science人才的需求都将是空前盛大。
身边不少商科专业的学弟学妹想搭上这列通向未来的快车,我给他们的建议是:最合适的途径莫过于转战Data Science。毕竟薪资高、发展好、前景强!
所以我说题主真是个小机灵鬼儿呢,有这个远见,就等着拿平均12万刀的年薪吧!

当然,除了远见,还需要实力啦,毕竟大家都可以说想做Data Scientist,没点硬货一切都是纸上谈兵。
那么
从事Data Science需要哪些必备技能呢?
Data Science,实际上就是对数据提取、分析、理解、描述、预测的一门学科。乍一看来数据科学其实很像统计学,但实际上,数据科学应当是数学、统计与计算机的交叉学科。

数据科学类技能大致可分为三类:
- 算法(Algorithms): 数学、统计、算法、模型等理论知识是解决任何数据问题的核心。数据科学背后的算法模型以及数据实验是怎样被设计和检测是必不可少的技能。
- 编程(Engineering): 数据的获取、处理和储存是必不可少的知识。同时,熟练掌握编程语言和分布式计算将帮助你处理大规模的数据。
- 沟通(Communication): 数据在外行人眼中就如同一门外语,如何将数据分析结果转化为可读性极强的商业报告是必须掌握的技能。

优秀的编程能力常常能体现一个人在统计学知识的沉淀,也能展现出他的思维是否严谨。一般具备以下几项能力的求职者,在Data Science领域都能拥有广阔的发展空间,以及令别人垂涎的高薪待遇:
- SQL
- Haoop
- Python
- Java
- R
Payscale网站对在美国和印度拥有这些技术的从业人员的薪资做了详细分析,得出的结果是:


作者:洋小野
链接:https://www.zhihu.com/question/24571587/answer/387031240
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
商科学生转Data Science能做哪些工作?
Data Science 的职位可以分为:
- 除了最适合商科学生的 Data Analyst
- 还有 Data Scientist
- 以及 Data Engineer
- Data Architect
- Data Aministrator
- Business Analyst
- Data/Analytics Manager
- Business Intelligence Manager
以下是各个具体职位对于应聘者技能的要求:
- Data Scientists(制造砖头)
这个职位更经常存在于IT部门,或者干脆自己组成一个部门。职责是解决一切Data Analyst解决不了的比较复杂的问题。且他们通常是不需要负责定期出报告来分析季度数据的。
核心使命: 为公司决策提供服务;主要工作:从Business部门那里收集有趣的/亟待解决的问题。采用科学方法、运用数据挖掘工具对复杂多量的数据进行数字化重现与认识,并据此寻找新的想法的专家。与传统数量分析师相比,他们更多通过关注面向用户的数据来创造不同特性的产品和流程,为客户提供有意义的增值服务。
实际而言,统计分析知识最好要接近于Statistical PHD的等级。
技术知识要能写R,写Python,不仅仅是写普通的统计分析程序,至少要能为这其中一个写点企业专用的Package,最好还能和Data Engineer就数据库和R之间的架构和代码转换问题干上一架。
- Data Engineers(搬砖)
Data Engineer所做的一切都为了Data Management,具体内容包括数据模型、数据架构、数据标准、元数据、主数据、数据治理、数据管控等等。
Data Enginner的目标是把数据整好,存储成本低,查询效率高,至于怎么使用这些数据不是他们关心的范畴。
主要负责:atabase architecture,ata moeling,ata quality check, ata cleaning, ata enrichment/transformation(aggregation, join…) 等等后端的工作。
种类众多,其中机器学习工程师、数据库开发师是两个典型例子。
机器学习工程师 (Machine Learning Engineer) 的核心技能——机器学习,是最近几年非常热门的一项新技术。因此,在未来的几年里,机器学习将会是一个非常有前景的职业方向。其职责包括数据清理、数据分析、模型构建、预测评估及可视化呈现。要求熟练掌握Python、Java等编程语言,熟悉Hive、Storm、Spark等开源平台,熟悉常用的机器学习算法,如随机森林、神经网络、聚类,熟悉图像识别、优化器比较、模型压缩技术等。
数据库开发师 (Database Developer) 是从事数据库管理系统和数据库应用软件设计研发的相关工作人员的统称,他属于软件研发工程师,但又有一部分运维工作的内容。其职责主要包括软件研发以及数据库生产环境的问题优化和解决,熟练掌握Python、C/C++、Java等,了解主流的框架、库使用和原理、计算机数据结构和算法设计,熟练掌握Linux、Web server、数据库、缓存相关技术的使用,掌握数据库基本原理和知识,熟悉SQL语法规则和特点等。
所以除了传统的数据库知识(SAP,Oracle,能编程(SQL, MySQL, JAVA, Python…),大数据背景下,最好要知道haoop相关的技术知识并且不断更新(比如比较热门的:Spark, Kafka, Lamba Architecture…),然后专精一两个。
- Data Analyst(数砖)
Data Analyst偏重于将分析和商业运用相结合,分析只是一个手段和途径,更加重要的是将分析的结果转化为切实可行且能有所成效的商业方案。其核心使命是为公司决策提供服务,因此数据分析师的基本要求是懂企业的业务和数据,具备写报告的能力,考验的一方面是数据分析水平和业务能力,另一方面是沟通能力、理解能力和表达能力。
类似职位的面试有些类似于,基于技术面试题基础上的咨询类型的Case Stuy。从分析中找到可能存在的风险,并提出解决方案比起完美的Coe有时候更加重要。更加适合非技术出身的求职者。
但是同样是做Data Analyst的工作,在不同的公司,要求的技能和工作的内容会很不一样。
微软Online Service Division有跟Marketing更接近的Data Scientist,也有很多学统计或者IE出身的Applie Scientist做ranomize controlle experiment;
LinkeIn、Facebook的ata scientist感觉要求Java编程技术熟练,可能学Computer Science出身的最适合;Insurance行业招的是Preictive Moeler,他们的总体目标就是要基于数据,预测在不同客户身上收多少保险费能最大化收益、optimize profits,所有相关专业的它们都考虑。所以在求职阶段,要根据自身的特长和喜好选择对应公司的Analyst Team;而在求学阶段,更要提早准备好自己的职业发展目标,去有针对性的学习Data的相关专业知识。
Skill Set中对于本行业的了解的重要性要远高于对于统计分析方法的了解的重要性。Excel和PPT肯定要玩得好。Reporting和Visualization工具还是知道多一些的比较好,比如老牌的Microstrategy和比较新的Tableau。
重点是:要能快速的产生漂亮且简单易懂,直切重点的分析报告。其次,你要会用一些工具,基础的比如SPSS,也有人用Excel干回归分析的。或者高级一点SAS,最好还能写点Coe。

- 真实Data职位JD
以下列举了Deloitte, Golman Sachs, McKinsey招聘Data相关职位的Job Requirement



作者:洋小野
链接:https://www.zhihu.com/question/24571587/answer/387031240
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
如何进入这一高薪热门行业?
综上所述,从某种程度上讲,这三类数据科学专业人才有明显的侧重。
- Data Scientists:更注重数学、统计的训练和算法、模型的开发,
- Data Engineer:更注重数据库与编程语言等技能,
- Data Analyst:更注重沟通交流和行业领域技能
但是,任何数据科学专业人才都必须掌握上面说的三大类技能,只有这样才能更好地理解数据科学并运用到解决实际问题中去。
从学习的角度来讲,成为数据科学专业人才所需要的技能不外乎是以下四个:
- 扎实的理论知识(数学、统计、算法、模型)
- 熟练的数据库操作语言(SQL、PL/SQL…)
- 熟练的编程语言(Python、R…)
- 丰富的实战经验(项目与工作经验)
对于学习的顺序问题,应当是:理论 - 编程 - 实战的过程,一个循序渐进的安排会让效率大增。
一般情况下,毕业生入门需要从 Analyst 做起,主要是为 Data Scientist 做基础的数据准备工作。上手之后会逐渐接手一些更偏重分析和建模的内容。
一方面你要有比较强的编程背景,另一方面你要有比较好的数理基础。还要在行业内积攒背景。
如果一点语言基础都没有可以从Pasacal 入手,因为它是一门脚本语言,相对于其他编译语言来说,比较好上手,而且处理数据来说还是有比较大的优势的。
下图就是Career Paths啦:

觉得棒就点个赞吧~
ref:
作者:洋小野
链接:https://www.zhihu.com/question/24571587/answer/387031240
来源:知乎