大数据时代的到来,数据科学 Data Science 这一领域变得至关重要,毕竟,这是我们未来的所在。
什么是大数据 Big Data ? Gartner 给出的大数据 Big Data 定义是: “ 大数据是高容量,高速和、或高品种的信息资产,需要具有成本效益的创新形式的信息处理,以增强洞察力,决策,和过程自动化。 ”
什么是 Data Science ? 数据科学:处理非结构化和结构化数据,数据科学是一个包含与数据清理,准备和分析相关的所有内容的领域。 数据科学是统计学,数学,编程,解决问题,以巧妙方式捕获数据,以不同方式查看事物的能力以及清理,准备和对齐数据的活动的组合。 简单来说,它是尝试从数据中提取见解和信息时使用的技术方式。
这就衍生了其中一种专业叫数据分析 Data Analytics
数据分析 Data Analytics 是检查原始数据的科学,目的是得出有关该信息的结论。 数据分析涉及应用算法或机械过程来获得洞察力。例如,运行大量数据来查找彼此之间的相关性。它被用于行业,使组织和公司能够做出更好的决策,并验证和反驳现有的理论或模型。 数据分析的重点在于推理,即推断结论的过程完全基于研究人员已经知道的内容。
Data Science 的应用领域
互联网搜索 Internet search
搜索引擎利用数据科学算法在几秒钟内为搜索查询提供最佳结果。
数字广告 Digital Avertisement
整个数字营销使用数据科学算法 - 从显示横幅到数字广告牌。 这也是数字广告获得比传统广告更高点击率的原因。
推荐系统 Recommener systems
推荐系统不仅可以轻松找到数十亿产品中的相关产品,还可以增添很多用户体验。 公司使用该系统根据用户的需求和信息的相关性来推广他们的产品和建议。
Data Science 的课程包括:
The Data Scientist's Toolbox 数据科学家的工具
R Programming R 编程
Getting an Cleaning Data 获取和清理数据
Exploratory Data Analysis 探索性数据分析
Reproucible Research 多次研究
Statistical Inference 统计推断
Regression Moels 回归模型
Practical Machine Learning 实用机器学习
Developing Data Proucts 开发数据产品