计算数据科学课程设计旨在培养数学、技术和分析技能,建立解决方案以引导数据驱动的决策。它旨在使学生具备(1) 应用高性能并行和分布式计算进行海量数据操作; (2) 从大型及复杂数据集以数据驱动的统计程序、方法和理论来进行挖掘模式、预测及探索科学的能力。因此,此课程能为学生提供深厚的数据结构和算法基础、并行和分布式计算系统编程、统计建模和分析,以及大规模统计推断。
课程着重强调数据科学的计算基础,深入了解用于存储、操作、可视化、解释和学习大型数据集的算法和数据结构,并提供四个专修范围,供学生根据自己的兴趣选择应用范畴:
- 计算资料科学
- 计算物理学
- 计算医学
- 计算社会科学
课程旨在招收具备优秀英文、数学和理科能力的杰出学生。卓越的学术基础,以及解难思维,对未来理解知识,以至运用计算数据应对各种全球性问题的挑战也极为重要。
数据驱动时代创造了使用复杂的数据分析和机器学习算法与方法进行分析、存储、分发和共享大量数据的强烈兴趣和需求,并在多个学科中应用,包括科学、社会科学、金融、公众健康、医学、工程和电信。我们已经见证了本地和全球就业市场对数据分析师的巨大工作需求。然而,如何设计合适的数据驱动解决方案来分析和推理海量信息仍然是一个不小的挑战,因为它需要深入了解计算和统计原理来解决问题、数据收集、数据建模和分析,和科学的实验设计。