简单来说, 生物信息学( Bioinfomatics )是一门利用计算机与信息科学技术研究生物系统规律的学科。
它是一门交叉科学,包含了生物信息的获取、加工、存储、分配、分析、解释等在内的所有方面,需要综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。它已经成为当今生命科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。
生物信息学的学习会涉及生物学、数学、信息学和计算机科学等学科领域的课程学习。其研究内容涉及算法与软件开发、癌症基因组学、药物发现与开发、高性能计算与大数据、基因组、微生物基因组学研究、分子进化、合成生物学、系统生物学等研究主题。
背景-发展起源
生物信息学最初常被称为基因组信息学 。它 由一开始的以 基因组学 为主,逐渐发展出转录组学、 蛋白组学、代谢组学、微生物组学 、 影像组学、脑连接组学、多组学联合分析 等其它多分支研究。
1966年,波士顿医生Victor McCusick基于其广泛收集的医疗记录,发表了《人类孟德尔遗传》一文,文中列举了各种遗传病。此文一石激起千层浪,掀起了一股人们对基因探究的热潮。这种热潮持续升温,到1986年,诺贝尔奖获得者,Renato Dulbecco撰文写到,“如果遗传学家能确定人类基因组序列,那么人类对抗癌症的战争将会加快结束”,进一步震惊学术界。于是1990年,人类基因组计划(HGP)正式启动,历时13年,完成了绝大部分的人类基因测序。在这个过程中,计算机辅助分析的手段被引进到这个领域,于是形成了新的专业,即生物信息学;破译人类遗传信息,对生物医药也产生重大影响,让人们从分子生物的层面上理解癌症、老年痴呆症等各种疾病,也促成医学界的“个人化制药”的发展。
该计划影响深远,今天我们耳熟能详的热门专业,比如生物信息学、分子生物学、药物基因组学、分子生物学等,从某种意义上来讲,都起源于人类基因组计划(HGP)。
申请条件
研究生院校 青睐本科有理工科背景的学生,如生物、数学、计算机、统计学、物理、化学、计算机等等。 一般 要求 申请人 掌握统计概念,如概率和统计推断,拥有计算机科学概念知识,掌握 R 或 Python 或其他编程语言等。
就业情况
部分毕业生就职于 高校、医院、研究机构 , 更多人去了企业类的单位包括 基因测序公司、药物研发公司、医疗 + 互联网公司、养殖企业 等。例如 研究领域偏深度学习的 同学就可以进入 互联网企业,人工智能相关的公司。如,阿里云健康,它也会需要招聘一些生物信息学或者是人工智能背景的学生,然后去做一些人工智能结合医疗大数据的工作 。也有部分毕业生进入了其他的非对口行业,如 互联网公司、 公务员与事业单位 等。
热门项目
1. Harvard University - Biomedical Informatics
开设在Medical School下的Department of Biomedical Informatics(DBMI)中,时长3个学期,暑假可以寻求实习或研究机会。该项目设置了非常广泛的选修课,涵盖哈佛商学院、文理学院、公共卫生等多个学院,可以说是尽可能对学生开放哈佛的课程资源了。整体生物医学的环境非常不错,本身依托于哈佛医学院作为最顶尖机构的学术和资源优势,又有波士顿的地理位置加成。当然,这也是竞争最为激烈的项目了。
申请条件:
多个理工科专业的学生都可以申请该项目,包括但不限于Bioinformatics(生物信息学)、Mathematics(数学)、Computer Science(计算机)、Statistics(统计)、Physics(物理)、Engineering(工程)。
该项目要求申请者具备概率统计和计算机方面的基础,掌握R、Python或其他编程语言。该项目还要求在项目开学时学生必须具备Python 或 R 编程的基本应用知识,包括但不限于熟悉数据结构和类型、设计解决问题的算法以及编写函数、读取和写入数据,或在有限参考资料的情况下创建绘图的能力。当然这些是可以在录取后的暑假自行提高的,学校也会为学生提供一些在线课程及学习资源。
2. Stanford University - Biomedical Informatics
开设在斯坦福医学院下的Department of Biomedical Data Science 中,侧重于信息学和生物计算方面的知识,着重培养学生在生物医学信息的获取、检索和分析上的能力。选修课设置同样很广泛,官网称不受限制。斯坦福的生物医学工程和计算机类专业常年排名世界前列,其学术资源和科研实力毋庸置疑,其生物信息学是同类专业中知名度最高的项目之一。另外就是斯坦福位于硅谷中心的地理位置,也一定可以为学生争取到一些便利。
申请条件:
该项目的申请条件较为宽泛,不要求任何特定的专业背景,但相应的资质也是必不可少的,需要申请学生具备在计算机科学或软件工程、数学(尤其是微积分、概率和统计以及线性代数)和大学生物学方面有很强的本科经历准备。
3. Columbia University - Biomedical Informatics
位于哥伦比亚大学医学中心 (CUIMC) 的生物医学信息学系 (DBMI)下面, 既是纽约长老会医院(大纽约地区的主要医疗保健机构)的学术部门,也是其信息服务合作伙伴。DBMI 是
美国历史最悠久的信息学系之一,开设较早,研究课题涉及临床信息系统的设计、临床自然语言处理的方法、创新信息技术的开发和评估等方面。
对比相似项目区分
生物信息学 和生物统计
Bioinformatics & Biostatistics
二者都是通过数学、统计、计算机的方法来研究生物学的问题。
生物统计比生物信息学早很多,二者最大的区别是样本量。生物统计针对的是小样本低通量数据,生物统计用到的数据结构会很简单,它的定量定性也会做得很好。生物信息学针对的是大样本高通量数据,它去用到的数据会更复杂,定量定性更难做一些。
生物统计学的重点在于 statistics,整个研究过程多数是统计学的知识,只是以生物学为案例。本身对数理的要求较低,主要处理生物数据,多使用 R、SAS、Matlab。多数开设在 Public Health 学院下。生物信息学通常开在生物系或者计算机系,重点在于计算机技术。生物系的生物信息学侧重信息技术在生物学问题上的应用,偏重生物学问题的研究,如进行基因功能富集分析。计算机系的生物信息学的研究方向就偏算法设计,考虑的是信息技术方面的事情,如何设计更合理的算法,加快计算效率等。