科学家最近开发了非常成功的工具,旨在探测活细胞的内部运作。从DNA和蛋白质分子获得序列信息的技术与诸如X射线设备和核磁共振机器的工具一起工作以揭示这些分子的三维构象。更新近的技术,例如DNA微阵列,努力研究细胞内各种蛋白质和基因之间的相互作用。这些调查的最终结果是产生了大量数据。
生物信息学的目标是存储,检索,操纵,可视化,分析,整合和解释来自这些信息源的数据,以便我们能够充分了解活细胞中发生的大量生命过程。即使是非遗传性疾病也需要了解疾病的治愈途径。如果我们要治疗5000种左右的遗传性疾病以及传染病。这些知识的应用包括用于现代药物设计和医学诊断程序的药物设计和医学诊断程序。
生物信息学研究小组目前的研究导致了用于探索所有这些类别数据的计算工具的设计,开发和评估。为了在应用领域有充分的基础,我们与生物学家合作研究我们开发的方法的实际用途。以下是我们目前研究兴趣的简要概述。
· 通过自组装进行生物计算和纳米计算。
· 比较基因组学。
· 基因组分析包括基因预测的统计方法。
· 推断遗传的遗传模式(称为单倍型推断)。
· 生物医学文献的知识推论。
· 质谱数据分析。
· 蛋白质功能预测。
·蛋白质结构预测(包括完整的3-结构和结合位点)。
· 同源搜索和主题发现的软件和理论。
如果过于简单化,我们可能会将生物信息学数据视为处理序列,结构和功能。生物信息学研究小组在序列分析领域产生了特别强烈的影响。这包括理论研究和用于处理序列的应用软件的开发。例如PatternHunter程序[B. Ma,J。Tromp,M。Li,PatternHunter:更快更灵敏的同源搜索。Bioinformatics,18:3(2002),440-445]用于小鼠基因组的初始测序和比较分析[作者,包括D. Brown,M。Li和B. Ma,Nature,2002年12月5日]和大鼠基因组[作者,包括B.马]。最近在ISMB2005上展示的研究:ExonHunter:基因发现的综合方法,B。Brejova,D。Brown,M。Li,T。Vinar,
蛋白质结构的确定提供了关于其功能和相互作用的重要信息,并且对于充分理解蛋白质在细胞内所起的作用是至关重要的。
计算机代数和符号计算小组的主要目标是计算机代数算法的研究和开发,包括符号计算和混合符号数值计算。该组织自1981年成立以来,以创建Maple计算机代数系统而闻名。该小组由George Labahn执导。
目前,该组的主要关注领域包括符号积分,线性微分方程,用于科学计算的混合符号数值算法的开发,微分算子矩阵的代数操作以及包括正规形式和矩阵多项式代数的符号线性代数。该小组成员及其学生开发的算法通常后来被纳入Maple计算机代数系统。
除上述主题外,该小组还对基于笔的设备(包括PC平板电脑和iPa)的数学界面感兴趣。目的是创建允许数学符号的自然二维输入的接口,其允许在这些设备上简单地操纵表达,同时还允许人们利用当今计算机代数系统的能力