统计与数据科学学院本科生论坛第72期顺利举行

发布者:张程亮发布时间:2025-10-28浏览次数:10

9月24日下午,统计与数据科学学院宿鸿特聘副研究员带来的生物大分子功能预测讲座,为我们揭开了生物信息学的神秘面纱。

首先,宿鸿副研究员以经典的 Anfinsen 法则为切入点,清晰梳理了生物大分子 “一维序列 - 三维结构 - 功能” 的核心逻辑链。为了让听众直观感受领域现状,她通过一组组关键数据展开对比:UniProt 数据库已收录 2.4 亿条涵盖 132 万物种的蛋白质一维序列,而 PDB 数据库中已解析的三维结构占比不足 1%,GO 数据库的功能注释更是仅为 0.1%。这种 “海量序列、稀缺结构与功能注释” 的鲜明反差,不仅凸显了生物大分子功能预测的紧迫性,也自然引出了 AlphaFold 这一里程碑式成果。她指出,AlphaFold 由 DeepMind 开发,凭借深度学习技术预测了 98.5% 的人类蛋白质结构,被《Nature》评价为 “解决了生物学五十年难题”,而其成功的关键正在于生物学、数学 / 统计学与计算机科学的深度融合,这也正是生物信息学的核心魅力所在。

在明确 “生物信息学是用计算机理解生命语言” 的定义后,宿鸿副研究员进一步阐述了该学科的应用范畴,从蛋白质结构与功能预测、分子互作分析,到单细胞转录组研究、疾病标志物筛选乃至个性化医疗,让听众全面了解到这一交叉学科的广泛价值。随后,讲座聚焦两大核心科学问题 —— 如何准确预测蛋白质结构与功能,为后续技术讲解搭建起清晰的框架。在分子互作层面,以TBP与DNA、珠蛋白与铁原子结合为例,说明功能依赖分子互作;通过图表揭示宏基因组分析面临的功能注释匮乏困境。

技术讲解环节,宿鸿副研究员详细介绍了团队研究成果:NucBind模型在蛋白质-核酸结合位点预测中表现优异,多数据集AUC值领先;RNAsite模型通过多特征融合提升RNA配体结合位点预测精度;UniOP模型基于基因间距离,实现原核生物功能模块精准预测,在多物种数据集上展现稳定性能。

最后,宿鸿副研究员分享了生物信息学专业就业前景,毕业生遍布科研院所与知名企业,为同学们提供职业参考。整场讲座从基础理论到技术突破,再到应用前景,层层递进,为统院师生带来一场兼具深度与实用性的学术盛宴。

(编辑 林智琪)