南开新闻网讯(通讯员 杨柳青)7月7日,美国著名华人统计学家、美国艺术与科学学院院士、美国国家科学院院士郁彬教授应邀做客南开统计校友论坛,作了题为“数据科学的三个原则:可预测性、稳定性和可计算性”的演讲。
郁彬讨论了数据科学的三个原则在数据驱动决策中的重要性和联系。她指出:预测是检查现实的有用途径,良好的预测暗示着过去和未来之间的稳定;稳定性(相对于数据和模型扰动)也是数据驱动结果的可解释性和可重复性的最低要求,它与不确定性评估密切相关;如果没有可行的计算算法,则不能采用预测和稳定性原理,因此可计算性也是重要的因素。
演讲中,她还结合两个神经科学项目的例子为师生做了深入浅出的说明,进一步提出:以预测为中心,以计算为核心,机器学习已经实现了广泛的数据驱动的成功。此外,她还强调:做科研不等于发文章,应该有自己的创新,不能只看着前人的后脑勺做工作;可以用两三年的时间写一篇让自己骄傲的文章。
演讲结束后,与会老师和同学们踊跃提问,郁彬针对不同问题做了详尽的解答。师生们通过聆听此次演讲更深一步了解机器学习的用途,收获颇多,同时也认识到大数据时代不同方面的技术都将对数据科学产生重要的影响,在未来发挥巨大作用。
郁彬,美国艺术与科学学院院士、美国国家科学院院士、加州大学伯克利分校统计系和电子工程与计算机科学系终身教授,目前的研究集中于解决统计学和机器学习理论、方法和算法,在基因组学、神经科学、精密医学和政治科学方面都深入研究。