动力学的数据科学及生命科学应用

发布者:文明办作者:发布时间:2021-12-07浏览次数:10

  

主讲人:陈洛南  中国科学院上海生命科学研究院研究员

  

时间:2021年12月10日9:30

  

地点:三号楼332会议室

  

举办单位:数理学院

  

主讲人介绍:陈洛南教授现为中国科学院上海生命科学研究院研究员,系统生物学重点实验室执行主任,国家重点研发计划首席科学家。陈洛南教授研究领域涉及计算数学、系统生物学、系统科学、非线性动力系统、生物信息学等。近五年来,在计算数学、系统生物学等研究领域发表研究论文100余篇,出版专著11部,在相关研究领域具有相当的国际学术影响力。  

  

内容介绍:高通量组学技术的兴起为研究包括复杂疾病研究等提供了大数据的支持,这些不同来源、不同层面、不同尺度的数据组成生物医学等的多元异质大数据,具有很强的时空动态性。这些特性使得我们迫切需要研究数据时空特性的动力学分析方法,如基于动力系统的临界点预警方法、基于空间信息与时间信息转换的时序列预测理论、基于嵌入理论的因果关系推断算法等。这些基于动力学的数据科学新理论与新方法能够帮助理解和预测复杂系统的动态发展,有助于分析复杂动态过程和机制,加速包括生物医学及人工智能等研究领域的步伐。特别是,复杂疾病系统发生发展过程普遍存在非线性临界现象,如何从网络或系统层面,科学地量化这样的临界点对于实现疾病的精准预测和疾病预防具有重要意义;空间-时间信息转换与因果推断方法也可广泛应用于癌症转移与复发,干细胞分化的动态机制,公共卫生实时监测、亚健康状态预警、时间序列预测、AI研究等方面,这些理论和方法对动力学驱动的数据科学理论和算法发展有重要的推动作用。主要内容包括:(1)基于动力系统临界期的低维特征,建立复杂疾病过程的临界理论及动态网络标志物方法:建立复杂疾病及动态生物过程的临界状态的预测方法和理论,特别是建立了基于大数据检测临界状态的必要条件及其动态网络标志物(DNB:  Dynamic Network  Biomarker),不仅可应用到肝癌转移前兆诊断、糖尿病临界检测及药物拮抗动态过程等研究,而且也可应用到生态系统及金融系统等的风险分析和临界预测。(2)基于吸引子低维特性,建立短时间数据的时间序列预测理论:基于非线性动力学的随机嵌入理论(RDE:  Randomly Distributed  Embedding)和方法,建立空间信息和时间信息的转换,最终使得高维短序列时间序列数据的预测成为可能。从系统的角度,建立了基于动力学的机器学习理论和方法(ARNN:Anticipated  Learning Machine or Autoreservior  Computing)等,由小样本可实现时间序列的预测和学习。(3)基于动力系统的生灭过程理论,建立非平衡稳态的势能景观(landscape)方法:利用扩散图理论和散度定理,提出了描述生灭过程(birth-death  process)的随机动力学系统的势能函数的数值计算方法,实现了由观测非时间序列数据建立该系统的势能景观。该算法已用于干细胞分化的干性评估和伪时间轨迹分析等问题研究,为理解细胞分化的分子机制研究提供了方法学基础。(4)基于单变量的系统稳态动力学的拓扑重构,建立Partial  Cross-map(PCM)的因果推断方法:利用非线性动力学的嵌入理论(Delay embedding),由cross-map or  cross-prediction建立动力学的因果关系理论和方法,并应用于基因调控网络及生态系统的因果推断等研究中。