会议回顾|Al 蛋白质组+虚拟细胞系列研讨会:跨越生命科学与人工智能的前沿对话!

2025-10-30

粒曼团队推荐:

2025年是虚拟细胞的元年,随着AI技术的加速发展,虚拟细胞的构建不仅是一个技术突破,更是对生命科学认知的升华。粒曼高通量细胞编辑平台为虚拟细胞的未来发展提供更多的高质量样本及验证方案!

以下文章来源于guomics ,作者Guomics

 

IMG_257

Westlake Symposium for AI Proteomics and Virtual Cell

 

2025年10月8日至9日,由西湖大学医学院主办的 Westlake Symposium for AI Proteomics and Virtual Cell(Al蛋白质组+虚拟细胞研讨会)在杭州成功举行。本次会议汇聚了三十余位来自中外的顶尖学者,共同探讨AI赋能生命科学的前沿突破。会议亮点聚焦双前沿主题:

AI蛋白质组学:深度学习、机器学习在质谱数据分析、蛋白质鉴定与功能预测中的创新应用,特别设立AI Proteomics Competition(AIPC)国际算法竞赛环节

AI虚拟细胞:多组学时间和空间数据整合与细胞建模的最新进展,推动生命系统的数字化解析和预测

来自清华大学、北京大学、复旦大学、上海交通大学、浙江大学、中国科学技术大学、南京大学、中山大学、武汉大学、南开大学、天津大学、香港大学、香港中文大学、香港科技大学、伦敦帝国学院、牛津大学、哈佛医学院、香港理工大学、南方科技大学、西安交通大学、华东理工大学、中国农业大学、中国药科大学、北京协和医学院、首都医科大学、南方医科大学、东南大学、四川大学、山东大学、重庆大学、厦门大学、湖南大学、浙江工业大学、浙江中医药大学、福建中医药大学、浙江理工大学、浙江农林大学、扬州大学、皖南医学院、青岛科技大学、沈阳药科大学、澳门大学、香港城市大学、西交利物浦大学、第四军医大学、海军军医大学(第二军医大学)、空军军医大学、西北工业大学、巴哈瓦尔布尔伊斯兰大学(巴基斯坦)、乌得勒支大学(荷兰)等高校,以及军事医学研究院、北京生物科学研究所、中国科学院上海药物研究所、中国科学院遗传与发育生物学研究所、中国科学院动物研究所、中国科学院大连化学物理研究所、国家蛋白质科学中心(北京)、中国科学院杭州医学研究所、中国科学院大学杭州高等研究院、鹏城实验室、西湖实验室、浙江省农业科学院、北京大学第三医院、湖南省儿童医院、瑞金医院、杭州市第一人民医院、重庆人民医院、中山大学中山眼科中心、浙江省肿瘤医院、深圳市第三人民医院、上海市第六人民医院、Quadram研究所、上海交通大学医学院附属瑞金医院、皮克生物中心(PICB)等科研、医疗机构的近三百位研究者共同参与了此次会议。欧莱雅、华为、Nanomics Biotech、Absea、粒曼生物等企业代表和部分媒体亦出席会议。


与会嘉宾围绕 AI蛋白质组 和 AI虚拟细胞 两大前沿主题进行了精彩分享,内容涵盖生物学、人工智能及数据科学等领域,有力推动了AI与生命科学的深度交叉与融合。参会人员与报告人积极交流,现场学术氛围热烈。


IMG_259
 

Opening

施一公 校长

西湖大学

IMG_261

会议开幕,施一公校长首先对各位嘉宾的到来表示欢迎,并简要介绍了西湖大学。该校坐落于风景秀丽的杭州,是中国近代史上第一所新型研究型大学。西湖大学采用独特的公办民办双重支持机制,是中国高等教育体系改革的先锋。其前身西湖高等研究院于2016年成立,大学始终致力于培养顶尖人才、实现基础研究与前沿技术创新的突破,并通过科技推动人类发展。他还特别提到杭州在人工智能各领域的发展,尤其是在生命科学方面的突出进展。

01 Session1: Proteomcis

郭天南 教授

西湖大学

AI proteomics, virtual cells, and AI proteomics competition (AIPC)

IMG_262

郭天南教授概述了人工智能虚拟细胞(AIVC)计划的最新进展。他系统梳理了关键国际合作、时空蛋白质组学的重大突破以及WAY项目,既阐述了虚拟细胞愿景的重要意义,也指出了实现该目标仍需应对的挑战。他提出了AIVC框架的三大核心支柱——先验知识、静态结构与动态状态,这三者均由闭环主动学习技术支撑。构建此类虚拟细胞仍需先进的AI技术支撑。正如现代生成式AI能将模糊残缺的图像修复为清晰完整的画面,甚至将静态图片转化为动态视频那样,AIVC的目标是从不完整的组学数据中重建细胞的全景动态行为。他们团队已积累大规模时空蛋白质组数据集,基于组织膨胀技术自主研发了 FAXP 平台,在空间蛋白质组学精度方面达到国际顶尖水平。该技术通过物理性组织膨胀(相当于使单个细胞体积扩大约100倍),实现了对单个细胞中3500余种蛋白质的定量鉴定。团队还提出了PMMP范式(扰动—测量—建模—预测)作为预测生物学的系统工作流,为以蛋白质组为核心的虚拟细胞构建提供了原理验证。基于该框架,团队已产生大规模时间分辨扰动蛋白质组数据集(包括ProteinTalks v1.0–4.0),涵盖经数千种化合物处理的泛癌细胞系。最后,在其WAY展望性论文中,他们提出以"虚拟酵母"作为可实操的蓝图,在将AIVC概念拓展至人类系统之前,先通过实验验证该概念的可扩展性。

Prof. Ruedi Aebersold

ETH Zurich

The adaptable, modular proteome specifies AIVC

IMG_263

本次报告中,Ruedi Aebersold教授围绕π-HuB计划(以可数字化方式描绘组织与个体层面的蛋白质组“空间”)展开讨论。π-HuB人体导航的构建将推动对疾病的机制性理解与预测。针对临床试验高失败率的现状,报告提出应以生物学模型的机制探索为核心,而非仅依赖模式识别。为此提出以酿酒酵母为原型的AIVC(AI赋能虚拟细胞):通过基因组和蛋白组的整合,在酵母体系中高密度获取多组学数据,涵盖蛋白、蛋白异构体、翻译后修饰、互作、结构、活性以及RNA-蛋白相关性等。

细胞是一个“复杂适应系统”,涉及多元组分的状态调节、局部互作与涌现行为。案例展示了减数分裂过程中蛋白组与磷酸化组的协同波动,以及从转录组到蛋白组再到磷酸化组的变异映射。与表型距离更近的分子层面更易检测到与生理性状相关的信号。基于此提出以下建议:在同一样本上进行系统扰动与时间序列测量;集中或严格协同数据采集;评估对机制建模最关键的数据类型并迭代优化。酵母将作为AIVC试验平台,其方法学经验可推广至π-HuB,最终提升对人类疾病的精准预测与预防能力。

Prof. Matthias Mann

Max Planck Institute of Biochemistry

Proteomics data generation strategies for robust AI models in biomedicine

IMG_264

Matthias Mann教授的报告展示了他实验室在蛋白质组学技术开发与生物医学应用方面的前沿工作:涵盖基于AI的肽段预测工具AlphaPeptDeep、AlphaNovo实现直接从谱图到序列的“深度学习解码”、利用大规模数据集训练模型,并借助Evosep-Astral平台实现每日500个蛋白质组的高通量产出。团队还通过PELSA化学蛋白质组学、病毒-人类相互作用组图谱、空间单细胞蛋白质组技术及ADAPT-MS机器学习诊断框架等多项创新,充分体现了AI与蛋白质组学在推进虚拟细胞建模和精准医学中的前沿应用与强大潜力。

Prof. Albert Heck

Utrecht University

Tackling a next frontier in proteomics: de novo sequencing of endogenous antibodies

IMG_265

Utrecht 大学的Albert J. R. Heck教授介绍了其团队在蛋白质组学领域的前沿工作:攻克蛋白质组学的下一个前沿——我们对抗体了解多少?利用质谱技术对内源性抗体进行从头测序。该技术能够直接解析个体在应对病原体时产生的独特抗体谱系,有助于识别出用于生物治疗的最佳候选分子。免疫球蛋白是人体内以及血液中含量最丰富的蛋白质之一,在体液免疫系统中发挥着关键作用,能够保护我们免受微生物感染。通过捕获血液来源的IgG1,并采用EAciD碎裂技术以及新型HTA蛋白酶等创新方法,该技术实现了高质量、高覆盖率的抗体序列解析。该方法已成功应用于直接从新冠患者血浆中发现针对新兴变异株(如JN.1)的高效IgG抗体。这些成果表明,该方法作为一种革命性策略,可快速从患者样本中发现高效治疗性抗体,这也是Heck教授创办的Abvion公司致力于实现的目标。

Prof. Uwe Völker

Universität Greifswald

Learning from the genomics community – An avenue to large scale collaboration projects in proteomics

IMG_266

Uwe Völker教授在其报告中,系统阐述了基于人群的组学研究的优势、进展与挑战。他首先指出,该领域已拥有定义清晰、高度标准化的工作流程,强大的国际合作网络,以及成本日益降低的高通量技术,这些是推动发展的关键力量。他以SHIP和UK Biobank等大型队列为例,说明了此类研究如何通过整合多组学数据深刻揭示健康与疾病的生物学基础。教授重点介绍了血浆蛋白质组学的最新突破,指出其通量和覆盖度的显著提升已能支撑大规模队列分析,并揭示了大量与遗传和健康相关的蛋白质分子。他引用跨实验室验证研究,证明即使工作流程不同,通过适当的标准化策略也能实现优异的数据可重复性与可比性。同时,他也坦诚地指出了当前面临的挑战,包括数据共享与隐私保护、样本前处理标准化以及参考样本的缺失。最后,教授展望未来,强调在“大科学”时代,通过HUPO等平台加强国际合作,并建立标准化框架与参考体系,对于实现数据整合、最终实现疾病的早期预警和精准医学具有重要意义。

02 Session2: Biomedicine

Prof. Charles Boone

University of Toronto

A global genetic interaction map of a human cell reveals conserved principles of genetic networks

IMG_267

Charles Boone教授团队系统阐述了从酵母到人类细胞遗传调控网络的深刻保守性。该团队首先利用高通量技术构建了全面的酵母遗传互作网络(CellMap),并开创性地使用深度学习模型(BIONIC)整合多维数据,显著提升了网络覆盖度和功能预测能力。他们成功将此策略应用于人类HAP1细胞,构建了首个大规模人类基因互作图谱。研究证实,人类与酵母的网络在宏观组织原则和具体互作通路上(如ECM9/PTAR1)均高度保守,为利用模式生物系统地解析人类基因功能和疾病机理提供了范例和宝贵资源。

李明 教授

Central China Institute of Artificial Intelligence

University of Waterloo

Deciphering the Human Immunopetidome by AI

IMG_268

加拿大滑铁卢大学及中原人工智能产业技术研究院李明教授作题为《利用人工智能解码人类免疫肽组》的报告,介绍了通过质谱与深度学习全面解析免疫肽组的新策略。李教授指出,免疫系统相关疾病如癌症与自身免疫病均与免疫识别失衡密切相关,而构建完整的免疫肽组数据库对个体化免疫治疗至关重要。他展示了团队在FFPE样本解交联、非经典免疫肽鉴定、PTM识别、AI驱动的肽段搜索与TCR-pMHC结合预测等方面的创新成果,并提出以AI大模型系统性分析免疫肽组、建立公共数据库的计划,为精准免疫治疗奠定基础。

Prof. Brenda Andrews

University of Toronto

Single cell imaging to study proteome dynamics in yeast

IMG_269

Brenda Andrews教授介绍了一个高通量的“表型组学”研究平台,该平台结合酵母的合成致死基因阵列(SGA)技术与自动化单细胞成像,系统地研究细胞结构的动态崩溃过程。研究表明,当扰动必需基因功能时,细胞结构的崩溃并非随机事件,而是通过快速的级联效应,呈现出指数级的加速瓦解。崩溃的轨迹与初始受扰动的生物过程密切相关,例如,抑制囊泡运输会引发急性且广泛的结构丧失。这一结构崩溃的程度和速度,能高效预测细胞的最终死亡。该模型进一步揭示,细胞在自然衰老末期也经历着类似的指数级崩溃,而这一过程往往由线粒体功能的早期缺陷所触发。

Prof. Joseph Schacherer

University of Strasbourg

A deep exploration of the genotype-phenotype relationship through the lens of 1,086 near telomere-to-telomere yeast genomes

IMG_270

Joseph Schacherer教授团队通过对1,086株酵母进行近乎端粒到端粒(T2T)的全基因组测序,深度揭示了基因型与表型间的复杂关系。该团队构建了全面的酵母遗传变异图谱,涵盖SNPs、InDels及结构变异(SVs)。结合转录组、蛋白组等多维表型数据,研究发现纳入SVs和InDels能将模型解释的遗传度提高15%。其分析表明,结构变异不仅与性状的关联更频繁、多效性更强,而且在调控复杂的有机体水平性状(如生长速率)方面发挥着比分子性状更核心的作用,其遗传基础也更趋向于“多基因、微效”模式。这项工作突显了结构变异在解析复杂性状“失踪的遗传力”问题中的关键价值,为相关领域研究提供了新思路。

Prof. Connie Jimenez

Amsterdam University Medical Center

Transformer-based deep learning for next generation mass spectrometry-based phosphoproteomics

IMG_271

Connie Jimenez教授自2006年创立并领导阿姆斯特丹大学医学中心OncoProteomics实验室,致力于将质谱蛋白组学与AI结合。报告展示了如何利用Transformer深度学习模型提升DIA-MS磷酸化蛋白质组学的数据解析能力,包括保留时间、MS/MS与离子迁移预测模型的开发与优化。团队基于大规模数据集训练模型,并推出开源包aiproteomics和iq 2.0,大幅提高蛋白定量算法的速度与精度。研究成果支持大规模精准肿瘤信号通路分析,为个体化癌症治疗提供新思路。

侯靖逸 编辑

EMBO Press

Behind the scenes of EMBO press

IMG_272

侯靖逸是EMBO Press旗下EMBO Molecular Medicine 与 Molecular Systems Biology 的高级科学编辑。她重点展示了两本期刊对系统生物学、计算模型、AI及转化医学的重视,并详细解读了其高效作者友好服务,如“抢先保护”、可转移评审和快速出版流程。演讲中列举的多篇论文,如单细胞蛋白质组学和扰动预测AI模型“PerturbNet”,体现了EMBO Press在推动AI蛋白质组学与虚拟细胞等前沿领域研究中的关键角色,其平台正积极支撑着该领域的创新与交流。

Prof. Bernd Wollscheid

ETH Zurich

Virtual reality: how ML/AI-based strategies can inform about the functional roles of surfaceome protein communities

IMG_273

Bernd Wollscheid教授的报告探讨了如何利用机器学习和人工智能解读细胞表面组(surfaceome)的功能性结构。表面组是细胞表面蛋白质形成的动态群落,其中超过80%尚未被探索。报告介绍了细胞表面捕获(CSC) 和 LUX-MS 等技术,用于绘制表面蛋白及其纳米尺度相互作用的图谱。机器学习工具 SURFY 可预测表面组蛋白,而LUX-MS则能实现光控、时间分辨的蛋白群落分析。应用包括分析癌症(如淋巴瘤、肺癌)、研究神经元发育以及解析免疫治疗诱导的突触。最终目标是构建表面组的虚拟“谷歌街景地图”,以识别新的治疗靶点,并通过合作与大规模蛋白质组数据整合实现这一愿景。

Prof. Ben Collins

Queen's University Belfast

Chemoproteomics in drug discovery – opportunities for AI?

IMG_274

Ben Collins教授介绍了化学蛋白质组学在药物发现中的应用及AI整合机遇。他重点阐述了两种新兴药物模式:靶向蛋白降解(PROTAC)和共价配体,这些策略有望解决传统“不可成药”蛋白的挑战。Collins实验室开发了高通量样品制备和数据采集工作流程,实现了蛋白降解的时间和浓度依赖性评估。他展示了双重全局蛋白质组学和活性探针技术,可在单次实验中同时测量蛋白质丰度和共价配体结合。在AI应用方面,他探讨了AlphaFold3和Boltz-2等蛋白-配体结构预测模型的潜力,提出化学蛋白质组学数据集可用于训练亲和力预测模型,捕获生物学状态依赖的配体结合,为AI驱动的药物发现提供更丰富的训练数据。

王栋 教授

成都中医药大学

Generating large-scale perturbation-induced transcriptome data for drug discovery

IMG_275

王栋教授的报告聚焦于利用高通量转录组技术推动药物发现。他介绍了团队开发的HTS²及新一代HiMAP-seq技术,这两种方法能够在单次检测中分析数千基因在数千样本中的表达,具备高灵敏度、高重复性和低交叉污染特性。基于此,他们构建了CIGS数据库,涵盖超过13,000种化合物在两种细胞系中的约3.2亿次基因表达事件,并展示了其在识别新BRD4抑制剂(如木犀草素)和抗铁死亡化合物(如2,4-二羟基苯甲醛)中的应用。该资源为机制不明确疾病药物开发及中药活性成分研究提供了强大数据基础,也助力AI驱动的药物发现。

岳家兴 教授

中山大学

Universal telomere sequencing reveals hidden diversity underlying genome instability, aging, and cancer

IMG_276

在本次报告中,岳家兴教授介绍了端粒的不稳定性在衰老与癌症的发生发展中扮演着重要角色,然而,现有的测序方法在端粒区域的检测上存在固有局限。岳家兴教授提出了一种通用的端粒靶向测序方法 Termin-Seq,该方法适用于所有真核生物,并在包括人类、酵母和小鼠在内的多种物种中均表现出优异的测序性能。

此外,Termin-Seq还能有效捕捉端粒相关的遗传扰动(genetic perturbations)。将其应用于小鼠衰老研究中发现,随着年龄增长,小鼠端粒长度显著缩短;进一步在癌症细胞系研究中揭示了端粒基因组的不稳定性,且该不稳定性与肿瘤耐药性密切相关。令人关注的是,加入端粒酶抑制剂后可显著缓解奥希替尼(osimertinib)在肺癌治疗中的耐药问题。

刘毳 博士

SCIEX

Ultra-sensitive quantitative proteomic profiling of single or few cells enabled by ZenoTOF 8600 ZT Scan DIA

IMG_277

刘毳博士重点介绍了高性能 SCIEX ZenoTOF 质谱系统,该平台提供成熟的空间蛋白质组学解决方案。最新一代 ZenoTOF 8600 搭载 ZT Scan 2.0 技术,能够实现单细胞及微量细胞级别的超灵敏蛋白质组分析。

Prof. Edouard Nice

Monash University

AI and the route to personalised / precision medicine

IMG_278

Ed Nice教授总结了近年来组学技术的快速发展,尤其是人类基因组和蛋白质组的完成度已超过90%。其中,AI技术在个性化医疗中的应用得到了广泛关注,并推动了跨学科的国际团队合作。他介绍了AI将如何重塑病理学领域,以及病理学家应承担的责任。他还介绍了个性化医疗的市场、蛋白质组学领域的新兴方向以及人工智能实现精准医疗中可能遇到的困难。

03

Session3: AI

Prof. Yasset Perez-Riverol

EMBL's European Bioinformatics Institute

Quantms ecosystem: data, formats and algorithms to generate AI-ready proteomics datasets

IMG_279

Yasset Perez-Riverol教授系统阐述了Quantms生态系统的构建目标与关键技术路线。他指出,当前蛋白质组学数据在规模、格式和质量控制等方面仍存在显著差异,这极大限制了其在人工智能模型中的可用性。为此,Quantms通过标准化的数据结构、可扩展的算法模块以及自动化的处理流程,致力于将原始质谱数据高效转化为“AI-ready”的结构化输入。Yasset Perez-Riverol教授详细介绍了生态系统在数据清洗、保留时间校准、特征提取、定量一致性控制等核心环节中的策略优化,并强调了格式统一在提升数据重用性与跨项目通用性方面的关键作用。此外,Quantms还支持与多种下游机器学习框架无缝集成,为蛋白质组学研究提供了一个高度灵活、可重复的分析平台。该演讲为AI与蛋白质组学深度融合提供了重要的技术路径与实现参考。

Prof. Chris Sander

Harvard Medical School

Machine learning for proteomic perturbation biology

IMG_280

Chris Sander教授阐述了“扰动生物学”的愿景:通过系统性地扰动细胞并测量多维响应,构建可计算、可预测的虚拟细胞模型。他指出,挑战在于超越单一蛋白质测量,整合时序数据与领域知识,以数据驱动方式重新定义细胞过程。其团队利用AI方法(如蛋白质结构预测与设计模型EVcouplings)指导酶工程和药物设计(如靶点灵活性、组合用药),并将范围扩展到疾病预防,例如利用电子健康记录预测胰腺癌风险。最终目标是构建从细胞、组织到器官的多尺度可执行模型,实现从预测到干预的精准医学。

Arunima Singh 编辑

Nature Methods

Publishing in Nature Methods and pursuing an editorial career

IMG_281

Nature Methods 杂志资深编辑 Arunima Singh 博士为会议作了精彩报告,她详细介绍了期刊的主要关注领域、编辑团队构成及文章类型。进一步分享了编辑在审稿过程中重点关注的要素,包括选题(topic)、创新性与重要性(novelty and significance)、实用性与普适性(practical value and generality)、验证性(validation) 以及应用性(application),并系统讲解了 Methods 类文章的写作技巧。

Singh 博士特别强调,Nature Methods 最核心的关注点是方法本身——作者应当 “make the method the star”。此外,她指出,研究者应将工作放在更广阔的学科背景下,不仅要阐述当前的技术前沿(state-of-the-art),更要突出自己的方法如何 超越(beyond) 现有技术;同时应提供直接的比较并展示方法的具体应用。她还提醒,方法的可重复性(reproducibility) 和对编辑、审稿人而言的可理解性(accessibility) 同样至关重要。

此外,Singh 博士还介绍了作为专业编辑的日常工作,以及成为科学期刊编辑所需的经历与技能,如提升写作与阅读能力、持续关注科研前沿动态(keep informed about broad research trends)、并积极与编辑建立联系(network with editors)等。她的分享为未来希望投稿 Nature Methods 或立志从事科学出版工作的研究者提供了宝贵的指导与启发。

Prof. Henning Hermjakob

European Bioinformatics Institute, EMBL-EBI

Reactome 4: pathways reimagined – dynamic visualisation and intelligent chat

IMG_282

Henning Hermjakob教授介绍了Reactome数据库第4版的重要更新,重点展示了全新上线的动态通路图可视化功能,以及集成的智能对话助手,旨在提升用户的交互体验与分析效率。新版Reactome支持通路图的动态重构,并可实现上下游信号传播路径的自动追踪,显著增强了生物通路数据的可视化深度与可解释性。讲座现场还演示了如何通过自然语言提问与平台进行交互,实现对关键分子事件或功能模块的快速定位。这一系列功能的迭代升级,不仅进一步巩固了Reactome作为高质量开放数据库的地位,也使其成为支持系统生物学研究的强大智能平台。

Prof. Wout Bittremieux

University of Antwerp

A living benchmark to advance AI in proteomics de novo peptide sequencing

IMG_283

 Wout Bittremieux教授介绍了一个名为 “A Living Benchmark to Advance AI in Proteomics De Novo Peptide Sequencing” 的平台。该平台提供了29个基准数据集,共包含640万条已注释的谱图,涵盖了多种物种(人类、动物、植物、微生物)、多种酶切方式以及不同类型的质谱仪器。应用场景包括免疫肽组学、宏蛋白质组学、单细胞蛋白质组学、抗体研究以及病毒翻译后修饰(PTMs)。

通过三种主流的蛋白质组搜库工具获得了 ground truth PSMs。该平台同时整合了18种de novo测序工具的运行环境与参数设置,可系统地比较预测PSM与真实PSM 的一致性,并计算肽段和氨基酸水平的评估指标。值得一提的是,这些de novo预测工具会持续更新,使该平台保持动态演进。

总体而言,该平台为基于AI的de novo肽段测序提供了一个功能强大、持续更新的标准化基准体系,为推动de novo测序方法的发展做出了重要贡献。

Prof. Wilson Goh Wen Bin

Nanyang Technological University

Harnessing AI and proteomics for mental health diagnostics and prognostics: Towards scalable care in Singapore

IMG_284

Wilson Goh教授的报告介绍了一个利用AI和蛋白质组学来改善精神健康诊断与预后、旨在实现新加坡可扩展护理的研究项目。报告强调了全球精神健康危机以及对于精准生物诊断和早期干预(特别是对精神病)的需求。

该研究基于LYRIKS研究队列,收集复杂的纵向数据(临床、神经心理、多组学)。其核心方法是开发复杂的数据中心AI算法(如PROJECT, MVIDIA, OPDEA)来分析蛋白质组学数据。这些方法能稳健处理缺失数据,整合多视图信息,并识别与生物学相关的蛋白质特征,这些特征能够预测如精神分裂症和耐药性等状况。最终目标是建立一个国家精神健康蛋白质组学平台,将这些工具与电子健康记录和数字健康数据相结合,从而实现从社区到临床层面的早期筛查、风险分层和个性化治疗。

高歌 教授

北京大学

Towards a causality-oriented Cell in silico: From prediction to design

IMG_285

高歌教授提出了构建一个“面向因果的在硅基细胞”的愿景,旨在从预测走向设计。他指出,尽管多组学技术揭示了细胞作为功能单元的异质性及基因调控的复杂性,但如何解析其内在的因果层级关系仍面临挑战。他的团队主张,将海量组学数据与前沿AI/机器学习方法相结合,构建一套基于数据驱动和知识引导原则的“因果导向生成模型”。这一方法将弥合从数据到认知的鸿沟,最终实现一个“细胞调控语言模型”,从而在计算机中模拟并理性设计细胞的调控行为。

Allegretti Yuan Hu 编辑

Cell Systems

Behind the scenes at Cell Press

IMG_286

本次由 Cell Systems 科学编辑Allegretti Yuan Hu博士主讲的题为“Behind the scenes at Cell Press”的报告,全面介绍了Cell Systems 及其运营模式。作为爱思唯尔旗下机构,Cell Systems 拥有涵盖生命、物理、临床及环境科学等多个领域的广泛期刊组合。

演讲详细阐释了编辑评估稿件的标准与流程,包括研究范围、重要性及方法论严谨性等。同时,重点介绍了为作者提供的多项服务,如预审询、稿件转移以及创新的多期刊投稿系统,旨在提升投稿效率并赋予作者更多选择。此外,报告还提供了关于如何优化摘要、图表和方法描述等实用建议,以助力研究人员更顺畅地在 Cell Systems 这类高影响力期刊上发表研究成果。Cell Systems 期刊致力于通过“定量、基于推断的研究方法”和计算模型来“ rigorous 理解任何生物现象”的定位,与构建AI驱动细胞模型这一前沿领域的研究范式高度契合,是该领域成果的理想发表平台。

周沛劼 教授

北京大学

On the mathemtaical and algorithmic considerations of AI virtual cell construction

IMG_287

周沛劼教授的本次报告主要探讨了AI虚拟细胞(AIVC)的未来,质疑目前对受大型语言模型启发的基础模型的依赖。他认为,AIVC的发展应遵循三个关键原则。首先,使用语义向量的基础模型可能不是完整解决方案,因为最近的基准测试表明它们往往无法超越传统方法,在扰动预测等生成任务上表现不佳。其次,AIVC应该整合生物学先验知识,而非纯黑箱模型——明确建模细胞周期、适应性变化和生长动力学等过程可提高准确性。演讲者倡导"生物学转运"而非单纯的最优传输,使用微分方程结合神经网络来平衡可解释性和预测能力。最后,AIVC代表着向主动学习的范式转变,模型指导实验设计而非被动分析数据。他还提出,在数据受限的场景下,扩散模型可能优于语言模型方法,并介绍了流匹配等无需模拟的方法用于高效生成建模。最终愿景是创建结合生成能力、机制理解和主动实验指导的闭环系统。

孙思琦 教授

复旦大学

A controllable foundation model for general and specialized biomolecular structure prediction

IMG_288

孙思琦教授介绍了IntelliFold,这是一个在通用与专用生物分子结构预测领域取得突破的可控基础模型。他首先回顾了肽段从头测序、蛋白质结构预测技术的发展,并指出在FoldBench基准测试下当前模型在抗体-抗原、蛋白-核酸复合物等复杂场景下面临的挑战。并介绍IntelliFold模型的核心优势:支持蛋白质、核酸等多种模态的高精度预测,具备超快速、低内存的计算效率,并能通过自定义约束精准预测变构位点等关键结构。

温翰 研究员

北京科学智能研究院 / 北京大学

AIVC enabled by multimodal and dynamical foundation model

IMG_289

温翰教授介绍了团队最新开发的大规模核酸预训练模型Uni-RNA。该模型在RNA结构预测与功能注释等任务中表现出色,显著提升了核酸层面组学数据的建模能力。他进一步探讨了大规模基础模型(foundation models)与神经网络动力学在生命科学组学研究中的应用潜力,尤其是在复杂系统建模与虚拟实验模拟中的前景。在此基础上,他提出AIVC有望基于多模态与动态基础模型(multimodal and dynamical foundation models),整合转录组、蛋白质组、空间组学、显微成像等多源异构数据,构建具备时间维度和上下文感知能力的统一细胞状态表示框架。他指出,AIVC的建立将突破传统静态细胞建模的局限,使研究者能够更真实地模拟细胞在多种刺激下的动态响应,为机制探索、药物筛选和疾病建模提供更智能的计算平台。

Dr. Daniel Hornburg

Bruker

Every cell counts, every peptide matters: From large scale studies to smallest single cells, recent advancements in mass spectrometry-based proteomics

IMG_290

丹尼尔博士系统介绍了timsTOF系列仪器的技术特性:其在稳健性、检测深度与灵敏度方面表现卓越,能够规模化支撑生物学研究发现,助力高质量蛋白质组数据的积累。该技术可在多个维度精准区分不同类型的多肽,包括酶解肽段、免疫肽、糖肽、基于ABPP技术的活性探针肽以及化学背景信号。他还详解了不同型号timsTOF的适用场景:在单细胞层面,timsUltra AIP技术通过实现每30000平方微米区域内500个单细胞/秒的检测速率,有效获取空间单细胞蛋白质组数据;而TimsOmni平台则专注于翻译后修饰与蛋白质形态分析,显著提升免疫肽的发现能力。

焦玉霞 编辑

Genomics, Proteomics & Bioinformatics

Publishing with GPB, a premium journal in the omics field

IMG_291

Genomics, Proteomics & Bioinformatics(简称 GPB)是中国国家生物信息中心和中国遗传学会联合主办、牛津大学出版社出版的国际期刊,在 JCR 遗传与遗传学领域排名前 10%,最新两年影响因子为 7.9。执行主编焦玉霞博士在报告中介绍了期刊的定位与特色,强调 GPB 致力于发表全球范围内高质量的多组学研究与技术创新,涵盖综述、观点、原创研究、数据库、网络工具、方法与协议等多种类型。她还介绍了期刊的作者服务与学术活动,并鼓励研究者积极投稿,共同推动组学领域的发展。

IMG_292