
染色质是真核细胞中DNA包装和基因表达调控的核心结构,而核小体作为染色质的基本单位,与各种蛋白质的相互作用决定了基因表达的精确调控。理解核小体结合蛋白的结构特征和相互作用机制,对于揭示表观遗传调控、疾病发生机制以及开发新型治疗策略具有重要意义。然而,传统实验方法在解析这些复杂相互作用时面临成本高、耗时长的挑战。
2025年8月6日,中国科学院生物物理研究所周政研究员与北京生命科学研究所徐纯福研究员在《Nucleic Acids Research》杂志合作发表了题为"AlphaFold-guided structural analyses of nucleosome binding proteins"的研究论文。该研究利用最新的AlphaFold3人工智能模型,对7600多个人类核蛋白进行了系统性筛选,生成了38,390个结构模型,首次建立了一个全面的核小体结合蛋白在线数据库和分析平台(http://bigdata.ibp.ac.cn/ncpbindersdatabase-app、http://bigdata.ibp.ac.cn/analysis-app)。研究团队开发了独创的SF评分系统,用于定量评估蛋白质与核小体的相互作用强度,就像给每个蛋白质与核小体的"握手强度"打分。评分系统整合两个关键参数:一是空间距离约束,用于判断蛋白质与核小体的物理接触;二是置信度参数(PAE和pLDDT),用于评估预测结构的可靠性。确保研究人员能够从海量的预测结构中准确识别哪些蛋白质是核小体的"真朋友"。此外,在线分析平台可接受多种文件格式(PDB、CIF或JSON),为研究者提供了强大的结构分析工具(图1)。
图1 核小体结合蛋白在线数据库和分析平台
AlphaFold2技术自2020年问世以来,已经彻底改变了蛋白质结构预测领域。从最初只能预测单个蛋白质结构的AlphaFold2,到能够预测蛋白质复合物的AlphaFold2-multimer,再到2024年发布的能够预测包括蛋白质、核酸、小分子在内的生物分子复合物的AlphaFold3,这一技术的快速发展为结构生物学研究提供了前所未有的机遇。目前,AlphaFold数据库已包含超过2亿个蛋白质结构预测,为全球190个国家的200多万用户提供免费访问服务。
研究发现,ARID4A和ARID4B被鉴定为新的核小体相互作用蛋白,拓展了我们对核小体结合蛋白家族的认识。 通过实验验证,研究团队证实了ARID4A/4B HBD与核小体酸性片段的特异性结合能力,并鉴定了关键的相互作用氨基酸位点。基于AlphaFold的结构预测和冷冻电镜分析表明,RNF168的二聚化对其与核小体的稳定结合至关重要(图2),为理解DNA损伤修复机制提供了关键线索。这与先前研究一致,即E3连接酶需要与其他结合伴侣形成复合物以增强核小体相互作用。值得注意的是,通过分析多个结构已知的蛋白,研究发现AlphaFold3可以较为自信地预测出已知结构不能提供的蛋白质-核小体作用细节。
图2 ARID4A/4B识别核小体与RNF168的二聚化增强核小体相互作用
该研究建立的计算筛选程序为快速有效地发现和表征核小体结合蛋白提供了新途径。研究开发的可扩展网络工具不仅适用于分析AlphaFold2、AlphaFold3预测的结构,也可用于实验解析的结构分析。这一成果为理解染色质机制和功能提供了重要工具,对于推进表观遗传学研究、疾病机制解析以及靶向药物开发具有重要意义。随着AlphaFold技术的不断进步和更多实验验证的积累,这一在线数据库和分析平台有望成为染色质生物学研究的重要资源。
中国科学院生物物理研究所周政研究员和北京生命科学研究所徐纯福研究员为论文的共同通讯作者,生物物理研究所博士研究生阳鑫和朱浩强博士为论文的共同第一作者。周政组的史刘歆、单珊,生物物理研究所的何顺民研究员、宋廷瑞、宫维斌也参与了该项研究工作。该研究得到国家自然科学基金、科技部、中国科学院战略性先导科技专项(B类)的经费支持,生物物理所蛋白质科学平台、生物成像中心提供了重要支撑和保障。
文章链接: https://academic.oup.com/nar/article/53/14/gkaf735/8223175
(供稿:周政研究组)
附件下载: