查看原文
其他

nextPYP:单颗粒cryo-ET成像的原位蛋白质异质性解析平台

徐艺然 北京生物结构前沿研究中心
2024-08-30

星标,再也不怕错过更新!方法见文末动图。

冷冻电镜断层扫描(Cryo-ET)是一种新兴技术,通过在原位、冷冻状态下拍摄一系列标本的倾斜图像,揭示蛋白质的结构以及异质性。特别是单颗粒冷冻电镜断层扫描(SP-CET),可以绘制高分辨率图谱,成功应用于体外重组生物系统和细胞内亚细胞复合物的研究。目前如冷冻聚焦离子束(Cryo-FIB)样品制备和光束-图像偏移并行数据采集,大大提高了数据采集效率。然而,数据处理仍面临挑战,复杂的程序和高计算要求使得进展缓慢。优化的SP-CET策略虽然节省了存储空间,但在实际应用中仍存在瓶颈,缺乏统一的数据处理平台使得不同步骤的组合受到阻碍。


为了克服这些挑战,2023年10月Nature Methods介绍了一篇题为“nextPYP: a comprehensive and scalable platform for characterizing protein variability in situ using single-particle cryo-electron tomography”的一种可扩展的端到端SP-CET数据分析框架。该框架涵盖了从倾斜序列的即时预处理到高分辨率细化和分类的全过程,能够对包含数百个倾斜序列和数十万个粒子的数据集进行高效分析和可视化,为高分辨率蛋白质结构解析和生物医学研究提供了强有力的支持。目前算法工具都集成在软件包 nextPYP 中,其具有易于使用的图形用户界面(GUI),为用户提供了直观的操作体验。




方法介绍

1. 倾斜序列的即时处理

在高通量采集过程中,监控数据质量对于断层扫描尤为重要,因为数据是从样品的同一区域采集的一系列投影。这需要满足严格的跟踪和散焦要求,以确保数据的完整性。为此,作者开发了强大的倾斜序列即时处理程序,可生成颗粒和元数据,用于SP-CET精炼。数据预处理策略包括以下步骤:(1) 增益校正和视频帧对齐;(2) 使用基于靶标或斑块跟踪的方法对齐倾斜序列;(3) 倾斜CTF估计;(4) 层析图重建;(5) 颗粒拾取。该工具支持数百个倾斜序列的分析,并为高分辨率和构象变化分析生成必要的元数据。

图1 端到端的单颗粒冷冻电镜断层扫描流程


2. 基于粒度的颗粒拾取

在单颗粒冷冻电镜中,基于粒度的策略可有效从单分散样品中拾取颗粒。虽然断层扫描样本不是单分散的,但这些技术仍然有助于从体外样本或原位成像的核糖体等大型复合物中拾取粒子。作者在二维粒子拾取方法的基础上,提出了基于尺寸的粒子检测方法,通过低通滤波突出特征,并进行局部最小值检测去除弱峰。预处理步骤自动检测污染区域,避免从这些区域拾取颗粒。这种方法只需指定颗粒大小,运行时间仅为几十秒。


3. 膜约束模板匹配

为了处理更广泛的层析成像样本,nextPYP采用了三步策略查找附着在病毒或脂质体表面的原生膜蛋白。首先使用Hough变换确定病毒位置,然后使用密度驱动的最小曲面对每个病毒进行三维分割。最后,进行受限模板匹配,搜索范围仅限于分割膜外区域,从而加快方向搜索速度。


4. 利用深度神经网络进行半监督粒子拾取

作者利用深度神经网络实现了半监督粒子拾取策略。这些程序只需一组稀疏标注即可在几分钟内完成训练。nextPYP的图形用户界面支持在三个维度上进行交互式标注和评估粒子提取结果。


5. 利用SP-CET确定结构的可扩展框架

为了减少传统STA工作流程的存储空间占用,nextPYP直接从未经处理的原始倾斜序列图像中读取数据,节省数TB的存储空间,简化数据管理,并提高处理速度。倾斜序列以束为单位处理,每个束只保存一个中间三维重建到永久存储,然后合并到最终三维地图中。这种模块性非常适合在集群环境中使用,避免了频繁访问网络文件系统带来的性能瓶颈。


图2 使用SP-CET进行原位结构测定的可扩展架构


后面还包括粒子姿态的完全约束细化、从二维投影进行基于参照物的姿态估计、基于区域的约束投影匹配、基于粒子的CTF完善、视频帧细化和自调整曝光权重等等。



方法验证

作者从多个基准数据集验证了nextPYP在高分辨率结构解析和异质性表征方面的强大能力。


1. 使用HIV-1 Gag基准数据集进行验证

首先,通过即时数据分析例程对超分辨率模式下的倾斜序列进行预处理。自动检测HIV-1病毒的位置,进行三维分割并选择粒子位置,然后使用法线将基于参照的搜索限制在单一平面内角度。经过多轮基于区域和粒子的细化及CTF校正,从五个倾斜序列中提取的14,482个粒子绘制出了3.2 Å分辨率的图谱。使用整个±60°范围内的投影进行三维重建,最终从43个倾斜序列和109,496个粒子中获得了3.0 Å分辨率的图谱,与其他方法相比,粒子数量减少了16%-24%。该过程无需提取子卷或保存图像堆栈,节省了约25 TB的存储空间并加快了处理速度。


图3 HIV-1 Gag和载铁蛋白体外样品的分辨率改进和验证


2. 小鼠重链去铁蛋白的亚2 Å结构

作者还使用从EMPIAR-11273下载的铁蛋白倾斜序列对nextPYP进行了验证。通过基于斑块的跟踪技术预处理了100个原始倾斜序列,进行倾斜序列配准。使用二维数据进行基于参考的搜索,经过多轮完全受限和基于区域的细化,最终得到了1.8 Å分辨率的图谱。


3. 从体外80S核糖体中分离翻译状态

作者在体外80S核糖体的倾斜序列上验证了其分类方法。首先从约4,000个颗粒中获得了一个5.6 Å分辨率的共识图,然后通过多次迭代将其三维分类为代表不同翻译状态的五个类别,并进一步细化分类。


图4 哺乳动物80S核糖体的限制性分类


后面作者还对肺炎支原体细胞核糖体的异质性进行了分析,以及从原位薄片的数据明确了不同翻译状态的80S核糖体构象。


总的来说,作为一个易于使用的SP-CET数据分析平台,nextPYP旨在促进结构生物学界对该技术的采用。而其提供的技术和新方法、强大的即时预处理策略等等,也被证明了在实现高分辨率和揭示原位核糖体翻译状态方面的有效性。


尽管nextPYP成功克服了SP-CET数据分析的瓶颈,大多数数据集仍需多节点计算机集群或云解决方案支持,特别是基于参照的三维重建需要对粒子姿势进行详尽采样。未来的工作将减少计算负担,设计高效搜索策略,实现稳健的ab initio重建。这些进展将加快原生样本的结构分析,推动可视蛋白质组学的发展。



供稿 | 徐艺然

责编 | 囡囡

设计 / 排版 | 可洲 王婧曈






微信号:FRCBS-THU

因扫码入群人员已满,可扫码添加中心官方微信号,管理员邀请入群

原文链接

https://www.nature.com/articles/s41592-023-02045-0


精彩回顾

精彩回顾



特别提示

微信公众号又双叒叕更改推送机制了,不是星标的订阅号,收到推送内容的时间会有延迟,甚至根本无法收到最新推送!不想错过FRCBS最新资讯,快来设为星标吧!

方法超简单,只需3秒钟!


点击上方卡片

关注我们吧


THE END

我知道你“在看”


继续滑动看下一个
北京生物结构前沿研究中心
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存