亲和纯化质谱(AP-MS)和蛋白网络分析蛋白互相作用

随着样本富集和分离色谱方法的提高和改进,以及质谱分析的分辨率和灵敏度的提高,亲和纯化质谱(AP-MS)研究产生了大量信息丰度的数据,详细说明了各种生物体和生物系统中的蛋白质-蛋白质相互作用。这些相互作用有助于描述蛋白质的功能,提供蛋白质复合物和生物过程中所涉及的蛋白质的详细目录,并能提供全蛋白质范围内的生物过程网络。

分析蛋白质的相互作用可以洞察蛋白质之间的功能关系。例如,协同调节的代谢酶之间的相互作用可以揭示高阶非共价蛋白复合物的组装。蛋白质-蛋白质相互作用也可以揭示底物和翻译后修饰酶(如激酶、磷酸酶如激酶、磷酸酶"、乙酰转移酶 和蛋白酶)之间的关系,或者与调节核心复合物的特异和激活的结合。并且有研究对宿主和病原体之间蛋白-蛋白相互作用的分析,获取了关于病原体如何利用细胞过程进行自身复制、分裂、出芽、入侵和免疫逃避的新证据。蛋白质-蛋白质相互作用的分析是正交的,但对遗传相互作用实验是互补的。两种方法都提供蛋白相互作用以及功能关系的蛋白信息。

AP-MS已经成为发现蛋白质-蛋白质相互作用的标准方法。传统的方法是将天然蛋白免疫沉淀与质谱检测结合,然而AP-MS方法使用感兴趣的诱饵蛋白上的表位标签和捕获探针来识别协同的猎物蛋白,而不需要为每个新的诱饵蛋白购买或者开发特定抗体。此外,如果表位与相互作用所需的蛋白质界面重合,针对感兴趣蛋白质或诱饵的抗体可能会破坏蛋白质与蛋白质相互作用。亲和标记在酵母中应用最为广泛,70%以上的表达的蛋白可以用蛋白网络图呈现出来,通过聚类和网络分析可以确定出500多种蛋白互作复合物。

AP-MS方法设计的第一步就是选择感兴趣的蛋白质,可以被用来研究蛋白质-蛋白质相互作用网络图的诱饵蛋白。它们一定是一组能够最大可能性的识别交互特有的诱饵蛋白的那一类蛋白质。例如,如果诱饵蛋白含有一个RNA结合域,那么有一个可以对RNA结合域进行负作用调控的区域。与通常能够与RNA结合的蛋白相比较,这种方法有助于识别与感兴趣蛋白唯一相互作用的蛋白质。

在每组诱饵中,包括一个阳性组和阴性对照组。阳性组诱饵蛋白可能是之前一种经过AP-MS分析的蛋白,通过相互结合实验确定了一组高度可信的相互作用蛋白。GFP作为一种推荐的阴性对照诱饵,这种诱饵在大多数生物中不会产生特定的蛋白相互作用,与该蛋白的任何相互作用都可能与标签或者树脂捕获系统有关

理想情况下,诱饵蛋白会在互作蛋白组的背景下进行表达,然而一个需要考虑到的点是AP-MS质谱分析所需的输入材料相当的大(<2500万细胞可产生微克级别表达的诱饵蛋白)。因此为了快速高通量的筛选的目的,瞬时转染表位标记蛋白是一种快速的方法,也可以通过诱变或者替代标记的策略进行遗传操作。

不幸的是,适用于瞬时转染的细胞种类有限,因此根据研究的规模,需要产生一个相对稳定表达诱饵蛋白的细胞系。

稳定细胞系可以被细胞工程进行诱导表达,例如使稳定表达Tet抑制蛋白的细胞系。这种方法可以优化诱饵蛋白的表达,使其接近内源性表达水平。

工程稳定表达系统可能需要开发多个克隆来选择最佳表达水平,这通常需要耗费较多时间。另一种可能则是在HEK293等异种表达系统中表达纯化一种诱饵蛋白,然后将诱饵蛋白与所需的裂解液在反式培养基孵育。这种方法不太理想,因为感兴趣的蛋白在体内不表达,而是在体外提取与分离蛋白结合,因此需要在裂解液中形成相关的相互作用。

基因组工程方法,如CRISPR或TALEN技术,也可以在亲和表达系统中考虑使用。这些方法有助于将亲和标签直接融合到基因组中相关蛋白位置,从而维持基因组上下游来调节内源性基因表达水平。目前,这些方法成本费用都比较昂贵。然而它们本身也在迅速改进,几年内可能成为许多实验室的标准程序。

许多合成的或自然发生的亲和标签已经在AP-MS研究中实现,常见的表位标签包括FLAG、Strep、Myc、血凝素、proteinA、His6-tag、钙调蛋白结合蛋白、GFP和麦芽糖结合蛋白。在某些情况下,会将多个标签融合在一起。例如某些会包括5个2种类型的串联亲和标签。

早期的AP-MS方法使用串联亲和标签来进行联系的APs,得到可以被MS鉴定的高纯度蛋白复合物。利用MS平台分析复杂蛋白混合物的能力有限,这导致纯化过程中非特异相互作用蛋白使得对真正蛋白复合物的识别变得困难。然而,更严格的纯化程序通常需要实质上更多的原料和包括严格的洗涤步骤。不幸的是,这些严格的条件可能会排除识别短暂的或与低丰度蛋白质发生的相互作用。

越来越多的如今的质谱平台在表征复杂蛋白质混合物检测越来越敏感。与此同时,使用单步提纯程序、磁珠而不是琼脂糖树脂(更快的洗涤时间)、细胞颗粒的低温裂解或者色谱策略(微流控设备),都可以提高样品回收率和捕获瞬态相互作用的操作速度。不幸的是这些方法也增加了非特异性结合蛋白在质谱分析的检测信号程度。因此,蛋白网络分析的挑战性已经从优化获得高纯度蛋白复合物的方法转移到开发生物信息学方法来区分真实的蛋白质相互作用和背景。

一般通过溶液中洗脱纯化物,而不是通过煮沸亲和纯化树脂与SDS样本缓冲液之后,通过在凝胶中分离。首先保持样本在溶液中纯化的策略通常使用竞争洗脱来特别地从树脂中洗脱诱饵蛋白(例如,用Flag多肽从树脂中将其竞争洗脱下来。)用SDS样本缓冲液洗脱是高度非特异性的,包括与裸亲和树脂非特异结合的蛋白质。其次,凝胶内消化过程"既耗时又低效。

凝胶电泳和银染色被用来检测表达和亲和纯化的质量,以及洗脱液的复杂程度。虽然质谱仪的灵敏度以及超过了银染色,但在检测分子量标记的诱饵蛋白上的条带几乎总是容易被银染色检测出来。此外银染凝胶的可用性允许质谱确认鉴定蛋白的真实分子量,这样,选择性剪接形式或其他修饰蛋白可以被准确鉴定。

样本制备方法是相当标准的操作流程,一般包括用尿素或盐酸胍等使蛋白质变性,用还原剂还原二硫键,用游离半胱氨酸残基烷基化和用胰蛋白酶或LysC等替代蛋白酶进行蛋白水解消化。在进行消化后,样品通常用C18柱子进行脱盐处理,以除去盐和其他消化杂质。

通常,用于AP-MS分析的质谱平台是LC-MS/MS实现的。有无数的平台能够鉴定蛋白质,其中大多数包括一个预装柱配备C18色谱柱,这些柱子以有机梯度分离肽段,并将其直接洗脱到与纳米电喷雾源耦合的质谱仪中进行电离。数据通常在短时间内进行收集,质谱的最大数量的数据采集的标准方法获得的。高分辨和高质量精度系统已经在许多研究中使用,但它们不是绝对必要的。对于大多数AP-MS应用,低分辨率的质谱系统也非常优秀,而且它们通常比高分辨的系统更敏感。需要高分辨系统的情况包括评估蛋白质相互作用的定量差异,例如蛋白质相互作用对药物的反应,或者比较可能导致蛋白质相互作用发生更微妙变化的蛋白质突变。

将质谱原始数据与肽序列匹配可以使用多蛋白质组软件包进行,这些软件包括对正确肽识别和蛋白质推断概率进行排序以及适当的评分。通常软件包括Mascot、SEQUEST以及开源的Maxquant等。这些数据库搜索程序都适用于进行质谱数据处理,通常来说蛋白的假阳性率为1%是较为能够接受的。

这些步骤完成之后,通常会给列出每个样本中所鉴定到的所有蛋白和肽段信息,以及支持鼠搜索的统计数据报告给出质量评估。谱图数目(Spectal Control)近似于样品中相对蛋白质丰度,可用于多个AP-MS实验中蛋白质富集的比较统计分析。对于从高分辨仪器商获取的数据,可以利用无标记定量结果LFQ,就是特定肽段的强度或者峰面积进行相对定量。

虽然AP-MS可以揭示相互作用的蛋白质,但它不能完全详细说明蛋白质复合物的组装。这一限制是因为AP-MS不能轻易区分直接和间接的相互作用(即诱饵和目标蛋白之间的中间相互作用蛋白),而且它是不能分解可能参与多种不同复合物和细胞功能的高度连接的蛋白。此外,AP-MS受到生物化学的限制,不需要捕获自然生理状态下的蛋白质,也不需要考虑细胞的其他特征。这些限制可能会产生误导的结果,随着定量蛋白质组学的方法的引入,复杂组分的集合率、稳定性和化学计量。然而,还需要更多的实验来阐明复合物形成的分子相互作用。通过双杂交法或相互作用的互作分析方法,可以帮助解决蛋白质-蛋白质的直接相互作用。为了达到更高的分子精度水平,可以使用高分辨率的生物物理分析,如量热法、沉降分析、荧光检测、表面等离子体共振等结构学方法。

分析AP-MS数据评分的基本目的就是确认细胞功能的假设,这可能涉及到用已知的交互来丰度数据,或者确定特定交互或者交互组的功能,在我们的方案中,我们假设诱饵蛋白独特而独立地与每个目标蛋白结合。对于我们的低密度数据,下面列出的方案增强了该网络,以在已知的蛋白-蛋白相互作用数据库(如BioGRID,Reactome,STRING,CORUM和IntAct)中找到表明更复杂相互作用的证据。

AIMS---蛋白质谱服务商,提供快速便捷的 溶液蛋白质谱鉴定服务