在没有任何形式的结构数据来源的情况下,从一个蛋白质的序列开始,从头预测这个蛋白质的三级结构在目前依然是不可能的。因而,在所有可信程度的情况下都可以有把握地确定一个在某种程度上特征完全未知的蛋白质的结构的唯一方法就是通过实验手段来测定。有两种主要的技术可以用于这个目的,这些技术就是X射线晶体学(X-raycrystallography,XRC)和核磁共振(nuclear magnetic resonance,NMR)谱。蛋白质结构库(PDB)中超过 98%的结构是采用上述两种方法中的一种测定的,余下的2%中的绝大多数是基于X射线晶体学结构和NMR 结构的理论模型。全部结构中有不到100个是利用其他方法,如中子衍射、电子衍射和电子显微镜得到的。
X射线晶体学和 NMR 两种方法都有非常苛刻的要求,对于每一个蛋白质来说,必须根据经验来确定准确的实验条件。X射线晶体学中蛋白质品体的制备被认为是一门“艺术”,测定蛋白质结构的很多尝试都是因为拿不到合适的晶体而失败。对于 NMR 谱,则是蛋白质以溶液状态测定结构,蛋白质必须在高浓度下是可溶而且稳定的,而且在这样的条件下不能聚集或变性。这两种技术都需要对大量的数据进行收集和处理,然后是艰苦的模型装配以便于产生原子坐标,装配的模型要与实验得出的结果相一致。
一、X射线晶体学
X射线晶体学利用的是这样一个原理,即当X射线经过蛋白质晶体时,它会以一种可预测的方式被散射或衍射。X射线在遇到电子时会发生衍射,因此散射的特征依赖于出现在每个原子中电子的数量和原子在空间的排列。与其他的波一样,衍射的X射线彼此之间会发生正向的或负向的干涉。当蛋白质分子有规则地排列在一个品体中时,由不同分子的等价原子散射产生的在同一方向的X射线会发生相互作用,这将在探测仪上生成一个斑点图案,这种斑点图案称为反射。这些衍射图案可以用于构建分子的电子云的三维图像,这种电子云的三维图像被称为电子密度图。蛋白质的结构模型就是搭建在这样的电子密度图中。
精确的结构测定需要一个高度有序的晶体,这样的晶体能够使X射线产生强烈衍射。蛋白质晶体生长特别困难,这是结构测定中一个不可忽视的瓶颈。疏水蛋白质或含有疏水结构域的蛋白质是最难结晶的,这也就是 PDB 数据库中只有很少几个完整膜蛋白结构的原因,因为这些蛋白质都有疏水的跨膜结构域。自动化结品工作台的开发有助于扩大X射线晶体学通量,这样就可以在同一时间尝试试验数千个不同的参数条件,比如不同的蛋白质浓度、盐浓度、温度和 pH 等,以确定最佳结晶条件。少量的样品也可以采用,这样可以进行那些含量不丰富的蛋白质的结晶研究。
获得蛋白质晶体之后,X射线晶体学面对的下一个问题是从衍射图案计算一个电子密度图。这需要三方面的信息:入射 X射线的波长、散射的X射线的振幅(可以通过反射的强度测定出来)和衍射的相位。不幸的是,相位不能从反射的图案中测定出来,这就带来了相位问题。有时候可以从已经解析的、存放在蛋白质数据库中的相关结构中来“借”相位,这种处理手段称为分子置换法。不过,多数时候需要进行进一步的实验来测定衍射相位。标准的处理过程是制备包含重金属原子的同形晶体,也就是在相同总体结构的晶体中结合上较重的原子,这样可以产生另外一种不同的衍射图案。包含重金属原子的同形品体可以通过在重金属的盐溶液中浸泡来制备,经过浸泡,重金属原子能够扩散到原先由溶剂分子占据的空间,并与蛋白质分子中某些确定的位置结合。重金属原子比那些蛋白质分子中正常出现的原子更强烈地使X射线发生衍射。通过比较多种不同的同型晶体产生的反射(称为多对同晶置换法,multipleisomorphousreplacement,MIR),就可以确定这些重原子的位置,这样就可以推导出未置换晶体中衍射的相位。每一个反射的全部描述即波长、振幅、相位,它们就是结构因子。
测定结构因子的相位也可以用异常散射法来实现。当蛋白质分子中的重金属原子在遇到波长接近其天然吸收边限的X 射线照射时,就会导致这些重金属原子会以附加 X 射线的形式重新发射出其中的部分能量,这就是发生了异常散射。异常散射的幅度随着入射X射线的波长而变化,因此一种含有重金属原子的晶体可以被几种不同波长的X射线照射,而产生几种不同的衍射图案,从这些衍射图案中,散射的相位就可以计算出来。这就是单对同晶置换加异常散射(single isomorphous replacement with anomalous scattering,SIRAS)和多波长异常散射(multiple wavelength anomalous dispersion,MAD)等技术的基础。一种改进的处理手段可使蛋白质晶体无须浸泡,这种方法是将蛋白质在细菌中表达时加入一些重金属原子取代的氨基酸类似物。
最后,需要在电子密度图中搭建一个结构模型。这需要一些更有决定性作用的信息--氨基酸序列,因为通过X射线照射不可能明确地区分出碳、氧和等原子,所以识别氨基酸侧链很困难。结果得到的模型是一套原子 XYZ坐标,赋予了除氢以外的所有原子电子密度的数据越多,原子位置的确定程度越高,模型的分辨率也越高。虽然如此,仍然可能会有蛋白质分子中某些区域的原子位置不能精确测定。每个原子都被赋予一个所谓的温度因子,这是确定性的一个度量。温度因子越高,则确定性越低。高温度因子说明了两种情况,一种是无序的一个度量;另外一种是动力学状态。
二、核磁共振
核磁共振(nuclear magnetic resonance,NMR)是因为某些原子核具有磁的性质而发生的一种现象。在 NMR 谱中,这些性质可以用来获得化学的信息。可以认为亚原子的微粒都在绕着它们的轴旋转,并且在很多原子中,这些旋转彼此平衡抵消,所以原子核本身没有总旋转。在氢原子(H)和某些天然存在的碳、的同位素(C、N)中,这些旋转不能抵消,这类原子核会拥有一个所谓的磁矩。这样的原子核可以采取两种可能的取向中的一种,在正常的情况下,这两种取向都有相同的能量。但是在一个外加磁场的情况下这些能级就会分裂,这是因为原子核磁矩的一个取向是与外加磁场平行的,而另外一个取向则不是。如果这种能量间隔存在,而且原子核暴露在某一特定频率的电磁辐射中时,那么这个原子核就会被诱导发生跃迁,从低能量的磁旋转状态跃迁到不优先选择的高能量旋转状态。因为电磁辐射的频率与原子核旋转的频率是一致的,所以这种吸收称为共振。当原子核回到它们的初始定向时,这些原子核会发射出电磁波,这些电磁波可以被测量出来。质子(H)能够给出最强的信号,这一点正是利用NMR谱进行蛋白质结构分析的基础。NMR 谱可以用于测定溶液中蛋白质的结构,但需要蛋白质是非常可溶而且高度稳定,需要溶液浓度接近 1mmo,并且需要的体积比较大(1~5mL)。因为所有成键原子附近的电子都会产生自己的磁场,所以成键原子附近的电子会影响到每个原子核的磁共振频率,因此 NMR 谱可以用来测定结构。外加的磁场的强度必须提高到能够克服电子产生的磁场的对抗或屏蔽,扰动的幅度或化学位移取决于每一个原子核的化学环境。通过这种方法,可辨别不同的氢原子,如甲基和芳香基团的氢原子的辨别。-维核磁共振实验可以检测到化学位移以及其他的类似于自旋-自旋耦合(spin-spincoupling)这样的屏蔽效应,但是在通常情况下,这些对于描述像蛋白质这样复杂的分子是不够的。可以采用一些由不同时间间隔区分的系列脉冲代替使用单个脉冲。这样可以得到一个二维的 NMR 谱,这种谱携带了额外的峰,这种峰可以显示具有相互作用的原子核对。
当把相互作用的原子核对的各种效应都考虑进去之后,NMR 分析的结果就是一些距离制约的组合,通过这些距离约束,可以用来推算某些特定的原子对之间的距离(包括成键的和没有成键的)。如果足够的距离约束计算出来,那么符合这些数据的蛋白质的结构数量就会变得非常有限。NMR 分析产生的是10~50个模型的组合体,而不是一个单一的结构。高精度的 NMR 谱依赖于蛋白质分子在溶剂中的快速翻转,这限制了可以分析的蛋白质的大小,目前可以分析的蛋白质都少于 300个氨基酸残基。如果质子的NMR 谱过于密集,分析也可以扩展到其他的原子核(如“C及“N)以产生多维和异核的NMR谱,这样可以降低数据密度。
三、结构分析的其他方法
除 X射线晶体学和 NMR 外,有些其他方法也可以为解析的结构提供补充信息,或者分析那些在X射线晶体学和 NMR 谱两种情况都不能分析的蛋白质结构。例如,圆二色谱circular dichroism spectrophotometry,CDS)就是一个很有用的测定蛋白质二级结构的方法。圆二色是一种光学现象。不对称的分子如蛋白质,在左旋圆偏振化光和在右旋圆偏振化光中有不同的吸收谱。圆二色采用的是波长160~240nm 的光,这个波段的光能够分别对含a螺旋和B折叠的蛋白质产生明显不同和具有特征的谱。圆二色谱不能测定蛋白质的三级结构,但是对于结构生物学中的X射线晶体学和NMR 谱是个有益的补充。其他的可以用于研究蛋白质三级结构的方法包括中子衍射和电子衍射。中子衍射比X射线衍射(XRD)使用的机会少得多,这是因为中子源不能广泛地得到,而且中子束的流量约比X射线束的流量低10个数量级。电子衍射用来研究那些能够结品形成或天然装配成二维排列但不形成有序的三维晶体的蛋白质的结构。电子显微镜的优势就是可以用分析结晶排列的蛋白质相同的方式分析那些单个分子,在不用结晶的情况下测定出大蛋白复合物的结构。电子显微镜的分辨率常常没有X射线衍射的分辨率高,但是由于不需要结晶,在只有少量而且不太纯的样品的情况下也可以进行测定。
