抗体序列编号 您所在的位置:网站首页 氨基酸u 抗体序列编号

抗体序列编号

#抗体序列编号| 来源: 网络整理| 查看: 265

今天分享的文献是一片很久以前的文献“Understanding the Significance and Implications of Antibody Numbering and Antigen-Binding Surface/Residue Definition”。主要讲述了不同抗体编号方法的逻辑、优缺点、对于抗体工程的实际应用等。

抗体是由两条重链和两条轻链组成的Y-型的免疫球蛋白,其分子量约为150kDa。抗体与抗原结合的部位在可变区,恒定区作用于免疫系统发挥效应功能。抗体重轻链都有3个CDR,其中CDR3的变化程度最高对亲和力的贡献也最大。抗体CDR的划分对抗体改造意义重大,例如人源化的过程。

CDR移植是人源化使用的主要方法,简洁的说就是将鼠抗体的CDR区域移植到人源的抗体框架区上,虽然这种方法在可以减少免疫源性,但是通常来说都会影响抗体的亲和力以及特异性。大多数情况下亲和力的丢失与CDR划分的方法有关。人源化需要将CDR的划分方法与抗体结构相对应起来,并适用于不同家族抗体序列与不同种属抗体序列。

抗体可变区编号方法

抗体工程需要精确的辨别抗体上参与抗原结合的氨基酸残基,前文提到的CDR移植就是将抗体的互补位尽可能的移植到人源的抗体序列上,之前分享过抗体的CDR区域远大于抗体互补位并有一部分区域重叠,目前互补位的预测比较难,只能使用CDR替代。

不过现在各种的抗体编号方法以及CDR划分方法如果不加以区分很容易让人搞混,因此熟悉每种抗体编号方法背后的逻辑是每个搞抗体工程的必备技能。

Kabat编号

1970年,Kabat通过比对了77个本周蛋白以及抗体轻链统计了抗体可变区氨基酸组成。根据每个位点上的氨基酸出现频率,他们给每个位点都定义了一个“变异系数”,他们在抗体的轻链上发现了三个高变区,也发现了一些保守的氨基酸位点,如两个半胱氨酸、LCDR1后面的色胺酸。使用相同的方法他们也在重链可变区上发现了三个高变区,根据这些发现推测抗体的高变区可能成簇的出现在抗体表面并且与抗原的结合相关,因此将这些高变区命名为互补决定区(Complementarity Determining Regions)。1979年,Kabat et al 率先提出抗体可变区的标准化编号方案,他们将抗体轻重链以及TCR受体都进行了比对和编号。

尽管Kabat编号通常被用作抗体编号的标准方法,但是这种方法仍有很多的缺点:首先,因为只是基于有限数量的序列比对,所以kabat编号的方式比较局限。例如它忽略了可能存在的较长的CDRH3,如果CDR的插入序列超出了给定的限度很难对这些氨基酸给出标准的编号。第二,kabat只是对较少的抗体序列进行比对分析,进而统计获得的。在CDRL1和CDRH1中定义的插入位点与结构上的插入位点不一致。因此在这些位置上相同的拓扑排列的氨基酸位点可能获得的编号不一致(图1 )。

Chothia编号

在1987年Chothia引入了基于结构的抗体可变区编号方案。他们比对了抗体的晶体结构,定义了CDR的Loop区域并且修正了LCDR1和HCDR1位置的插入位点,使相同的编号位点在抗体结构上对应起来(图1)。另外他们也通过对CDR Loop的构象进行了归类。

基于结构的比对Chothia编号方式将插入氨基酸的位置进行了修正,从L27修正到L30以及从H35修正在H31。这种编号方式很好的将CDR划分与结构对应起来。与Kabat相比,一些CDR的划分有些位置上的差异同时CDR的长度也有所不同。(图2)

根据前面提到的Chothia编号最大的优点是将氨基酸的编号与其在结构上的拓扑排列对应起来,然而这种编号方式也有一些问题,第一目前kabat以及IMGT编号使用比较广泛,引入其他编号方式会带来一些混淆;第二Chothia本身也曾经数次修改过编号方式;最后由于使用的是比较常规的抗体结构进行比对,Chothia编号对一些不常见的序列可能也不太适用。

Martin编号

Martin编号通过比对非常规的抗体结构,找到了在大部分抗体序列或结构中不存在的插入/缺失位点。通过分析抗体的序列以及结构,他们将抗体上最主要的插入位点H82a、b、c校正到H72a、b、c;另外在CDRL2中的L52也引入一个插入/缺失位点,大部分抗体的标准长度是7个氨基酸并且结构也相对保守,然而少部分的抗体长度会发生改变,通过对结构的分析表明这个位置是正确的,最后在H6位点也定义了一个插入/缺失位点。

Martin编号方式也可以被认为是新版本的Chothia编号,它修正了Chothia编号方式的插入/缺失位点,并且更加的贴近三级结构。

Gelfand编号

Gelfand编号方式是将可变区序列划分成21个片段“word”,每个“word”都对应一个二级结构区(链或环 a strand or a loop),链由字母顺序的字母(例如,A,B,C)定义,并且环由其相邻的两个链的字母定义,(例如,AB,BC …),两个例外是N端的3个残基以及链接B和C链的环,其具有“双拱桥”结构(图3),所以这个环分成两个分别是BC和CB。这种编号方式不包括缺失/插入位点,但是对二级结构的定义很精确,另外这个编号方式定义的一些loop与Chothia定义的loop不完全对应。

IMGT编号

1997年,Lefranc等人为免疫球蛋白超家族的所有蛋白质序列制定了新的标准化编号方式,包括来自不同物种的抗体轻链和重链的可变区以及TCR受体。 它们的编号方案基于种系V基因的氨基酸序列比对。 因此,氨基酸序列和编号在CDR3起始的地方停止。 后来,作者将编号方式扩展到整个可变区,并开发了一些工具来分析抗体可变区序列。目前IMGT拥有自己一套对框架区(FR-IMGT)和CDR(CDR-IMGT)的定义方法。

IMGT编号方法是从1到128连续计数。它避免使用插入编号,除了在一些CDR3-IMGT超过13个氨基酸的抗体序列的111和112之间的位置。 相反,当特定序列中发生缺失时,则不会有编号。根据Kabat,Chothia和IMGT编号方案的比对(图4)。

IMGT编号方式是免疫遗传学和免疫信息学的主要参考,其编号方法得到了WHO-IUIS的认可和使用。该编号方法的主要优点是它基于完整免疫球蛋白超家族的基因序列所比对得出。很多开发工具基于这种编号方式,例如IMGT/DomainGapAlign和IMGT-“Collier de Perles”。

缺点:由于使用的是连续的数字,IMGT编号不能直观的显示插入位置。同样这种方案也不灵活,对一些新的插入位点,IMGT难以适用;另外IMGT将插入位点定义在CDR的末端,与结构并不对应,不过此问题已经在V-Quest软件中得到修正。

AHo编号

Aho编号是以homogenized形式给免疫球蛋白可变区编号,这种方法是基于对抗体结构比对观察所整理,它定义了结构保守的Cα位置,因此推导出适当的框架区域和 CDR 长度(图5)。

AHo编号定义了保守的残基(C23、W43、C106、G140)以及间隔位点(#27-28、#36、#63、#123)。CDR1有由#31位点保守的疏水残基插入结构而形成的“双拱桥”结构。AHo编号在这个位点前后都引入了插入位点第一个位于#27和#28第二个位点在#36;另外也引入了额外的两个插入位点#74和#75。最后在CDR2和CDR3中引入了间隔位点(图5)。

AHo编号的最大优点是基于结构的对比,与Chothia编号类似这种编号更加契合抗体结构。另外,与IMGT类似,AHo编号也是使用连续的数字编号,也适用于所有免疫球蛋白超家族成员。然而缺点也与IMGT类似,不够灵活,对一些少见的或者较长的插入无法适用。最后,结构上的保守位点只是通过28个不同的抗体结构获得,所以需要通过对更多的结构进行分析获得更加准确的插入/缺失位点。

在不同编号系统中找出满足你想要的方案 CDR定义和抗原结合

抗体的CDR主要参与抗原结合,并且表现出较大的变异性。然而基于抗体序列的CDR定义则比较复杂。Kabat主要基于抗体序列的比对,Chothia能够更好的反应抗体结构。精确的CDR定义缺乏统一标准这是出乎意料的事情,因为很早之前大家就已经确认这个区域负责抗体与抗原的结合。为了解决CDR定义的差异,一些研究人员考虑通用的方法能够定义不同长度的CDR序列。

高亲和力反应抗原抗体复合物的高稳定性,这个稳定的复合物由抗体的互补位和表位之间通过非共价键形成。有文献表明,CDR上只有20%-30%的氨基酸直接与抗原发生相互作用,这部分的氨基酸称做“Specificity Determining Residues (SDR)”,这些参与相互作用的氨基酸通常都位于互补位的中心。Chothia曾经提出,非接触残基在塑造CDR的构象中起重要作用,因此最佳地定向接触残基可以更有效的获得与抗原结合的氨基酸残基。

Ofran等人使用多结构比对来鉴定可变区的抗原结合残基,他们发现,与抗原结合的氨基酸由特定的氨基酸组成,特别是W和Y;另外他们认为传统的CDR划分方式(Kabat、Chothia和IMGT)都会忽视大约20%与抗原结合的氨基酸。

Robin等人提出了另一种有趣的方法,使用丙氨酸扫描方法研究抗体-抗原复合物的结合自由能。他们发现80%的结合自由能由大约4-13个关键氨基酸残基提供,他们列出了30个主要提供自由能的氨基酸位点,其中27个位于抗体的CDR(Kabat编号),另外的3个位于框架区,这些位点主要的氨基酸组成(Y、G、S、W、D、N)。他们的研究表明这些氨基酸主要位于HCDR2和HCDR3,同时LCDR2在一半的复合物中并不对结合有任何的贡献,最后研究表明Ab-Ag复合物涉及到3-6个CDR。

图6阐述了CDR定义的差异,这个比对的结果表明CDR的定义只能涵盖互补位的大部分。根据共识,要判断一个氨基酸是否位于互补位:1)是否与抗原直接相互作用,2)对于自由能的贡献。另外需要注意的是,一些相互做的氨基酸对自由能的贡献较少且可能是负贡献;一些氨基酸对自由能贡献较大,但是对于特异性结合和非特异性结合并没有太大差异;最后一些氨基酸对于抗原的识别比较重要,但是对自由能的贡献比较少。实际上,互补位及其相应的表位具有结构和化学性质的互补特性。结构互补性主要涉及芳香族残基(W、F、Y)建立的范德华相互作用(π-π)或其他疏水相互作用。同时,具有低解离速率常数的Ag-Ab复合物主要归因于带电或极性侧链残基提供的静电相互作用或氢键相互作用。最后,抗体CDR中的许多残基不直接与抗原接触,但通过支持其附近相互作用残基的构象和方向,也可能在Ag-Ab相互作用中发挥重要作用。

CDR的结构归类

理想的情况下,一个CDR的定义方式会包含所有的互补位氨基酸。所以对于抗体CDR结构的分析尤为重要,Chothia定义了一部分保守的CDR loop,并命名为“保守”结构。这个分类系统将抗体轻链LCDR1、LCDR2、LCDR3和HCDR1、HCDR2划分成有限的不同结构,这些结构分类通过长度以及关键位点上的氨基酸所定义。他们也定义了CDR和FR上的一些保守的氨基酸位点,这些位点对CDR的结构有重要的作用。除了Chothia的研究,也有其他的研究小组分别强调了CDR的结构归类以及识别FR上的关键位点。这些研究都表明,基于结构的CDR分类对于抗体工程是非常有用的工具。

非CDR残基对亲和力的影响

现在已经证明一些非CDR残基在抗原结合中起到重要的作用。框架区上的氨基酸残基可以通过影响CDR的构象来影响抗体的亲和力,这些对亲和力有影响的氨基酸残基包括“Vernier zone residues”和与CDR附近的氨基酸。

最后非CDR残基也会影响到抗体轻链和重链的组装以及夹角,这会对抗原结合发生重要影响。Chothia是第一个研究VH和VL组装的,他们强调了交界面上的芳香族残基对组装的影响。2010年,Abhinandan和Martin对VH和VL组装角度(packing angles )的多样性进行了更全面的分析,分析了567种抗体晶体结构。他们开发了一种方法,根据位于这两个结构域之间界面的特定氨基酸的存在来预测重链和轻链可变结构域的包装/方向(packing/orientation)。实际上,他们定义了位于VH和VL结构域之间交界面的结构保守残基的Cα原子。然后使用这些原子拟合两条向量,一条位于轻链,一条位于重链。组装角度(packing angle)对应于这两个拟合向量形成的角度(图7),并且不同抗体(从-31.0°到-60.8°)显着变化,平均值为-45.6°。

这种VH/VL角度也影响CDR之间的相对位置,因此影响paratope的形状,该参数对结合亲和力产生重要影响。实际上,两个原子之间的结合能遵循Lennard-Jones关系的距离的函数。几个埃的差异可以强烈影响结合自由能。假设可变区域长度为37埃,VL/VH域之间的1°差异将导致CDR表面上暴露的原子位移约0.6埃。因此,CDR移植技术选择用于人源化的框架区域对于保持亲和力是至关重要的。如Nakanishi等表明人源化抗体的亲和力丢失,通过在VH/VL界面进行两次突变恢复了原始亲和力。同样,Bujotzek等人通过基于预测的VH/VL方向选择人框架进行抗体人源化,并揭示人源化抗体的相似角度和亲和力之间的相关性。因此抗体VH/VL的组装在抗原抗体结合的过程中发挥这重要的作用。

讨论:抗体序列编号与人源化

抗体人源化是为了重塑互补位和表位的相互作用,大多数情况下的做法是,通过将非人源抗体CDR区域移植到人源的框架区。CDR移植方法通常基于抗原-抗体相互作用的简化画像,其将互补位缩小至抗体的6个CDR。虽然,没有进行抗体人源化的统一方案,因为抗体的人源化是一个case by case的实验。图8总结了人源化的一般路径。

首先,需要划分CDR,可以简单的认为互补位主要位于CDR,因此建议使用Chothia编号方式划分CDR;第二,找到非CDR上的参与抗原结合的氨基酸;最后,CDR的朝向也与互补位相关,进而影响抗体与抗原的结合,因此选择合适的人源VH和VL受体尤其重要,需要选择VH/VL夹角接近的框架区。因为需要正确对比不同来源抗体序列并精确定位到拓扑结构,所以使用增强的Chothia(或者Martin)编号系统会更简单,因为它确定了精确的插入点,当然,这种选择还是见仁见智。

另一个关键点是人源化抗体不应在患者中诱导任何免疫反应。因此,需要进行抗体序列中潜在免疫原性表位的预测。简而言之,免疫应答是在抗原呈递细胞内化抗体后发生的。抗体被消化成寡肽并与HLA-DR,HLA-DQ或HLA-DP分子结合。这些膜蛋白复合物结合特异性寡肽并将它们呈递给激活免疫应答的淋巴细胞T辅助细胞。使用这些MHC-II的数据库可用于预测寡肽结合潜力。例如Epivax等网络工具,其包括扫描蛋白质序列以鉴定推定的T细胞表位。目前在维持人源化抗体高亲和力和低免疫原性是矛盾的,这也是抗体人源化面临的主要挑战性。

结论

这篇文章讨论了不同抗体编号的方式,目前也亟需一个统一的标准编号方法来进行抗体工程。事实上,有效的氨基酸编号方式应该将相同的编号与结构对应起来,并且能够推广到不同的种属。尽管目前一有很多的编号方式,但是仍建议使用的时候能够比较不同编号系统的带来的差异,特别是针对一些不常见的抗体序列。

最后,高效的抗体序列编号方法对于精确的识别抗体互补位以及改造具有高亲和力、稳定性和低免疫原性的人源化抗体是必需的。

参考文献

Understanding the Significance and Implications of Antibody Numbering and Antigen-Binding Surface/Residue Definition



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有