千锤百炼只为遇见你
抗原设计FAQ
为什么要进行抗原设计?
想要以高成功率获取特异性好、有效性高的抗体,第一步抗原设计至关重要。
抗原设计过程中,你碰到过哪些头疼的问题,快来吐槽。
目前,用于免疫生产抗体的抗原一般有多肽抗原和重组抗原。两种抗原各有优劣,多肽抗原理论上来说可以产生高特异性、针对特定抗原表位的抗体;缺点是免疫原性较低,需要和载体偶联以增强免疫原性,这增加了抗原制备成本,另外还会产生大量针对载体的非特异性抗体,增加了后续纯化和筛选成本。重组抗原免疫原性强,包含抗原表位多,用于制备抗体,相对成功率较高;但也有缺点,重组抗原一般采用大肠杆菌表达系统,原核表达系统的蛋白质折叠方式与真核生物的有所差异,另外有时并不能获取可溶性的抗原,进一步导致所获抗原与目的蛋白抗原的抗原表位并不完全一致,从而产生出一些非特异性的抗体,而这些非特异抗体在后期的纯化过程中是很难被排除掉的。

设计抗原时,多肽抗原一般选择10~20个左右的氨基酸,重组抗原一般为长度在100个氨基酸以上的部分或者全长蛋白。
设计抗原有哪些秘籍呢,准备好接收了么?
设计抗原的基本原则
确定所需生产抗体的用途
明确所需生产抗体的用途对抗原设计有很大的影响。例如:如果需要利用得到的抗体来研究目的蛋白的特定区域,如C端或N端,那么抗原序列的选择就应集中在这一区域;如果想要用抗体来研究一种特定状态下的蛋白,如磷酸化等,抗原设计的选择性更小了,只有选择该位点附近的合适氨基酸序列来设计多肽抗原。
抗原序列区域的选择原则
一般说来最理想的抗原表位识别区域应具备亲水、位于蛋白表面和结构上易变形性等特点。因为在大多数的天然(自然)环境中,亲水区域倾向于集中在蛋白表面,而疏水区域常常被包裹在蛋白内部。那么,我们在设计抗原的时候,如果选择这些具备亲水、位于蛋白表面和结构上易变形性等特点的区域的话,则有利于抗原产生与目的蛋白相同的抗原表位,从而生产出高亲和力,高特异性的抗体。
连续的与不连续的识别区域
大多数抗体是针对连续识别区域的,抗体能与这类区域以很高的亲和力相结合表明这段序列不在蛋白内部。不连续的识别区域是代表有一定折叠的一段多肽序列,或是将两段分离开的多肽连在一起的抗体的识别区域。在某些情况下,针对这样不连续识别区域的抗体也能产生,只是用来免疫的抗原多肽必须具备与该不连续识别区域相似的二级结构,而序列的长度需要符合相关的要求。
避免识别区域隐藏在蛋白内部
为了避免识别区域隐藏在蛋白内部的风险,通常选择蛋白的N,C两端来产生相应的抗体。因为在完整的蛋白中,N、C两端通常是暴露在蛋白表面的。然而,一定要注意膜蛋白的C端疏水性太强,不适合作为抗原。

抗原设计的原则明确后,现在我们就来看一下设计抗原具体要怎么操作:
01
资料调研
查找蛋白质基本信息:包括蛋白名称、基因名称、分子量、氨基酸数、表达部位、GeneID等,常用如下两个数据库:
http://www.uniprot.org/ (Uniprot)
http://www.hprd.org/query (Human Protein Reference Database)
查找针对该蛋白质的抗体的信息:
由于抗原设计本身具有很多的不确定性,为了降低风险,节省成本,所以需要参考别人做该抗体的抗原设计位点,尽可能多地调研相关信息,以免做无用功(例如,有些抗原只能用重组蛋白而不能用多肽,调研出这些信息就能降低很多风险)。常用网站如下:
http://www.labome.com/
http://www.abcam.com/
http://www.scbt.com/
https://www.rndsystems.com/cn
http://www.abnova.com/
02
二级结构预测 (以DNAstar为例)
在http://www.uniprot.org/ (Uniprot)中将蛋白的氨基酸序列复制到DNAstar中,再利用Protean得出该蛋白的抗原性(Antigenic Index)、亲水性(Hydrophilicity Plot)、柔韧性(Flexible Regions)、表面可及性(Surface probability)、转角(Turn, Coil)、α螺旋(Alpha-helix)、β折叠(Beta-sheet)等分析图。我们从中选择抗原性强、亲水性好、柔韧性好、表面可及性高、有转角的区域,同时避免有α螺旋、β折叠的区域。
03
在线预测
设计多肽抗原时可以在http://t.im/1g1lg提交蛋白的氨基酸序列,一般以20 aa为标准,得到不同肽段,其顺序按预测推荐优劣排列。在http://t.im/1g1ll再次提交蛋白氨基酸序列,得到整个序列中每一个氨基酸的抗原性,得分高的抗原性好。
04
同源性比较(Blast)
对于多肽抗原,一般还需要比较同源性。可以将选择的序列在http://www.uniprot.org/上Blast,看其同源性,同一物种中的同源性高的序列则不能选择,不同物种之间的同源性高的则可以作为抗原。

附录. 一些常用的数据库和预测工具
分析氨基酸序列中是否存在信号肽:
http://www.cbs.dtu.dk/services/SignalP/
分析氨基酸序列中的跨膜结构:
http://www.cbs.dtu.dk/services/TMHMM/
基于序列的线性表位预测工具:
http://www.cbs.dtu.dk/services/BepiPred
基于结构的连续性和非连续性表位预测工具:
http://bioinfo.ernet.in/cep.htm
基于序列/结构的非连续性表位预测工具:
http://www.cbs.dtu.dk/services/DiscoTope
抗原-抗体相互作用残基数据库:
http://www.rostlab.org/services/epitome