您现在的位置是:首页 > 医疗保健 > 正文

医疗保健

什么是蛋白组学(蛋白质组)

安心医药2023-11-13医疗保健140
一、蛋白质组的介绍蛋白质组(Proteome)的概念最先由MarcWilkins提出,指由一个基因组(Genome),或一个细胞、组织表达的所有蛋白质(protein).蛋白质组的概念与基因组的概念

一、蛋白质组的介绍

蛋白质组(Proteome)的概念最先由Marc Wilkins提出,指由一个基因组(Genome),或一个细胞、组织表达的所有蛋白质(protein).蛋白质组的概念与基因组的概念有许多差别,它随着组织、甚至环境状态的不同而改变。在转录时,一个基因可以多种mRNA形式剪接,一个蛋白质组不是一个基因组的直接产物,蛋白质组中蛋白质的数目有时可以超过基因组的数目。蛋白质组学(Proteomics)处于早期“发育”状态,这个领域的专家否认它是单纯的方法学,就像基因组学一样,不是一个封闭的、概念化的稳定的知识体系,而是一个领域。

二、什么是蛋白质组学

这个概念最早是在1995年提出的,它在本质上指的是在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平,翻译后的修饰,蛋白与蛋白相互作用等,由此获得蛋白质水平上的关于疾病发生,细胞代谢等过程的整体而全面的认识。

目前,在蛋白质功能方面的研究是极其缺乏的。大部分通过基因组测序而新发现的基因编码的蛋白质的功能都是未知的,而对那些已知功能的蛋白而言,它们的功能也大多是通过同源基因功能类推等方法推测出来的。有人预测,人类基因组编码的蛋白至少有一半是功能未知的。因此,在未来的几年内,随着至少30种生物的基因组测序工作的完成,人们研究的重点必将转到蛋白质功能方面,而蛋白质组的研究正可以完成这样的目标。在蛋白质组的具体应用方面,蛋白质在疾病中的重要作用使得蛋白质组学在人类疾病的研究中有着极为重要的价值。

疾病的产生可能仅仅是因为基因组中一个碱基对的变化,如β-血红蛋白第六位上的Glu变为Val就导致了镰刀型细胞贫血症的发生。然而,对于大多数疾病来说,其疾病发生机制要复杂的多。因此,对于疾病发生的分子机制的认识就需要一些能够解决这些复杂性的方法来完成。而作为细胞中的活性大分子,蛋白质无疑是与疾病相关的主要分子,蛋白表达水平的改变是与疾病,药物作用或毒素作用直接相关的。因此,基于蛋白质整体水平的蛋白质组学在人类疾病研究中无疑将发挥重要作用。

现在,蛋白质组学在人类疾病中的应用已经在一些疾病如皮肤病,癌症,心脏病中广泛开展了,而这些研究则主要集中在这样几个方面:寻找和疾病相关的单个蛋白,整体研究某种疾病引起的蛋白表达或修饰的变化,利用蛋白质组寻找一些致病微生物引起的疾病的诊断标记和疫苗等。下面,我们就将就蛋白质组学的基本技术和这些领域的应用作一些介绍。

蛋白质组学研究的基本技术

对于蛋白质组学的研究来说,它的最基本的实验手段就是利用双向凝胶电泳(two-dimensional protein electrophoresis, 2DE),在整个基因组水平上检测蛋白质表达的情况。双向凝胶电泳首先利用等电点聚焦来分离不同等电点的蛋白,再利用SDS-PAGE来分离不同分子量的蛋白,其分辨率是非常高的。微克级的蛋白质就可以被很好的分辨开了,如在微克级水平上,有人从一个蛋白混合物中最多分开了11200种蛋白质,数量是非常可观的。因而,微克级的蛋白的双向凝胶电泳常被用来初步检测表达或修饰有变化的蛋白。然后,同样的蛋白混合物样品可用于毫克级的2DE,这样,电泳图谱上的每一个多肽就可被纯化并进行下一步的分析,如质谱,末端或中间的氨基酸序列分析等。

仅仅进行双向凝胶电泳显然是远远不够的,因为由双向电泳得到的蛋白质表达情况的变化并不能和具体的何种蛋白表达出了变化联系起来。而一些如蛋白质印迹或凝集素亲和印迹等传统技术对于这方面的信息也帮助不大。为了鉴定这些由电泳得来的蛋白,质谱(MS,mass spectrometry)被广泛应用在蛋白质组学中。对于蛋白质的鉴定,有两种方法用的最为广泛,即MALDI-MS( matrix-assisted laser desorption ionization)和ESI-MS(electrospray ionization)。这两种方法各有自己的适用范围,通常前者对于分析高分子量的蛋白更有效,而后者对于蛋白的检测灵敏度更高,常可达到飞克级水平以下。质谱可以用于蛋白质分析主要是因为它可以提供特定蛋白的不同方面的结构信息,如它可直接测定蛋白或多肽的分子量信息,也可用来获得一些蛋白质序列信息等。同时,质谱也可通过多肽片段分子量的改变来得到一些关于糖型,磷酸化和其它翻译后修饰的数据。因此,质谱对于蛋白质的鉴定是非常重要的,而它的进展也无疑会大大促进蛋白质组学的研究进展。

单个的疾病相关蛋白的寻找

在疾病发生过程中,由于和疾病相关的遗传信息的变化常常会导致蛋白的种类和数量发生变化,而这些变化是可以被可以被高解析度的双向凝胶电泳所检测到的,这就是利用蛋白质组学寻找和鉴定疾病相关蛋白的依据。

结肠癌的产生是一个包含了多个基因突变的多步过程,这其中包括抑癌基因的功能丧失,癌基因的活化等。然而,肿瘤发生的具体机制仍不清楚。对于这样一种涉及多种蛋白的疾病,人们已经开始利用蛋白质组学来分析结肠粘膜发生恶性转化后的多肽的变化了。对照15例结肠癌病人和13例正常人的结肠表皮的双向凝胶电泳结果发现,二者分别含有882个和861个点,而这些点中,有一个蛋白,其分子量为 13kDa,等电点为5.6,它只在肿瘤组织中专一性的表达。在15个癌症样品中,有13例的此蛋白表达上调,占到了87%。进一步的研究也证实了这个蛋白在不同程度的癌症引起的发育异常中也有明显的表达水平上的差异。由双向电泳发现的这个可能与癌症相关的蛋白到底是什么蛋白呢?从电泳的凝胶上得到的这个点经胰蛋白酶水解后,得到的肽段由μ-HPLC分离后测序。测序的结果拿到两个序列,LGHPDTLNQ和VIEHMEDLDTNADK,这与钙粒蛋白B的情况完全吻合。进一步的用MALDI-MS分析的结果也证实了这个蛋白就是钙粒蛋白B。同时,结合以前的发现,即由钙粒蛋白B和A组成的异源二聚体蛋白钙防卫蛋白在胃肠肿瘤病人的粪便样品中含量有很大提高,钙粒蛋白B在肿瘤性转化的组织中的高专一性存在显示出它在结肠癌的产生中具有重要的作用。尽管蛋白的具体功能还需要进一步的阐明,但这个例子已经可以证明,由蛋白质组学方法寻找疾病相关蛋白肯定是可行的。

这方面的另一个例子是关于肝细胞癌的研究。双向凝胶电泳已经被成功的用于发现化学诱导的鼠的肝癌相关蛋白中。而双向电泳和蛋白质化学方法的联合应用也更深化了对这些癌症相关蛋白的具体特征的认识。在用N-甲基-N-亚硝基脲诱导了鼠的肝癌后,利用双向电泳发现了一些表达有变化的蛋白,经氨基酸序列分析后,分析其中一个蛋白是来源于肝癌的醛糖还原酶样蛋白( hepatoma-derived aldose reductase-like protein)。这个蛋白分子量为35KDa,等电点为7.4,它是一种在肝癌和胚胎的肝中特异性表达的蛋白。利用双向电泳得到了这样一种可能和癌症相关的蛋白后,一些蛋白质化学的方法可用来对这种蛋白和疾病的相关性作进一步的研究。有人利用免疫组化的方法发现,直接针对来源于肝癌的醛糖还原酶样蛋白的抗体FR-1表明,这个蛋白在化学诱导的肝癌小鼠的发生肿瘤转化的前期和转化的早期就已经有很强的表达了,而正常肝组织中并无表达。这都是该蛋白涉及肝癌发生过程的有力证据。

已有的一些关于此蛋白的研究表明,醛糖还原酶是还原酶超家族的成员,在山梨糖醇途径中它可以催化葡萄糖向山梨糖醇的转化,而且在一些糖尿病的并发症的发生中它也有作用。作为一种酶,它可以水解一些生物异源物质等,因此它也参与了一些解毒过程。而在肝癌发生过程中,一些解毒酶的表达水平或活力增高已是公认的事实了。对于醛糖还原酶这一类有解毒功能的蛋白来说,只有由双向电泳发现的肝癌来源的醛糖还原酶样蛋白是与肝癌相关的。它首先在胚胎肝中表达,但在成年的肝中就不表达了。肝癌发生时,它又重新表达了。因此,目前可以初步推断,醛糖还原酶样蛋白在肝癌发生过程中是与肝的解毒过程相关的。现在,在人的肝癌中,也找到了鼠的醛糖还原酶样蛋白的同源蛋白,它同样是在人的不同组织中选择性表达的。

疾病相关蛋白的整体研究

对于大多数疾病来说,疾病造成的往往不只一个或几个蛋白的变化,参与疾病过程的蛋白的数目也是很大的,因此除了通过双向凝胶电泳来寻找与疾病相关的单个蛋白外,通过蛋白质组对表达情况有变化的蛋白在整体水平上的研究同样是非常重要的。目前,在利用双向凝胶电泳进行的蛋白整体水平的研究方面,扩张性的心肌病(Dilated cardiomyopathy, DCM)是一个较好的例子。

扩张性的心肌病是一种严重的心脏疾病,对于这种疾病的致病机理和涉及的分子都还不清楚,而且,对于这样一种复杂的疾病来说,也不可能仅由一种致病机理造成。因此,对于这样的疾病,从整体的蛋白质组水平来研究是极为必要的。另外,相对其它组织而言,主要由心肌细胞组成的心脏是一种相对均一的组织,这也为用双向凝胶电泳进行蛋白质组的研究提供了良好的基础。对DCM的蛋白质组的研究在九十年代初就已经开始了,目前,心肌的双向凝胶电泳的数据库已经建立。尽管国际上各实验室之间的数据之间有着如不同的样品制备,不同的等电聚焦条件,不同的凝胶大小等差异,但这些数据的比较证明,在大多数情况下,不同蛋白的点的位置还是相对稳定的,可以进行大规模的比较研究。

在Knecht等人的研究中,得到了一个高解析度的具有大约3300个心肌蛋白点的双向电泳结果,并对其中的150个蛋白进行了氨基酸分析,N端和中间的Edman降解以及MALDI-MS等一系列鉴定。而对几百个正常和扩张性心肌病的病人的2-DE结果比较发现,两者的蛋白条带具有可比性。除去一些可能由不同的疾病有关参数如患病程度,用药情况,病人年纪等因素造成的无重复性的点的多少和强度的变化外,患病者和正常人有25种蛋白在统计学上具有显著差异。这些即是DCM相关蛋白。而这个结果是在对几百个样品的大规模研究的基础上得来的,而也只有大规模的研究,才能体现出这个结果在实际应用前景上的价值。对于这几十种疾病相关蛋白,我们可以用一些其它方法,如免疫组化,酶活测定等,来作进一步的鉴定,确认它们与疾病的相关性以及它们在疾病中的作用等。这些工作都是在基于蛋白质组的研究基础上进一步的深入而进行的,显然,在几百个DCM患者和正常对照的样品的大规模水平上对疾病相关蛋白的整体研究无疑是最为基础和有效的。

病原微生物的蛋白质组学分析

近几年来,关于传染病的研究变得比原来更为重要。一些新的传染原,如Borrelia burgdorferi,HIV,Ebola病毒等的出现,使得一些原来认为已被控制的疾病如结核,多抗药性的链球菌属感染等又有所增加。因此,对于有毒力的微生物和病毒进行蛋白质组学的分析就显得非常必要,它可以用来寻找和研究毒力因子,抗原,疫苗等,而这些对于疾病的诊断,治疗和防治是极为重要的。目前,已经有18种微生物的基因组测序已经完成,而另有60多种的微生物的基因组测序正在进行当中,这些基因序列的信息和相对真核组织来说少得多的基因数量都为蛋白质组的研究提供了良好的基础。

疏螺旋体属的Borrelia burgdoferi是引起多系统疾病人类Lyme氏疏螺旋体病的主要致病因子。这种疾病的症状开始时常表现为一些环状红斑样皮疹以及流感样症状,发展下去也会造成一些神经系统的并发症和关节炎等。目前,对这种疾病的诊断主要是通过临床症状的判断并辅以血清学实验如ELISA,免疫印迹等来证实。由于这些实验具有不同程度的敏感性和特异性,诊断并不是标准化的。利用蛋白质组学的研究提供一些新的较为标准的诊断标记就显得尤为必要了。

Borrelia burgdoferi的染色体上有853个基因,它的11个质粒上有额外的430个基因。它的双向凝胶电泳图谱大约有300个点,由这些蛋白点就可以寻找免疫相关抗体等蛋白了。将银染的 Borrelia burgdoferi的 2DE凝胶上的其中217个点编号后,用来源于兔子的多克隆抗体采用免疫杂交的方法鉴定了一些抗原在胶上的位置,如外表面蛋白A(OspA),OspB,OspC,p83/100,p39,flagellin p41等。除了p83/100外,所有抗原在2DE图上都存在于不只一个点上。利用不同表现症状的Lyme氏疏螺旋体病病人的血清与疏螺旋体的2DE图进行印迹分析发现,具有红斑迁移症状的十个病人的血清中分别含有60种和88种抗原的IgM型和IgG型抗体,而关节炎病人的血清中含有15种抗原的IgM抗体和76种不同抗原的IgG抗体,晚期神经疏螺旋体病人的血清中则含有33种抗原的IgM抗体和76种抗原的IgG抗体,但在这三种不同疾病时期的病人血清中都含有这样几种抗原的抗体,OspA,OspB,OspC,flagellin,p83/100,p39等,这几个抗原同时也是原来血清学实验中用来诊断的标记,蛋白质组的结果验证了原来诊断的合理性,同时,2DE的结果也发现了一些原来并没有发现的抗原,这些正是一些新的潜在的诊断标记。更多诊断标记的发现对于诊断的标准化和准确性的提高大有帮助。

弓形虫病是由原生动物Toxoplasma gondil寄生感染引起的,全世界约有30%的人携带此种寄生虫,而在欧洲,弓形虫病是发生频率最高的传染病之一,因此,这种疾病的危害是相当高的。在健康人群中,寄生虫的感染通常是无症状的或症状极其轻微的,但如果是怀孕期间感染,寄生虫就会通过胎盘,并造成胎儿的死亡。随着怀孕时间的增加,寄生虫穿透的可能性也会增加。因此,确定感染的时间就显得非常重要了。另一方面,怀孕不同时期的感染后果也是不同的,在怀孕早期,器官形成过程时的感染危害可能是致死的,而怀孕的后期,胎儿的感染经常会导致一些并发症的出现如视网膜色素异常等。如果在怀孕期间感染的妇女得到了充分的治疗,胎儿感染的可能和后果的严重性都会大大降低。因此,及时的诊断和准确判断感染时间对于弓形虫病的治疗是非常重要的。

但实际上,90%以上的怀孕妇女的初期感染都不能被及时发现。目前的诊断主要是依靠血清学手段和PCR方法,而用血清学的方法来检测抗体对于一些无免疫应答的和怀孕的病人显然是不够的,而潜伏性感染致病恰恰是经常发生在无免疫应答的人中。如在艾滋病患者中, T.gondil就是导致脑内病变并致死的主要原因。由这些都可看出,疾病的有效的诊断对于有效的治疗是非常关键的。同样,蛋白质组水平上的研究为这方面的进展提供了非常有力的方法。我们可以用不同感染情况的病人的血清和T.gondil的2DE图进行免疫印迹来寻找和感染相关的抗原来作为诊断标记。这些不同的血清包括:急性感染弓形虫病的怀孕妇女的血清,急性弓形虫病的非怀孕病人的血清,潜伏性感染弓形虫的尚未发病者的血清。结果显示,2DE图上的9个点可以和感染者血清中的任一类型的免疫球蛋白反应,且这种反应和感染的状态和发病与否无关,这9个点就可用来作为T.gondil感染的标记。另外有7个点和抗体的反应则与抗体类型或发病情况有关,可用来区分不同疾病状况如潜伏期和急性期等,它们同样可作为进一步判断感染状态的诊断标记使用。

小结

双向凝胶电泳就象一个分子显微镜,将复杂的蛋白混合物分离开来,而进一步的由疾病和对照的比较可以找到一些疾病相关蛋白。目前,蛋白质组的应用最多的领域就是通过疾病和对照的2DE条带的比较寻找单个的疾病相关蛋白,钙粒蛋白B在结肠癌中的表达上调和肝癌来源的醛糖还原酶样蛋白在鼠的肝癌发生过程中的重新表达就是两个典型的例子。这些蛋白和疾病的相互关系还可以通过免疫组化等方法进一步的鉴定。而另一方面,利用蛋白质组来进行整体水平上的研究也是不可缺少的。如对扩张性心肌病的研究就显示出了患病者和对照的 25种蛋白的显著差异,人的心肌的包括了3300个蛋白的双向凝胶电泳数据库也已经建立了。对于整体水平上的研究而言,规模越大,使用样品数目越多,对分子机制的研究可能就越深入,因而国际间的协作是非常重要的。蛋白质组学应用的另一领域是在致病微生物的诊断用蛋白的寻找方面,如在上面所提到的Borrelia burgdoferi引起的Lyme氏疏螺旋体病和Toxoplasma gondil引起的弓形虫病等,由蛋白质组学得来的诊断标记甚至还可用来区分不同的疾病时期,这些都为有效的诊断检测的发展提供了基础。蛋白质组学的研究在蛋白质功能和人类疾病研究方面为我们开辟了一个新的领域,尽管它还处于刚刚起步的不成熟期,很多技术还有待完善和发展,但它的潜力是不可低估的,在将来,蛋白质组在人类疾病中的应用也必然会更加广泛和深入。

三、蛋白质组学名词解释

1.蛋白质:是一类生物大分子,由一条或多条肽链组成,每条肽链都由一定数量的氨基酸按一定顺序通过肽键连接而成。

2.氨基酸的等电点:在某一pH值条件下,氨基酸解离成阳离子和阴离子的程序相等,溶液中的氨基酸是一种既带正电荷、又带负电荷的电中性离子(净电荷为零),这种离子称为兼性离子,此时溶液的pH值称为该氨基酸的等电点。

3.肽键:存在于蛋白质和肽分子中,是由一个氨基酸的α-羧基与另外氨基酸的α-氨基缩合形成的化学键。

什么是蛋白组学(蛋白质组)

4.肽:由两个或多个氨基酸通过肽键连接而成的化合物。

5.肽单元:参与肽键的6个原子位于同一平面,Cα1和Cα2在平面上所处的位置为反式构型,此同一平面上的6个原子构成肽单元。

6.蛋白质的一级结构:蛋白质多肽链中氨基酸的排列顺序。

7.蛋白质的二级结构:指蛋白质多肽链局部片段的构象,该片段的氨基酸是连续的,主链构象是规则的。

8.蛋白质的三级结构:蛋白质分子整条肽链的构象,描述其所有原子的空间布局。9.蛋白质的四级结构:指寡聚蛋白所含亚基的数目、种类和空间布局。

10.协同效应:这么多蛋白质含不止一个配体结合位点,这些位点结合的配体可以相同或不同。其中一个位点与配体结合引起蛋白质构象改变(变构),进而影响到其他位点与各自配体的亲和力或结合速度,这种现象称为协同效应。

四、蛋白质组学简介

目录 1拼音 2英文参考 3概念 4基因组和蛋白质组的关系 1拼音

dàn bái zhì zǔ xué

2英文参考

Proteomics

3概念

蛋白质组学是阐明生物体各种生物基因组在细胞中表达的全部蛋白质的表达模式及功能模式的学科;包括鉴定蛋白质的表达、存在方式(修饰形式)、结构、功能和相互作用等。

4基因组和蛋白质组的关系

90年代初期开始实施的人类基因组计划,在经过各国科学家近10年的努力下,已经取得了巨大的成就。不仅完成了十余种模式生物(从大肠杆菌、酿酒酵母到线虫)基因组全序列的测定工作,还有望在2003年提前完成人类所有基因的全序列测定。那么,知道了人类的全部遗传密码即基因组序列,就可以任意控制人的生老病死吗?其实并不是这么简单。基因组学(genomics)虽然在基因活性和疾病的相关性方面为人类提供了有力根据,但实际上大部分疾病并不是因为基因改变所造成。并且,基因的表达方式错综复杂,同样的一个基因在不同条件、不同时期可能会起到完全不同的作用。关于这些方面的问题,基因组学是无法回答的。所以,随着人类基因组计划的逐步完成,科学家们又进一步提出了后基因组计划,蛋白质组(proteome)研究是其中一个很重要的内容。

那么,基因组和蛋白质组到底有什么联系?我们可以这样理解生命,遗传信息从DNA(基因)转变为一种被称作mRNA的中间转载体,然后再合成各式各样的结构蛋白质和功能蛋白质,构成一种有机体,完成生命的功能。基因→ mRNA→蛋白质,三位一体,构成了遗传信息的流程图,这即是传统的中心法则。现在已经证明,一个基因并不只存在一个相应的蛋白质,可能会有几个,甚至几十个。什么情况下会有什么样的蛋白,这不仅决定于基因,还与机体所处的周围环境以及机体本身的生理状态有关。并且,基因也不能直接决定一个功能蛋白。实际上,往往是通过基因的转录、表达产生一个蛋白质前体,在此基础上再进行加工、修饰,才成为一个具生物活性的蛋白质。这样的蛋白质还通过一系列的运输过程,到组织细胞内适当的位置才能发挥正常的生理作用。基因不能完全决定这样的蛋白质后期加工、修饰以及转运定位的全过程。而且,这些过程中的任何一个步骤发生微细的差错即可导致机体的疾病。纽约Rockefeller大学的细胞和分子生物学家Günter Blobel博士就是因其“蛋白质内在的信号分子活性,调节自身的细胞内转运和定位”研究上的卓越成就,获得了1999年诺贝尔医学奖和生理学奖。近些年来人们又发现蛋白质间亦存在类似于mRNA分子内的剪切、拼接,具有自身特有的活动规律。这种自主性不能从其基因编码序列中预测,而只能通过对其最终的功能蛋白进行分析。因此说,基因虽是遗传信息的源头,而功能性蛋白是基因功能的执行体。基因组计划的实现固然为生物有机体全体基因序列的确定、为未来生命科学研究奠定了坚实的基础,但是它并不能提供认识各种生命活动直接的分子基础,其间必须研究生命活动的执行体蛋白质这一重要环节。蛋白质组学(proteomics)研究即旨在解决这一问题。

蛋白质组(proteome)一词,源于蛋白质(protein)与基因组(genome)两个词的杂合,意指“一种基因组所表达的全套蛋白质”,即包括一种细胞乃至一种生物所表达的全部蛋白质。蛋白质组的研究不仅能为生命活动规律提供物质基础,也能为众多种疾病机理的阐明及攻克提供理论根据和解决途径。通过对正常个体及病理个体间的蛋白质组比较分析,我们可以找到某些“疾病特异性的蛋白质分子”,它们可成为新药物设计的分子靶点,或者也会为疾病的早期诊断提供分子标志。确实,那些世界范围内销路最好的药物本身是蛋白质或其作用靶点为某种蛋白质分子。因此,蛋白质组学研究不仅是探索生命奥秘的必须工作,也能为人类健康事业带来巨大的利益。