Skip to main content

氨基酸图鉴

这是一篇纯技术的文章。我写它的原因,是发现自己无论如何也搞不清所有的氨基酸,但在研究蛋白结构时,不能根据结构式反应出对应的氨基酸会带来很多不便。这篇图鉴收集了 20 种氨基酸的基本信息和常见用途,希望能通过拉近和它们的距离,更方便地记住它们。 :::

形而上地说,一个氨基酸就是一个同时包含了羧基和胺基的分子。所有生物的蛋白质水解出的氨基酸都是 L-α-氨基酸,也就是它们的胺基都位于 α 碳上,并且 α 碳的手性呈 L 构型。可以这样表示所有的 L-α-氨基酸:

在之后的结构式中,我们不会特别注明 α 碳的手性,但会把主链用灰色弱化。如果把结构式转写成化学式,则为 H2N-CH(-R)-COOH,或 R-C2H4O2N。

每种氨基酸都有一个三字母缩写和一个单字母缩写。三字母缩写往往取英语名的前三个字母,特例:色氨酸 Tryptophan-Trp;异亮氨酸 Isoleucine-Ile;天冬酰胺 Asparagine,谷氨酰胺 Glutamine-Asn, Gln。至于单字母缩写,则在安排时遵循一定顺序。

  • 独占一种首字母的氨基酸,直接用首字母命名:半胱氨酸 Cysteine-C;组氨酸 Histidine-H;异亮氨酸 Isoleucine-I;甲硫氨酸 Methionine-M;丝氨酸 Serine-S;缬氨酸 Valine-V。
  • 首字母重复的,出现频率高的优先用首字母命名:丙氨酸 Alanine-A;甘氨酸 Glycine-G;亮氨酸 Leucine-L;脯氨酸 Proline-P;苏氨酸 Threonine-T。
  • 剩下的,尽量用能联想到读音的字母:精氨酸 Arginine-R;苯丙氨酸 Phenylalanine-F;酪氨酸 Tyrosine-Y;色氨酸 Tryptophan-W。
  • 再后面,就随意安排剩下的字母:天冬氨酸 Aspartic acid-D;谷氨酸 Glutamic acid-E;天冬酰胺 Asparagine-N;谷氨酰胺 Glutamine-Q;赖氨酸 Lysine-K。
  • 最后发现的两种基本氨基酸,捞走了剩下的可用的字母:吡咯赖氨酸 Pyrrolysine-O;硒代半胱氨酸 Selenocysteine-U。
  • B 表示天冬氨酸/天冬酰胺族、Z 表示谷氨酸/谷氨酰胺族,X 按习惯表示任意氨基酸。这样,只剩 J 从未使用了。

如果要做氨基酸序列检索(常用的比如 BLAST 算法),那么序列往往就是用这 25 个字母表示的。

这篇文章中,我们把 20 种 DNA 碱基所编码的氨基酸,按它们侧链的化学性质,分成了 4 类:

  • 疏水氨基酸,8 种;
  • 中性氨基酸,7 种;
  • 碱性氨基酸,3 种;
  • 酸性氨基酸,2 种。

疏水氨基酸的侧链是非极性的,大部分是烃基或芳香基;碱性氨基酸的侧链含有碱性的胺基,因此在水溶液中容易吸引氢离子从而带正电;酸性氨基酸的侧链含有酸性的羧基,因此在水溶液中容易给出氢离子从而带负电。中性、碱性和酸性氨基酸又合称亲水氨基酸,或极性氨基酸。

在每一类下,氨基酸首先按照侧链的官能团种类分类,然后按照相对分子质量递增排列。

疏水氨基酸

丙氨酸 Alanine

  • 缩写:Ala (A)
  • 取代基:甲基 -CH3

蛋白质内的疏水氨基酸,基本都在疏水核心中抱团,也不会形成氢键,因此没什么存在感。丙氨酸又是其中最稳定,最简单的一个,侧链仅有一个甲基,因此它很容易作为反应副产品在生物体内产生——比如在肌肉中排除游离氨的丙氨酸-葡萄糖循环,就是由丙酮酸经转氨作用生成丙氨酸,从而被安全排出肌肉进入血液,再在肝脏中脱氨,合成葡萄糖。

缬氨酸 Valine

  • 缩写:Val (V)
  • 取代基:异丙基 -CH(-CH3)-CH3

把丙氨酸的甲基上再插两个甲基,就变成了缬氨酸。它的命名来自缬草酸,后者是正戊酸,缬氨酸的系统命名则是 2-胺基-异戊酸。

亮氨酸 Leucine

  • 缩写:Leu (L)
  • 取代基:异丁基 -CH2-CH(-CH3)-CH3

亮氨酸比缬氨酸长一个甲基的长度。它的命名来自它闪亮的晶体。

异亮氨酸 Isoleucine

  • 缩写:Ile (I)
  • 取代基:仲丁基 -CH(-CH3)-CH2-CH3

把亮氨酸的甲基从 β 碳挪到 α 碳,就变成了异亮氨酸。

缬氨酸、亮氨酸、异亮氨酸合称支链氨基酸 (Branched-chain amino acid, BCAA)。支链氨基酸是骨骼肌的主要构成部分,也是一种健身补剂,对肌肉合成、减轻运动疲劳有一定作用。

脯氨酸 Proline

  • 缩写:Pro (P)
  • 取代基:吡咯烷(经环化) -C3H6

脯氨酸是氨基酸中唯一一种仲胺,也就是 R2NH,而不是 RNH2。可以把它看作是先连一个丙基,然后环化形成的吡咯烷。

由于氮原子被环锁死,因此它在蛋白中成的 C-N 键不能随意旋转,而是被固定在一个二面角。这使得它成为典型的 α 螺旋破坏者,往往出现在螺旋的最末端。就像这个 meme 所说的:

它旁边的甘氨酸同样是 α 螺旋破坏者,在之后会提到。

连续的脯氨酸和羟基脯氨酸组成的蛋白有刚性的结构,因此这样形成的二级结构非常稳定,是胶原蛋白中的主要结构。

苯丙氨酸 Phenylalanine

  • 缩写:Phe (F)
  • 取代基:苯甲基 -CH2-C6H5

在丙氨酸上加一个苯基,就变成了苯丙氨酸。它最著名的用处应该是合成天门冬酰苯丙氨酸甲酯,也就是阿斯巴甜。

人体把苯丙氨酸代谢成酪氨酸,如果缺少相关的酶,就无法代谢苯丙氨酸。苯丙氨酸堆积,并通过尿液排出,就会形成苯丙酮尿症 (Phenylketouria, PKU)。因此苯丙酮尿症患者忌食阿斯巴甜。苯丙酮尿症是新生儿筛查中最重要的一项。

色氨酸 Tryptophan

  • 缩写:Trp (W)
  • 取代基:吲哚基甲基 -CH2-C8H6N

在丙氨酸上加一个吲哚基,就变成了色氨酸。它的命名可能来自于它在 280nm 的强烈吸收峰,要比另外两种芳香氨基酸:苯丙氨酸和酪氨酸高得多。(记得在天然 GFP 中的大设计中提到过,共轭体系越大,吸收峰的波长就越长,但这几个的共轭体系都没有大到吸收峰位于可见光区域。)

它最重要的用处是在人体内作为血清素,也就是 5-羟色胺的前体。血清素是一种神经抑制剂,能调节睡眠与情绪,血清素水平不足是抑郁症一大病因。

甲硫氨酸 Methionine

  • 缩写:Met (M)
  • 取代基:2-甲硫基乙基 -CH2-CH2-S-CH3

鸡蛋蛋白中很常见的氨基酸。我有一段记忆:在某次胡搞的化学实验中,我们将蛋清溶解后,向剩下的胶状不溶物中加入稀盐酸,产生了浓郁的臭鸡蛋味。这大概率就是甲硫氨酸的分解产生的硫化氢。

甲硫氨酸的密码子是 AUG,这同时也是转录的启动子,因此在许多未经过修饰的蛋白中,氮端第一个氨基酸就是甲硫氨酸。(比如野生型绿色荧光蛋白)

在硫上再连一个腺苷,就变成了S-腺苷甲硫氨酸 (SAM)。这是一种甲基供体,在人体内用于许多甲基转移反应。SAM 可以作为膳食补品买到,功能包括保护肝脏、治疗关节炎等。

中性氨基酸

甘氨酸 Glycine

  • 缩写:Gly (G)
  • 取代基:氢 -H

最简单的氨基酸,也是唯一一种没有手性的氨基酸(因为两边都是氢原子,没有不对称中心)。有些分类会把它归进疏水氨基酸,但一个氢原子到底是疏水基还是亲水基也不好说,因此只能根据整个分子的性质,把它归进亲水氨基酸。它的命名来自于它的甜味,甜度可以和蔗糖相媲美。但作为食品添加剂,甘氨酸的用量被严格限制,因为过多摄入甘氨酸会影响其他氨基酸摄取。

相比同样简单的丙氨酸,甘氨酸实在太自由了,可以随意转动,因此反而会破坏很多二级结构的稳定性,比如 α-螺旋。但因为它位阻最小,因此形成许多特殊结构时,需要在末端有一个不占空间的甘氨酸,比如在天然 GFP 中的大设计中提到的生色团,就需要一个不碍事的 Gly67。同理,在胶原蛋白中,需要每隔两个氨基酸(通常是脯氨酸)就有一个甘氨酸,因为没有别的氨基酸能挤在由脯氨酸形成的狭小键角中。

甘氨酸也是除了 γ-氨基丁酸 (GABA) 以外另一种重要的抑制作用神经递质,有心情舒缓的作用。

丝氨酸 Serine

  • 缩写:Ser (S)
  • 取代基:羟甲基 -CH2-OH

在丙氨酸上加一个羟基,就得到了丝氨酸。它最早在蚕丝蛋白中发现,因此得名。

苏氨酸 Threonine

  • 缩写:Thr (T)
  • 取代基:1-羟基乙基 -CH(-OH)-CH2

苏氨酸比丝氨酸又多了一个甲基。它的结构和苏阿糖类似,因此得名。苏阿糖把胺基变成了羟基,羧基上的羟基被挪到了另一端的甲基上。

丝氨酸和苏氨酸都是带有羟基的氨基酸,因此它们是常见的氢键给体和受体,也容易和有机磷、糖链等结合。大部分蛋白激酶的磷酸化位点都是丝氨酸或苏氨酸,许多神经毒气也通过和丝氨酸、苏氨酸强结合,阻止神经递质的正常工作。

半胱氨酸 Cysteine

  • 缩写:Cys (C)
  • 取代基:巯甲基 -CH2-SH

在丙氨酸上加一个巯基,就得到了半胱氨酸。也可以把它看作硫代丝氨酸——如果再用硒取代硫,就叫做硒代半胱氨酸,这也是一种基本氨基酸,但在人体内含量极少。人们最早从膀胱结石中分离出胱氨酸,把它沿双硫键切成两半后,就变成了半胱氨酸。

它最广为人知的作用是在蛋白中形成双硫桥键。这是二级结构中唯一一种共价的作用力,相比其他主要靠氢键等次级键形成的结构,要牢固不少。

由于巯基的还原作用,它是一种不错的抗氧化剂,可以添加在果汁中防止变色。(实验室中的抗氧化剂是巯基乙醇,也是一样的原理。)

酪氨酸 Tyrosine

  • 缩写:Tyr (Y)
  • 取代基:对羟基苯甲基 -CH2-C6H4-OH

它最早从乳酪中分离出来,因此得名。比起苯丙氨酸,它在对位上多了一个酚羟基。因此它和丝氨酸、苏氨酸功能类似,也是氢键的给体受体,同时也能被蛋白激酶作用。

有一类细胞受体,叫做受体酪氨酸激酶 (Receptor Tyrosine Kinase, RTK),是除了 G 蛋白偶联受体以外最重要的受体,它便是通过细胞膜内侧的酪氨酸被磷酸化来传递信息。

天冬酰胺 Asparagine

  • 缩写:Asn (N)
  • 取代基:胺基甲酰甲基 -CH2-CONH2

把天冬氨酸的羧羟基换成胺基,即为天冬酰胺。

天冬酰胺可以用酰胺基和糖链的半缩醛羟基成N-糖苷键,因此是糖蛋白中的常见氨基酸。另一种常见的成键位点是丝氨酸、苏氨酸等含羟基的氨基酸所成的O-糖苷键。

谷氨酰胺 Glutamine

  • 缩写:Gln (Q)
  • 取代基:胺基甲酰乙基 -CH2-CH2-CONH2

把谷氨酸的羧羟基换成胺基,即为谷氨酰胺。

谷氨酰胺是人体内含量最高的游离氨基酸,因为它起到了转运氨的作用。同时,人体内的许多氨基酸都从它们对应的酮经过胺化而来,而谷氨酰胺就是其中的氨基给体。谷氨酰胺还能用于合成嘧啶和嘌呤,因此它是蛋白和核酸合成的重要原料,决定了细胞的生长繁殖。现在的抗癌研究方向之一就是控制谷氨酰胺的活性,阻断癌细胞的增殖。

碱性氨基酸

赖氨酸 Lysine

  • 缩写:Lys (K)
  • 取代基:4-胺基丁基 -CH2-CH2-CH2-CH2-NH2

它的侧链有四个碳和一个胺基,是手最长、最灵活的氨基酸。

赖氨酸广泛用于蛋白构筑,因为它本身就具有两亲性质,胺基亲水而长长的烃链疏水。因此,它可以用于构筑膜蛋白,在许多蛋白靠近表面的地方都可以找到赖氨酸。

赖氨酸可以固定很多二级结构,提高结构蛋白的强度。比如胶原蛋白的三股螺旋就需要赖氨酸交联,细菌胞壁也含有赖氨酸。

赖氨酸末端的胺基可以和羧基形成共价键,将硫辛酸等小分子固定在蛋白质上。在丙酮酸脱氢酶、酮戊二酸脱氢酶之类三羧酸循环涉及的酶中,正是这种硫辛酰胺复合体负责搬运酰基和甲胺等中间产物。

组氨酸 Histidine

  • 缩写:His (H)
  • 取代基:咪唑基甲基 -CH2-C3H5N2

在丙氨酸上加一个咪唑基,就得到了组氨酸。组氨酸的碱性不强,接受给出质子的速度都极快,因此常被用于质子传递链,也能在酶的活性中心起酸碱催化作用。

组氨酸脱羧后得到组胺,这是一种血管扩张剂,可以缓解心绞痛,在炎症反应中也会被释放。

蛋白结构解析中,有一种常见的技术,是在设计蛋白时,添加由几个组氨酸组成的 His-tag。由于咪唑基的配位作用,这样的蛋白可以和镍柱中的镍离子鳌合,从而被分离出来,然后再用大剂量咪唑溶液洗脱,即得较纯的目标蛋白溶液。

精氨酸 Arginine

  • 缩写:Arg (R)
  • 取代基:3-胍基丙基 -CH2-CH2-CH2-NH-C(=NH)-NH2

精氨酸的侧链结构是一个三个碳的碳链再安一个胍基。它的命名来自鱼精蛋白,同时它也是精子蛋白的主要成分。

胍基的碱性很强(因为电荷可以在三个胺基/亚胺基之间共振分散),精氨酸的碱性也是所有氨基酸里最强的,基本始终处于正离子状态。因此,它在氨基酸中,可以通过自己的正电,稳定相邻氨基酸的负电。

酸性氨基酸

天冬氨酸 Aspartic acid

  • 缩写:Asp (D)
  • 取代基:乙羧基 -CH2-COOH

在丙氨酸上加一个羧基,就得到天冬氨酸。它的命名来自天门冬,一种草类植物。

它是鸟氨酸循环的原料之一,因此和同为原料的精氨酸一样,可以促进尿素生成,用于治疗氨中毒。

聚天冬氨酸是一种不错的天然可降解螯合剂。在农业、水处理、金属保护等方面都有用处,还可以作为绿色洗涤剂。

谷氨酸 Glutamic acid

  • 缩写:Glu (E)
  • 取代基:丙羧基 -CH2-CH2-COOH

谷氨酸比天冬氨酸长一个甲基的长度。它的命名来自于谷蛋白。

它的钠盐因为被作为味精而广为人知。在高温下,谷氨酸离子脱水生成焦谷氨酸,使得味精变得苦涩,因此味精不能经受高温。这个脱水反应会使得侧链的羧基和主链的胺基成环,因此在肽链中,可以封闭氮端。

谷氨酸是非常重要的兴奋性神经递质,可以刺激学习、记忆,NMDA、AMPA 受体都是通过谷氨酸工作的。

谷氨酸和天冬氨酸都常出现在蛋白的负电中心。镰状细胞贫血就是血红蛋白中的一个谷氨酸突变成了非极性的缬氨酸,从而影响了它的二级结构,使血红蛋白容易在低氧环境下发生多聚,从而成链。

如果把这 20 种氨基酸塞进一张图鉴里:

按单字母缩写顺序排列:

最后一提:20 种氨基酸中,有 8 种人体不能合成而必须从外部摄取,它们被称为“必需氨基酸”:缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、色氨酸、甲硫氨酸、苏氨酸、赖氨酸。

另外,半胱氨酸、酪氨酸分别由甲硫氨酸、苯丙氨酸直接合成,后者则是必需氨基酸,因此前者称为半必需氨基酸。还有,组氨酸婴幼儿不能正常合成。

剩下 9 种氨基酸,丙氨酸来自糖酵解产生的丙酮酸的胺化,丝氨酸来自同一路径产生的 3-磷酸甘油酸的氧化、胺化、水解,甘氨酸来自丝氨酸脱去侧链,也可以在肝脏中直接由二氧化碳和游离氨合成,天冬氨酸、天冬酰胺来自三羧酸循环中草酰乙酸的胺化,谷氨酸、谷氨酰胺来自同一循环中的 2-氧戊二酸的胺化,精氨酸来自小肠中由谷氨酸和谷氨酰胺合成的瓜氨酸的胺化,脯氨酸来自谷氨酸半醛的环化、还原。

下次,当你听到“色氨酸”、“半胱氨酸”等名字时,希望能对它们有点感觉。