經由觀察蛋白質可了解一個細胞的電位與生化活性。細胞中蛋白質占絕大多數,除具有阻隔的功能外,更執行了細胞內所有有關酵素的作用,並推動許多化學反應的進行。埋藏在細胞膜上的蛋白質,會形成通道或是幚浦,以控制小分子進出細胞。另外也有些蛋白質,在細胞間擔任傳遞訊息的角色,或是整合訊號將之由細胞膜傳至細胞核。還有一些小分子蛋白如:
topoisomerase
,能解開糾結的
DNA
;其他特化的蛋白,包括
antibodies
、
toxins
、
hormones
、
antifreeze
molecules
、
elastic
fiber
、
ropes
及
luminescence
的來源。在我們希望了解基因如何運作、肌肉如何收縮、神經電位的傳導、胎兒發育及身體各種功能之前,必須先進一步了解蛋白質。
2.
蛋白質的形狀與結構
以下我們將探討各種不同胺基酸所在的位置,如何影響一個蛋白質形成特定的三度空間結構,並更進一步地了解此特定結構與其功能之間的相互關係。
3.
胺基酸序列決定蛋白質結構
蛋白質包含有
20
種不同化學特性的胺基酸,一分子的蛋白質是由一長鏈胺基酸所組成,藉由共價胜肽鍵相互連接,因此也稱之為
polypeptides
。
每種蛋白質都有其獨一無二的胺基酸序列。沿著核心由重複序列所形成的
polypeptide
chain
稱為
polypeptide
backbone
;而附於此骨架上的周邊結構(即胺基酸的
side
chain
),則給予每個胺基酸不同的特性(圖
1
)。這些
side
chain
部分不具極性,呈疏水性;部分則帶有電荷,可能為正電或負電。
20
種胺基酸的原子結構,請見圖
2
;而縮寫表示法,請見圖
3
。
蛋白質的結構組成。一蛋白質包含了一條
polypeptide
backbone
,與其上附著的
side
chains
。每一種蛋白質的胺基酸序列及數目都不同,也就是這些具有不同化學特性的
side
chain
造成了每種蛋白質間的差異。
polypeptide
chain
的兩端分別帶有游離的胺基(
amino
group
)及羧基(
carboxyl
group
),各稱為
amino
terminus
(或
N-terminus
)和
carboxyl
terminus
(或
C-terminus
)。
原子就像是堅硬的球體,且有一定的凡得瓦半徑。因為原子間不能重疊的關係,大大地限制了多肽鏈中可能的
bond
angles
(圖
4
)。此限制加上其他空間上的交互作用,則嚴格的限制了原子在三度空間中的排列變化。然而,一條長的
flexible
chain
,例如蛋白質,仍然能以非常多的方式進行摺疊。另外,蛋白質鏈的摺疊也受到一些非共價性鍵結的限制;非共價鍵結有
3
種,分別是氫鍵、離子鍵與凡得瓦作用力。共價鍵的強度約是非共價鍵強度的
30
至
300
倍,但很多的非共價性鍵結一起作用,卻能使兩個
polypeptide
chain
緊密的結合。因此,摺疊結構的穩定性是由大量非共價性鍵結所組成的強度來決定。
另外還有一種微弱的作用力,也對蛋白質的構形有重要的影響。如同先前所提到的疏水性分子,包括部分非極性胺基酸,於水的環境下會聚集在一起,以減低其受水分子氫鍵分散力的作用。因此,胺基酸的極性與非極性,亦是決定蛋白質摺疊構形的重要因素。非極性胺基酸包括有
phenylalanine
、
leucine
、
valine
及
tryptophan
,它們傾向於聚集在分子的內部
(
如同油滴於水中一樣
)
,這樣能避免其存在於細胞內與水的接觸。而極性胺基酸則有
arginine
、
glutamine
和
histidine
,它們會傾向於排列在分子的外側,而能與水或是其他極性分子形成氫鍵。(圖
5
)當蛋白質內部有極性胺基酸存在時,通常會與其他極性胺基酸或是
polypeptide
backbone
形成氫鍵。(圖
6
)
蛋白質如何摺疊成一緊密的構形。具有極性
side
chain
的胺基酸傾向聚集在蛋白質的外側;而具有非極性
side
chain
的胺基酸則埋藏在蛋白質內部,形成一緊密包裹的疏水性核心(
hydrophobic
core
)。圖中的蛋白質約含
30
個胺基酸。
由於胺基酸不同的排列所產生之交互作用力,使得每種蛋白質具有其特殊的三級結構,最終摺疊所形成之構形擁有最小的自由能(
free
energy
)。研究蛋白質的摺疊,需利用高度純化的蛋白質。藉由某些溶劑的處理,能將
folded
chain
之間的非共價性鍵結打斷,使蛋白質被展開(
unfolded
)或變性(
denatured
),而喪失其原有的形狀,變成一
flexible
的多
胜
肽鏈(
polypeptide
chian
)。當溶劑移除後,蛋白質通常會自動地摺疊(
refold
)回原來的形狀,此過程稱做
renature
(圖
7
)。此表明了:主導蛋白質三維構形的所有資訊,皆包含在其胺基酸的序列裡。
一般情況下,蛋白質會摺疊成單一穩定的構形,此構形會在與其他分子作用時產生輕微的變化,而這與其功能有關。雖然蛋白質在無任何外在的幫忙下,即能摺疊成其正確的構形;但在活體細胞內,蛋白質的摺疊通常會受到
molecular
chaperones
的幫忙。此類蛋白會結合至已部分摺疊的多
胜
肽鏈,並幫助其形成最適當的摺疊構形。存在於細胞質的
chaperones
非常重要,它能防止新合成的蛋白質暴露出疏水性區域而相互作用形成沉澱。然而,蛋白質最終的三度空間結構,仍是由胺基酸序列所決定,
chaperones
只是使摺疊的作用進行的更確實。一個大的蛋白質分子通常由許多不同的
domains
構成,這些結構單位(
domains
)的摺疊部分是相互獨立的。而蛋白質結構相當複雜,因此要簡化地描述一個蛋白質結構,可以透過很多不同種的方式,而每一種描述方式,都是用來強調此蛋白質不同的特徵。
Helix
和β
Sheet
為蛋白質一般的摺疊模式
早於五十年前研究頭髮和蠶絲時,就發現所有的蛋白質三級結構中,一般包含有α
helix
和β
sheet
。最早發現的摺疊模式是在α
-keratin
中發現的α
helix
,其他如皮膚及其衍生物,像是頭髮、指甲和角的蛋白質,多含此種摺疊模式。相隔一年後,於
fibroin
(
silk
的主成分)中發現第二種摺疊模式,稱為β
sheet
。這兩種摺疊模式會這麼普遍,是因為
polypeptide
backbone
中的
N-H
和
C=O
間的氫鍵所造成的,跟
side
chain
的交互作用無關,所以導致這兩種結構可以出現在許多不同的序列之中。如圖
8A
及
8D
。
蛋白質的核心部分多為β
sheet
,兩相鄰的
polypeptide
chain
可以同方向或者反方向的方式,藉由氫鍵的力量形成堅固的結構,如圖
9
及
8D
。α
helix
為單一
polypeptide
chain
旋轉成堅硬的柱狀體,而每隔四個
peptide
bond
就可於
N-H
和
C=O
間形成氫鍵,所以每隔
3.6
個胺基酸,可旋轉上升形成一固定的旋轉體,如圖
8A
。
細胞膜中的
transport
protein
和
receptor
中,α
helix
的結構相當多,通常藉由短的α
helix
摺疊模式貫穿細胞膜的雙層結構。而α
helix
是由大量的非極性胺基酸所組成,其非極性的
side
chains
會露在外頭,而極性的
polypeptide
backbone
則會躲在裡頭。
helix
和α
helix
會相互纏繞形成一特殊的穩定結構,稱為
coiled-coil
。會形成這種結構是因為此兩個α
helix
含多數非極性
(
厭水性
)
的胺基酸,所以兩兩相互纏繞,使非極性的
side
chain
包覆於兩α
helix
間的內側,形成較為長形的蛋白質,如α
-keratin
,可提供皮膚的強韌度;而肌凝蛋白亦為如此,以提供肌肉收縮的能力,如圖
10
。
“abcdefg”
七個胺基酸相繼排列所形成的α
helix
。胺基酸
“a”
和
“d”
在圓柱狀的表面靠的很近,彼此可連成一條稍微彎曲的線。會形成
coiled-coil
結構的蛋白質都具有非極性的胺基酸就像
“a”
和
“d”
的位置一樣。
(B)
圖所示,兩條α
helix
會藉由非極性的
side
chain
的交互作用而互相纏繞;而極性的胺基酸則被暴露在水溶液的環境中。
利用
x-ray
crystallography
所測出的
coiled-coil
之原子結構圖。
6.
有機體的基本單位為蛋白質
Domain
蛋白質是由無數的原子所構成,而原子間則藉由共價鍵和非共價鍵來連結,而形成一複雜的三度空間結構。目前有電腦軟體可提供三度立體空間的圖像,以呈現各種不同旋轉角度的立體結構。生物學家把蛋白質結構分成四個等級:一級結構
(primary
structure)
指胺基酸的序列;二級結構
(secondary
structure)
由α
helix
和β
sheet
所構成;三級結構
(tertiary
structure)
指的是整個
polypeptide
chain
在三度空間形成的樣子;而如果一個蛋白質是由兩個以上的
polypeptide
chain
所組成,則最終形成的結構稱為四級結構
(quaternary
structure)
,如圖
11
。
Protein
domain
為一部分的
polypeptide
chain
所形成之獨立、緊密、穩定的小結構,通常約為
40
至
350
個胺基酸,在大分子的蛋白質中可視為一基礎單位,而不同的
domain
提供不同的功能。
model
表示之,並包含一
ATP
受質(
substrate
)。
(B) spacing-filling model
。
Src
protein
與
ATP
結合的位置是在兩個
kinase
domain
的交界處。
SH2
domain
的詳細結構可參見圖
16
。
最小的蛋白質只含一個
domain
,而大分子的蛋白質含數十個
domain
。一個
domain
可能由數個α
helix
、β
sheet
或兩種摺疊形式的組合所構成,這些不同的組合都稱為
protein
fold
。截直目前為止,發現在
10,000
個已知詳細結構的蛋白質中,約含有
1000
個不同的
protein
fold
。
7.
在眾多可能的
Polypeptide
Chains
中只有少數對生物有用
胺基酸共有
20
種,故
4
個胺基酸就有
20x
20x 20x 20x =160,000
種可能的組合方式。理論上,應該有相當多種不同的
polypeptide
chain
產生,但只有相當少的形式可以有穩定的三度空間結構,其機率約為百萬分之一。事實上,在細胞中的所有蛋白質都會採取獨特且穩定的構形存在。原因是天擇(
natural
selection
)的作用,使對細胞存活沒有幫助的蛋白質被淘汰掉。天擇的作用不只使現今的蛋白質擁有如此的胺基酸序列所以可以有一非常穩定的構形;而且也使此構形有其化學特性,得以在細胞中執行特定的催化或結構上的功能。蛋白質的構築十分精準,即使是一個胺基酸改變了幾個原子,有時候也會破壞整個分子的結構,而造成功能的喪失。
8.
蛋白質可歸類為許多家族(
Families
)
所謂
protein
family
,是指一群胺基酸序列和三級結構都非常相似的蛋白質。
Serine
proteases
為一個蛋白質水解酵素的大家族,包含消化酵素
chymotrypsin
、
trypsin
、
elastase
和一些與血液凝結有關的
protease
。雖然這些蛋白質的胺基酸序列和三級結構都非常相似,如圖
12
,但其酵素活性、分解的蛋白質或
peptide
bond
皆不同。其他蛋白質家族亦是如此,但也有許多蛋白質家族,其成員的胺基酸序列差異性較大,因此不能只依據胺基酸序列來歸納其所屬的蛋白質家族,必須配合其三度空間的結構,才可歸納分類之。例如:酵母菌的
α2
protein
和果蠅的
engrailed
protein
,此兩者都是基因調節蛋白(
gene
regulatory protein
),屬於
homeodomain
family
的成員。但是,在它們
60
個胺基酸長的序列中只有
17
個胺基酸相同,所以只有在比較其三度空間結構的時候,才能得知兩者的相似性,如圖
13
。
同一家族的蛋白質成員,常常有不同的功能。原因是演化過程中的篩選作用,讓有部分胺基酸序列改變的成員,在生物活性上產生有用的變化,使得每個家族成員在功能上都有各自不同的特性。但也有許多胺基酸的改變,並不會造成蛋白質結構或功能上的影響。
當一生物的基因體序列(
genome
sequence
)被定出來後,蛋白質家族便能很容易地被辨認。例如:經由
DNA
序列的測定,發現在線蟲綱
Caenorhabditis
elegans
九千七百萬鹼基對的
genome
中,包含有超過
18,000
個基因。再透過序列的比對,發現這些基因的產物,包含許多屬於不同
protein
family
的
domains
,例如:有
388
個基因含有
protein
kinase domains
、
66
個基因含有
DNA
和
RNA
helicase domains
、
43
個基因含有
SH2
domains
、
70
個基因含有
immunoglobulin
domains
,以及
88
個基因含有
DNA
–binding homeodomains
。
比較兩種
serine
protease
的構形。圖上所顯示的為
elastase
和
chymotrypsin
的脊骨構形(
backbone
conformation
)。這兩個酵素的構形非常相似。圈起來的部分表活性區域(
active
site
),為與受質結合的地方,並利用水解的方式將受質的胜肽鍵切斷。
有關於細胞的新知進展的很快,在
1950
年代的時候,對蛋白質的胺基酸排列還不是很清楚。到了
1960
年代,第一個蛋白質三度空間結構,經由
X-ray
結晶繞射法被測定出來。至於現在,要將基因序列轉成蛋白質序列,並產生大量純的蛋白質已經不再是大問題了,這都要歸功於
DNA
轉殖技術及基因工程技術所賜。但是,蛋白質三度空間結構的決定上,仍存在著許多的困難。因為利用
X-ray
繞射的技術時,蛋白質必須先養成晶體(
protein
crystal
),而並不是所有的蛋白質都能養成晶體,所以只能靠著
trial-and
error
的方法去試,直到成功為止。
目前的資料庫中,已包含了五十萬筆以上的已知蛋白質序列,而且隨著越來越多基因體(
genomes
)被定序出來,資料還在以非常快的速度增加中。強有力的電腦搜尋程式,能將每個新發現的蛋白質,與資料庫中的所有資料做比對,尋找可能的相關性。同源蛋白質(
homologous
proteins
)是指一群蛋白質其基因來自同一個共同的
ancestral gene
,而這些蛋白質的胺基酸序列,在統計上必須有顯著的相似性才行。
因為資料庫裡的蛋白質序列非常多,搜尋程式會找到許多
nonsignificant
match
的資料,造成一背景值的雜訊,以致於很難挑出所有的資料,只能挑出相關性最高的部分。一般來說,兩個蛋白質的序列,相似度須達
30%
以上,才能確定會成為符合的資料,而被挑選出來。然而,許多短的
signature
sequences
(
”fingerprints”
)為特定蛋白質功能的指標,這些指標序列能廣泛地用於找到同源性較遠的序列(圖
14
)。
可利用短的
signature
sequence
以尋找同源的
protein
domains
。兩個短的胺基酸序列,分別為
15
和
9
個胺基酸長,就能利用來在廣大的資料庫中搜尋出
SH2
domain
。此處列出來的是人類與果蠅的
Src
protein
之
SH2
domain
的前
50
個胺基酸。比較的結果,序列相同的位置以一個字母的胺基酸縮寫表示,若是相近的就以
+
號表示,而完全不同的則以空白表示。
11.
透過計算的方法(
Computational
Methods
)能將胺基酸序列與已知的
Protein
Folds
做配對
我們知道可以透過很多的方式使蛋白質具有相同的三度空間結構;而且在演化的過程中,會發生許多隨機的突變,使得胺基酸的序列產生改變,但並沒有造成蛋白質構形(
conformation
)上的重大改變。因此,結構生物學家想要測定出蛋白質在自然狀況下,可能含有的所有
protein
folds
,並且設計出一套以電腦為基礎的方法,能將某一胺基酸序列與先前已測定出構形的
domains
做比對,以檢測出此一胺基酸序列可能代表的
domain
為何。
計算的方法稱為
“threading”
,能將一胺基酸序列與特定的
protein
fold
做配對。電腦會從每種可能的
folds
中,搜尋出與此胺基酸序列最合適的結構,並以數值化的分數來反映其結構穩定性的評估結果。
某些胺基酸序列能找到很適合的三度空間結構;然而,有些胺基酸序列,在已知的
protein
folds
中,並不能找到可能相符的一種。所以結構生物學家必須利用
x-ray
與
NMR
的方法對這類蛋白質做研究,以期能找出更多的
protein
folds
,而能建立一個含有完整
library
的資料庫,包含有自然界中存在的所有
protein
folds
。有了這樣的
library
後,再加上計算方法的改進,可能就能使一蛋白質在知道其胺基酸的序列後,很快地就能得到其最接近的三度空間結構。
12.
某些
Protein
Domain
稱為模組(
Module
),可形成許多不同蛋白質的某個部分
如同先前的陳述,大部分的蛋白質是由一系列的
protein
domains
所構成,這些
domains
是由
polypeptide
chain
的不同區域各自摺疊而形成的緊密結構。此類
multidomain
proteins
的產生,應是由於
encode
各個
domain
的
DNA
序列意外地相接在一起,而創造了新的基因。新的結合表面(
binding
surfaces
)常常是因為
domains
互相並列而產生。許多大的蛋白質被發現是由已存在的
domains
以新的組合方式而產生的,此過程稱為
domain
shuffling
(圖
15
)。有一些
protein
domains
在演化過程中特別容易移動(
mobile
),這些
domains
稱為
protein
modules
,通常會小於一般平均的
domains
,約
40-200
個胺基酸長;而且它們似乎擁有特別容易變化的結構。
SH2
domain
即為一例(圖
16
),而圖
17
中也顯示了幾個
protein
modules
的結構。
每個
module
都有由
β
strands
形成的穩定核心結構,而較不整齊的
loops
則從此處突出。這些
loops
會形成與其他分子結合用的
binding
sites
,例如
immunoglobulin
fold
,為構成抗體分子的基本部分。這類以
β
sheet
為基礎的
modules
能成功地演化,是因其提供了很方便的構造,只要對突出的
loops
做小小的改變,就能產生新的
binding
sites
。
Protein module
的另一個特徵是可以很容易地插入其他的蛋白質中。圖
17
中有五個
modules
的
N
端和
C
端位在相對的兩極。此種
“in-line”
的排列方式,意味著當
DNA
encode
這類
module
時發生了
tandem
duplication
,而
duplicated
modules
則可以很容易地連結成串以形成
extended
structure(
圖
18)
。
Stiff
extended structure
是由一系列模組所組成,尤其在細胞外基質分子及細胞表面的接受器之
extracellular
portion
最常見。其他模組包括
SH2
domain
及
kringle
(
圖
17)
。
: domain shuffling
。蛋白質在演化的過程中會發生
protein
domain
的
shuffling
。
Chymotrypsin
由兩個
domain
所形成。而下面的三種
protease
則具有高度的調節性,而且也較具專一性,它們的
protease
domain
會與其他的
domains
相連接,可能是一個或一個以上與
EGF
同源的
domain
,或
calcium-binding
protein domain
或
“kringle” domain
。
: SH2 domain
的四種描繪方式。
某些
protein
modules
的三度空間結構。球形的部分表
N
端和
C
端。
由鏈續的
protein
module
所形成的延伸結構(
extended
structure
)。圖為
fibronectin
中的四個
fibronectin
type 3 modules
。
(A)
ribbon model
。
(B) spacing-filling model
。
13.
人類基因體譯成(
encode
)一套複雜的蛋白質
人類的染色體只包含了
30,000-35,000
個基因。就基因數目而言,其複雜度不到線蟲的
2
倍之多。而基因組(
genome
)的序列也顯示了,脊椎動物的
protein
domains
幾乎全來自無脊椎動物,人類的
domains
中只有
7%
是屬於脊椎動物所特有的。然而,平均來講我們人類的蛋白質複雜度較高。在脊椎動物演化的過程中發生了
domain
shuffling
,引起許多
protein
domains
產生新的組合,結果造成人類蛋白質中
protein
domains
的組合幾乎是在蟲或蒼蠅中發現的兩倍。舉例來說,在人類蛋白質中的
trypsinlike
serine protease domain
至少與
18
種其他的
protein
domains
發生連結,然而在蟲體中只發現有
5
種不同
domain
會以共價鍵鍵結方式與此
domain
結合。這項額外的變化,大大地增加了人類的蛋白質之間交互作用的範圍。
14.
大的蛋白質分子通常包含一條以上的
polypeptide
chain
protein chain
靠著微弱的非共價鍵以摺疊成特定的構形(
conformation
),而蛋白質之間也同樣地藉由這些非共價鍵來相互連結,在細胞內形成較大的結構。蛋白質表面上的任一區域若能與另一分子藉由非共價鍵產生作用,則此區域稱為結合位(
binding
site
)。假使一個蛋白質的
binding
site
能辨識另一蛋白質的表面,則兩個
folded
polypeptide chains
之間會在幾何位置上產生緊密的結合,而創造出一個更大的蛋白質分子。這類大型蛋白質中的每一條
polypeptide
chain
,都稱做蛋白質次單位(
protein
subunit
)。舉一簡單例子說明之:
Cro
repressor protein
為細菌中的一種基因調節蛋白,可結合到
DNA
上,而關掉基因的作用。而此蛋白質是由兩個一模一樣的
folded
polypeptide chain
以頭對頭的方式結合在一起,形成的對稱性複合物。這兩個相同的
folded
polypeptide chain
即為
protein
subunits
。此外,
neuraminidase
是由四個相同的
protein
subunits
所組成,彼此以頭對尾的方式排列,而形成一環形結構(圖
19
)。
細胞中很多蛋白質包含有兩種或兩種以上的
polypeptide
chain
。如血紅素(
hemoglobin
),它存在於紅血球中攜帶氧氣,是由兩條相同的
α-globin
subunits
和兩條相同的
β-globin
subunits
所組成(圖
20
)。這類由
multisubunit
所組成的蛋白質,在細胞中相當常見,而且它們可以非常的巨大。
由多個相同
protein
subunit
所組成的蛋白質分子。酵素
neuraminidase
的環狀結構,是由四個相同的多肽鏈所組成的。
由兩個不同的
subunits
以對稱方式組合成的蛋白質。血紅素是紅血球中很豐富的蛋白質,包含了兩個
α
globin
和兩個β
globin
。而這四個多肽鏈分別都含一個
heme
分子,此為氧所結合的位置。因此,血液中每一個血紅素分子可以結合四個氧。
15.
有一些蛋白質以長螺旋絲(
Helical
Filament
)方式存在
有些蛋白質分子能夠組合起來形成絲狀的結構,其長度可以很長,甚至橫跨整個細胞。如果一個分子上具有一個
binding
site
可以與同一分子上的另一區域的表面做結合,則這些相同的分子便能相互串聯成一條很長的
chain
(圖
21
)。例如
actin
filament
,由許多
actin
蛋白分子,組成長的螺旋狀結構(圖
22
)。為什麼螺旋狀結構(
helix
)在生物學中這麼地普遍
?
就如我們知道的,生物性結構常常是把許多非常相似的
subunits
連接起來,而形成一長的重複性鏈狀結構(
repetitive
chain
)。如果所有
subunits
都一樣,則相鄰的
subunit
間只能以單一種方式做連接,以使自由能降到最低。結果每一個
subunit
就這樣依序地一個接一個,以同樣的方式連結在一起;然而這些
subunits
很少會連接成一條直直的
chain
,而是形成螺旋狀的結構(圖
23
)。依照螺旋階梯的旋轉方式,可分為右手旋(
right-handed
)和左手旋(
left-handed
)。
Helix
在生物結構中非常常見,
subunits
間或是由小分子藉由共價鍵相互連接(例如:
amino
acids in an
α
helix
),或是由較大的蛋白質分子藉由非共價鍵相互連接(例如:
actin
分子連接成
actin
filament
)。
(A-D)
當一連串的
subunits
以規律的方式相互結合後,則會形成一螺旋狀的結構。
(A)
、
(B)
、
(C
、
D)
的
α
helix
,每一圈的
subunit
數分別是
2
個、
3
個和
6
個。
(E)
helix
可以有兩種旋轉方式,一為右手旋(
right-handed
),一為左手旋(
left-handed
)。
16.
蛋白質分子可有細長、纖維狀的外形
到目前為止,我們討論的蛋白質皆為球狀蛋白,而球狀蛋白是由多
胜
肽鏈(
polypeptide
chain
)疊合成緊密的球狀,且擁有不規則的表面。酵素多為球狀蛋白:即使許多是由許多
subunits
組成,不僅巨大且複雜,不過多數整體而言呈圓形。相反的,其他蛋白質因細胞需要各個蛋白質分子伸展很長的距離,通常擁有較為簡單且細長的三度空間結構,我們一般稱之為纖維狀蛋白(
fibrous
proteins
)。
細胞內纖維狀蛋白的其中一個大家族便是由α
-keratin
及其親屬(
relatives
)所組成。角蛋白纖維(
keratin
filaments
)非常的穩定,且是存活時間很長的結構,如頭髮、角及指甲之主要成分。α
-keratin
分子是由兩個相同的
subunit
組成的二聚物(
dimer
),每個
subunit
各為一長的α
helix
,兩者互相纏繞而形成
coiled-coil
。在這些
coiled-coil
區域的兩端,便由包含結合位置的
globular
domains
所覆蓋。這使得這類的蛋白質能組合成繩索狀的
intermediate
filaments
,此為細胞骨架(
cytoskeleton
)的重要組成。
纖維狀蛋白在細胞外特別豐富,它們是膠狀的胞外基質(
extracellular
matrix
)的主要成份,用以幫助聚集在一起的細胞相互結合而形成組織。胞外基質蛋白經由細胞分泌到外圍,而在那裡通常會組合成薄板(
sheet
)或長纖維。膠原蛋白(
collagen
)在動物組織中是這類蛋白含量最多的。一個膠原分子由三個長的多肽鏈構成,每一多肽鏈的第三個位置皆為非極性的胺基酸
-glycine
。這個規則的結構,讓鏈與鏈之間能互相纏繞,而形成長的規則三螺旋(
triple
helix
)(圖
24
)。接著,許多的膠原蛋白分子彼此以側面或頭尾方式相互結合,而形成非常堅韌的
collagen
fibrils
,以提供結締組織的張力。
胞外基質中和膠原蛋白全然相反的一種蛋白質為彈性蛋白(
elastin
)。彈性蛋白分子是由相當鬆散且無結構性的多肽鏈,經由共價鍵結合成橡膠般具有彈性的網狀物。和多數蛋白不同的是,它們不含有獨特的穩定結構,但能夠從一個構形回復到另一個構形(圖
24B
)。這使得彈性纖維能讓表皮及其他組織,如動脈與肺臟,能伸展與反彈而不會有撕裂發生。
許多蛋白質分子不是附著於細胞膜外,便是被分泌出去成為胞外基質的一部分。所有的這種蛋白都直接的暴露在胞外的狀態下。為了要維持它們的結構,這類蛋白的多肽鏈常藉由共價鍵交錯連結而達到穩定。這些連結能將兩個胺基酸綁入一個蛋白質內,或是將兩個不同的多肽鏈結合在一個多單元(
multisubunit
)的蛋白質內。在蛋白內最一般的交錯連結便是雙硫鍵的共價鍵鍵結。雙硫鍵形成於蛋白質即將準備輸出到膜外時,它們主要是在內質網內藉由一個酵素催化而形成,此酵素能將已摺疊的蛋白質內兩個鄰近的
cysteine
支鏈上的
-SH
group
連結在一起(圖
25
)。雙硫鍵並不會改變蛋白質的構造,但卻會扮演類似
atomic
staples
的作用,去強化其最偏愛的結構。舉例來說,
lysozyme
(一種在淚液中能分解細菌細胞膜的酵素)就是因為藉著這樣的交錯鍵結而達穩定,才能長期保有它的抗菌活性。
圖中所顯示的為相鄰的
Cysteine
side chains
如何形成共價的雙硫鍵結。這些鍵結可以連結一條
polypeptide
chain
裡的不同部分,也可以連結兩個不同的
polypeptide
chains
。因為打斷一個雙硫鍵所需的能量比打斷整套的非共價鍵所需的能量還大的多,所以雙硫鍵可以提供蛋白質重要的穩定力量。
18.
蛋白質分子通常擔任結合成大分子結構的次單位(
Subunit
)
一個蛋白質分子能和自我結合形成環或纖維在細胞內產生更大的結構
-
超分子結構,如酵素複合物、核醣體、蛋白纖維(
protein
filaments
)、病毒、胞膜等。這些大物體並非由單一、巨大、共價鍵接合的分子所形成,其實它們是由許多獨立製造的
subunit
藉由非共價鍵結合而成。
利用小的
subunit
來建築大結構有幾個優點:
由單一或一些重複的小
subunit
來構成一個大的結構僅需小量的基因資訊。
因為
subunits
間是由許多能量較低的鍵結相互組合,所以組構(
assembly
)或解構(
disassembly
)可被迅速的控制及回復。
結構組合中發生的錯誤更容易被避免,因為在組合的過程中,修正機制可以作用而排除畸形的
subunits
。
有些蛋白質次單元(
protein
subunits
)利用六邊形圖樣組合成平板。特化的膜蛋白有時候在脂質雙層膜(
lipid
bilayers
)中會有如此的排列。而各個
subunit
在幾何形態上只要有些微的改變,六邊形的平板便能轉變為管狀(圖
26
),或者,如果改變的更多,便會形成一個中空球體。能與特定的
RNA
及
DNA
分子結合的蛋白質管和球便成為病毒的外套。
封閉型的結構,如環、管、球體,能提供額外的穩定性,因為它增加了兩個
protein
subunits
間的鍵結數。此外,因為這樣的結構是由
subunit
間的交互作用而成,因此,只要對各個
subunit
有些小改變便能趨使整個大結構的組構(
assemble
)亦或是解構(
disassemble
)。這樣的原則在許多簡單的病毒的中空球狀蛋白質外套(
protein
coat
)或
capsid
上最能生動的闡述。
capsid
通常由數以百計的相同
protein
subunits
所構成,用以包圍和保護病毒的核酸(圖
27
)。
capsid
的蛋白質必須擁有一個能適時改變的結構:它必須有數種不同的接觸面以構造球體,且還能改變排列讓核酸跑出,以便一旦病毒進入寄主細胞就能起始病毒的複製。
球形病毒的結構。在許多病毒中,相同的
protein
subunits
會組成一球形的空殼(
capsid
)以包圍病毒的基因體(
genome
)。因為幾何學上的因素,不超過
60
個相同的
subunits
才能以完全對稱的方式結合在一起。如果些微的不規則能被允許,就能有更多的
subunits
參與,而能組成更大的
capsid
。此例為
tomato
bushy stunt virus
(
TBSV
),為球形的病毒,具有一個由
180
個相同
copy
所形成的巨大
capsid
。
19.
在細胞內許多結構都能自我組合而成
在細胞內形成許多高分子複合物的資訊一定包含在
subunit
本身之內,因為純化的
subunit
在適當的條件下能自動組合成最終結構。第一個能從組成部分自我組合的巨大高分子集合體(
macromolecular
aggregate
)為菸草鑲嵌病毒(
TMV
)。這個病毒是一個由圓柱狀蛋白環繞一條螺旋的
RNA
core
而成的長桿狀病毒(圖
28
)。如果分離的
RNA
與
protein
subunits
一起混合於溶液中,它們便會重新組合成具有完全活性的病毒顆粒。這個組合過程是令人意外的複雜,其中包含了雙環蛋白的形成,雙環蛋白扮演如同中介者的角色,用以幫助病毒外套的形成。
另外一個複合高分子集合體能從組成部分再組合(
reassemble
)的是細菌的核醣體。其結構由
55
個不同的蛋白質分子與
3
個不同的
rRNA
所構成。如果將分離的這些組成部分培養於適當的條件下,它們便能自動的再形成原本的構造。最重要的是,這樣重建而成的核醣體能夠執行蛋白質合成的工作。正如我們所預期的,核醣體的再組成遵循著一個特殊的途徑:當特定的蛋白質和
RNA
結合後,這個複合物接著被其他的蛋白質所辨識,如此進行下去直到結構完成。
coat
是由很多相同的
protein
subunits
所組合成的。
(B) TMV
的部分結構模擬圖。一條長
6000
個核苷酸的
RNA
分子被包在一個螺旋形的外套裡。此外套由
2130
個相同的
coat
protein
所構成。純化的
RNA
和蛋白質分子在試管中可以自己組合成具有感染能力的完整病毒顆粒。
甚至是比較簡單的結構也可能會缺少一些合成必須的構成要素。在某些細菌病毒(
bacterial
viruses
)的形成中,例如頭部,是由許多單一蛋白質次單元在第二種蛋白質構成的臨時鷹架上構成。因為在最終的病毒顆粒第二種蛋白並不存在,所以頭部的結構無法在兩種蛋白質分離的情形自動組合而成。另一個例子是,蛋白質水解在一般的
assembly
process
中是重要且不可回復的。就連某些小蛋白的
assembly
亦是如此,如結構性蛋白質膠原蛋白(
collagen
)及賀爾蒙胰島素(圖
30
)。從這些簡單的例子來看,要組成較複雜的結構像粒線體或線毛結構,也是需要配合其他細胞組成所提供在時間上及空間上的狀況。
如果胰島素的雙硫鍵被破壞,則無法有效率地再自動重新形成。胰島素一開始會先以
proinsulin
的方式形成,然後當其摺疊成特定的形狀後,便會被蛋白質水解酵素切掉一部分。被切除的那部份包含了一些資訊是蛋白質自動摺疊成正常構形所需的。所以當胰島素的雙硫鍵被破壞後,其
A
chain
和
B
chain
就很難再自動締結合回去。
21.
總結
蛋白質分子的三度空間結構是由其胺基酸序列來決定。摺疊的結構則藉由多肽鏈上不同部分之非共價鍵的交互作用而達穩定。擁有疏水性支鏈的胺基酸傾向群聚於分子的內部;而鄰近的
peptide
bonds
間會產生局部的氫鍵交互作用,因而產生α
helix
和β
sheet
的結構。
球狀區域,卽
domains
,是建構蛋白質的模組化單元(
modular
units
);這些功能區一般包含
40
至
350
個胺基酸。典型的小蛋白質,由單一的
domain
組成;而大的蛋白質則由短的多肽鏈連結數個
domains
構成。當蛋白質進一步發展,
domains
會被修飾且和其他
domains
結合而構築出新的蛋白質。參與很多蛋白質合成的
domains
稱之為蛋白質模組(
module
)。至今,在大約一萬個已知的蛋白質結構中,發現一個
domain
約有
1000
種不同的摺疊方式。
蛋白質間也利用非共價鍵相互結合而組合成更大的結構。如果蛋白質上具有能與自己表面結合的
binding
site
,則其可組合成二聚體(
dimer
)、封閉環、球殼、或螺旋聚合體。雖然將蛋白質與核酸在試管中混和,它們能自動組合成複合的結構(
complex
structure
),但有許多的生物組合過程還是牽涉不可回復的步驟。總結的說,並非所有細胞內的結構都能在分離後再自動組合。
22.
參考資料
1. Bruce Alberts, Alexander
Johnson, Julian Lewis, Martin Raff, Keith Robers, Peter Walter. 2002.
Molecular biology of the cell, p129-156, 4nd ed. Garland Science, New