刘武艺 非洲爪蟾的碱性螺旋–环–螺旋转录因子的鉴定与初步分析
|
7
录调控区、寡聚化位点及核定位信号区等
[1-5]
。有关转
录因子结构和功能的研究是动植物分子生物学研究
的前沿领域,转录因子因其含有
DNA
结合蛋白的不
同可以划分为不同的基因家族
[1-3]
。碱性螺旋–环–螺
旋
(basic helix-loop-helix
,
bHLH)
转录因子是目前最大
的转录因子家族之一,并被公认为在细胞增殖与分
化、肌肉形成、神经元、肠和血、性别决定等遗传发
育过程中具有重要作用
[4-8]
,许多课题组对
bHLH
转录
因子展开了研究。最早报道的是鼠转录因子
E12
和
E47
[9]
,后来的研究将动物
bHLH
转录因子划分为
6
大类,这些大类又细分为
45
个亚类或蛋白家族
[4,6,10,11]
。现在,动物的
bHLH
家族成员的分类、进化
及功能分析现已积累大量资料,且基本清楚各家族组
成及成员的功能。由于生物物种基因组测序和全基因
组草图绘制工作的陆续完成,越来越多的转录因子被
分析和鉴定出来,这就为从整体上研究某物种转录因
子的功能和进化等重要问题提供了可能。因此,从全
基因组角度研究某一类型的转录因子或调控因子具
有重要的意义。现今,动物
bHLH
转录因子家族已经
在人、小鼠、大鼠、鸡、蚕、蜜蜂等许多物种的基因
组中被鉴定和研究
[4-17]
。但在非洲爪蟾
(
Xenopus laevis
)
基因组中尚未进行有关的研究。
非洲爪蟾是较早用于生物医学的重要模式动 物
之一
[19]
。本研究以
Atchley
et al. (1999)
的
bHLH
转录
因子分类原则
[10]
,
Ledent et al. (2001, 2002)
定义的
45
个
bHLH
代表性基序
(domains)
和
118
个人
bHLH
基因
序列为鉴定标准
[6,11]
,从非洲爪蟾的基因组数据库鉴
定出
98
个
bHLH
转录因子,进行基因本体论
(Gene
Ontology
,
GO)
富集分析,以期分析和了解这些
bH LH
基因的功能信息。
2.
材料与方法
2.1. BLAST
搜索和
bHLH
转录因子的鉴定
根据
Atchley
et al. (1999)
的
bHLH
转录因子分类
原则和
Ledent et al. (2001, 2002)
定义的
45
个代表性
bHLH
基序
[6,11]
进行
TBLASTN
和
BLASTP
,搜索候选
bHLH
基序。其中,每条序列都被用于对
NCBI
的非
洲爪蟾的基因组数据库
[19]
进行反复搜索
(http://
www.ncbi.nlm.nih.gov/genome/guide/frog/)
,搜索 的严
谨值设为
E
< 10
,以获取所有可能的
bHLH
序列。同
时,我们也检索蛙蟾数据库
Xenbase
[20]
,最后根据
scaffold
或基因克隆
(genomic clone)
的编号、编码区、
基因和蛋白获取号、序列比对的结果等信息,去除冗
余序列,得到最终采用的
bHLH
因子序列 。
2.2.
序列比对和基序比较
通过
BLAST
搜索得到的爪蟾蛋白质序列,用
ClustalX 2.0
[21]
进行比对,接着用
GeneDoc 2.6
[12]
做保
守序列的分析和比较。
2.3.
基因本体
(Gene ontology
,
GO)
注释的富集
分布分析
利用
DAVID
生物信息工具
[22,23]
做
GO
注释的富
集分析,富集分布的显著性
P
值和假阳性率
(False
positive rate
,
FDR)
均被控制在
0.05
以下。
2.4. BHLH
同源基因的系统发育分析
系统发育分析
(Phylogenetic analyses)
用最大似然
估计软件
PHYML 2.4.4
[24]
和贝叶斯推断软件
Mrbayes
3.12
[25]
进行系统发育树推断。其中,贝叶斯推断采用
两个独立的马科夫链进行推断
(
进行
14,000,000
步马
科夫链抽样,抽样频率为每代抽样
100
个
)
,取
50%
一致树作为最终的系统发育树。
3.
结果与讨论
3.1.
爪蟾
bHLH
转录因子的鉴定
利用上述
bHLH
代表性基序、
TBLASTN
和
BLASTP
算法及系统发育分析,搜索鉴定得到了
98
条爪蟾的
bHLH
序列
(
图
1
、表
1)
。图
1
所示的
bHLH
转录因子名称通过与人的同源序列
(homolog)
的系统
发育树分析得到。若一条人的
bHLH
因子拥有两个以
上爪蟾同源序列,我们将之分别标注为
a
、
b
、
c
,或
1
、
2
、
3
等名称。例如,人的
Hath5
和
Hath4a
在爪蟾基
因组中发现有两个同源序列,那么爪蟾的相应同源序
列就会被命名为
Xath5a
、
Xath5b
,和
Xath4a1
、
Xath4a2
。
本研究发现,爪蟾的
98
个
bHLH
转录因子分别有
39
、
22
、
13
、
5
、
16
和
3
个因子可以被归类到
6
个高阶组
(high-order group)A-F
的
32
个小家族;而某些小家族,
如
Mist
、
Beta3
、
Oligo
、
Net
、
Delilah
、
MyoRb
、
PTFa
、
TFb
、
AP4
、
MLX
和
TF4
等家族的成员没有
P
Cop
yright © 2011 Hanspub
HJBM
刘武艺 非洲爪蟾的碱性螺旋–环–螺旋转录因子的鉴定与初步分析
|
9
Table 1. 98 bHLH genes in phylogenetic analysis and protein identification information
表
1. 98
个
bHLH
基因的系统发育分析和蛋白质鉴定信息
各因子与人同源序列的系统发育分析信息
bHLH
基因家族
基因
名称
同源基因
ML
自展值
(%)
BI
后验概率
(%)
蛋白质获取号
ASCa
Xash
1
Hash
1
n/m*
80 NP_001079247.1
ASCa
Xash
2
Hash
2
96 67 NP_001085994.1
ASCb
Xash
3
a
Hash
3
a
Hash
3
b
Hash
3
c
n/m
n/m
NP_001079106.1
ASCb
Xash
3
b
Hash
3
a
Hash
3
b
Hash
3
c
n/m
n/m
NP_001079125.1
MyoD
Myf
3
a Myf
3
93 83 NP_001079366.1
MyoD
Myf
3
b Myf
3
93 83 NP_001081292.1
MyoD
Myf
4
a Myf
4
82 99 NP_001079326.1
MyoD
Myf
4
b Myf
4
88 99 NP_001079199.1
MyoD
Myf
5
Myf
5
51 59 NP_001095249.1
MyoD
Myf
6
a Myf
6
n/m*
94 NP_001081477.1
MyoD
Myf
6
b Myf
6
n/m*
94 NP_001088572.1
E12/E47
E
2
A E
2
A
82
n/m
NP_001080409.1
E12/E47
TCF
3
TCF
3
n/m*
88 NP_001079668.1
Ngn
Xath
4
a
1
Hath
4
a
97 100 NP_001081802.1
Ngn
Xath
4
a
2
Hath
4
a
97 100 NP_001081804.1
Ngn
Xath
4
b Hath
4
b
83 91 NP_001128257.1
NeuroD
NDF
1
NDF
1
82 97 NP_001079263.1
NeuroD
NDF
2
NDF
2
82 97 NP_001085596.1
Atonal
Xath
2
Hath
2
n/m*
79 NP_001079218.1
Atonal
Xath
3
Hath
3
97 99 NP_001081213.1
Atonal
Xath
5
a Hath
5
95 100 NP_001079289.1
Atonal
Xath
5
b Hath
5
95 100 NP_001079290.1
Mesp
Mesp
1
a
Mesp
1
Mesp
2
pMesp
1
n/m
n/m
NP_001128698.1
Mesp
Mesp
1
b
Mesp
1
Mesp
2
pMesp
1
n/m
n/m
N
P_001091431.1
Mesp
Mesp
2
a
Mesp
1
Mesp
2
pMesp
1
n/m
n/m
NP_001079050.1
Mesp
Mesp
2
b
Mesp
1
Mesp
2
pMesp
1
n/m
n/m
NP_001081641.1
Mesp
pMeso
1
pMesp
1
99 100 NP_001083813.1
Mesp
pMeso
2
pMesp
1
99 100 NP_001136111.1
Twist
Twist
1
Twist
1
Twist
2
98
n/m
NP_001079352.1
Twist
Twist
2
Twist
1
Twist
2
98
n/m
NP_001091211.1
Paraxis
Paraxis Paraxis
62 77 NP_001087941.1
Paraxis
Sclerax Sclerax
80 100 NP_001092152.1
Cop
yright © 2011 Hanspub
HJBM
刘武艺 非洲爪蟾的碱性螺旋–环–螺旋转录因子的鉴定与初步分析
|
10
MyoRa
MyoRa
MyoRa
1
MyoRa
2
82 100 NP_001085957.1
Hand
Hand
1
Hand
1
92 100 NP_001079128.1
Hand
Hand
2
a Hand
2
98 100 NP_001079108.1
Hand
Hand
2
b Hand
2
98 100 NP_001107665.1
SCL
Tal
1
Tal
1
n/m*
56 NP_001081746.1
NSCL
NSCL
1
NSCL
1
n/m*
100 NP_001081852.1
NSCL
NSCL
2
NSCL
2
89 100 NP_001088421.1
SRC
SRC
1
SRC
1
98 100 NP_001154867.1
SRC
SRC
2
SRC
2
92 100 NP_001081139.1
SRC
SRC
3
SRC
3
78 99 NP_001081732.1
Fig
α
Fig
α
Fig
α
87 100 NP_001088667.1
MYC
l-Myc
1
L-Myc
1
99 100 NP_001081340.1
MYC
l-Myc
2
L-Myc
2
54 100 NP_001079460.1
MYC
n-Myc
1
n-Myc
71 99 NP_001079365.1
MYC
n-Myc
2
n-Myc
71 99 NP_001084122.1
MYC
v-Myc v-Myc
88 100 NP_001080349.1
Mad
Mxi
1
Mxi
1
n/m
97 NP_001089170.1
Mad
Mad
1
Mad1a n/m*
71 NP_001090200.1
Mad
Mad
3
Mad
3
99 100 NP_001090188.1
Mad
Mad4a Mad
4
84 97 NP_001079167.1
Mad
Mad4b Mad
4
84 97 NP_001084456.1
Mnt
Mnt Mnt
72 99 NP_001089310.1
MAX
MAX
1
MAX
86 100 NP_001079118.1
MAX
MAX
2
MAX
86 100 NP_001089042.1
USF
USF
1
USF
1
98 100 NP_001089471.1
USF
USF
2
USF
2
99 100 NP_001088134.1
USF
USF
3
USF
3
99 100 NP_001088700.1
MITF
TFE
3
TFE
3
91 88 NP_001088215.1
SREBP
SREBP
2
SREBP
2
82 97 NP_001085554.1
Clock
Clock Clock
100 100 NP_001083854.1
ARNT
ARNT
1
ARNT
1
n/m*
100 NP_001082130.1
ARNT
ARNT
2
a ARNT
2
99 100 NP_001080540.1
ARNT
ARNT
2
b ARNT
2
99 100 NP_001083622.1
Bmal
Baml
1
a Bmal
1
n/m*
59 NP_001089024.1
Bmal
Baml
1
b Bmal
1
n/m*
59 NP_001089031.1
AHR
AHR
1
AHR
1
91 100 NP_001082693.1
AHR
AHR
2
AHR
2
94 100 NP_001121349.1
Sim
Sim
2
Sim
2
82 97 NP_001079101.1
HIF
Hif1
α
1
Hif
1
α
99 54 NP_001086426.1
HIF
Hif1
α
2
Hif
1
α
99 54 NP_001080449.1
HIF
EPAS
1
a EPAS
1
87 92 NP_001085564.1
HIF
EPAS
1
b EPAS
1
87 92 NP_001085718.1
Emc
Id
2
a Id
2
75 69 NP_001087639.1
Cop
yright © 2011 Hanspub
HJBM
刘武艺 非洲爪蟾的碱性螺旋–环–螺旋转录因子的鉴定与初步分析
|
12
注释:所有的GO语句均来自国际基因本体数据库
(http://www.geneontology.org)
。
Figure 2. Forty
-
two significant GO annotations counts plotted by frequency
图
2. 42
个统计显著的
GO
注释
(GO Aa nnotation)
出现频次的柱状图统计
录共激活是
bHLH
类因子的主要功能活动。但是,除
了这些转录因子共有的功能之外,
bHLH
转录因子还
有其自身特殊的功能活性。为了进一步探讨爪蟾
bHLH
转录因子家族的整体功能特点,我们收集了这
98
个
bHLH
因子的基因本体论
(GO)
的功能注释信息。
其中,
42
个超几何分布统计检验显著
(
P
< 0.05)
的
GO
注释语句显示在图
2
中,这些
GO
语句表示了一些重
要的生物学过程、分子功能和信号通路
(Pathway)
信
息,如转录调控活性
(GO: 0030528)
、转录调控
(GO:
0045449)
、
DNA
结合
(GO: 0003677)
、转录
(GO:
0006350)
和
DNA
依赖的转录调控
(GO: 0006355)
等出
现的频率很高,表明这些
GO
注释语句是爪蟾
bHLH
基因常见的功能。
同时,爪蟾
bHLH
转录因子家族的
GO
注释语句
显示,除了共同拥有的功能注释信息之外,一些重要
的发育过程或生理过程,如肌肉器官发育、神经管发
育、胚胎脊索发育、血小板、照相机型眼和普通眼的
发育、核内激素受体结合
(nuclear hormone receptor
binding)
和激素受体结合、感官发育及
Notch
信号通路
(notch signaling pathway)
等出现的频率也较高。另外,
6
大高阶组亦具有各个组内其自身的
GO
富集分布特
点。图
2
中显示的均为
GO
超几何分布中统计上显著
富集的功能注释
(
P
< 0.05
,
FDR < 0.05)
。
3.3.
脊椎动物和无脊椎动物中
bHLH
基因数目
和分布特点的比较及
Hes
基因家族的进化
为了解蟾蜍类与其他动物基因组
bHLH
转录因子
的差异,我们比较了脊椎动物和无脊椎动物基因组中
bHLH
基因数目及其分布。脊椎动物的
bHLH
基因数
明显地比无脊椎动物的要多
(
表
2)
。有些基因家族,如
E12/E47
、
NeuroD
、
Atonal
、
Mesp
、
Twist
、
Paraxis
、
SCL
、
SRC
、
Myc
、
Mad
、
MITF
、
HIF
、
Emc
、
Hey
和
Coe
等在脊椎动物是多基因家族,而在无脊椎动物中
Cop
yright © 2011 Hanspub
HJBM
刘武艺 非洲爪蟾的碱性螺旋–环–螺旋转录因子的鉴定与初步分析
|
13
Table 2.
Comparing the number of bHLH transcription factors found among vertebrate and invertebrate species
表
2.
脊椎动物和无脊椎动物中
bHLH
基因数目和分布特点之比较
Family Group Drosophila Lancelet Giant owl limpet
Xenopus Laevis
ChickenZebrafish Rat Mouse
ASCa A 4 3 6 2 2 2 2 2
ASCb A 0 1 1 2 2 3 3 3
MyoD A 1 4 1 7 4 4 4 4
E12/E47 A 1 1 4 2 5 5 4 4
Ngn A 1 1 3 3 2 2 3 3
NeuroD A 0 1 1 2 3 5 4 4
Atonal A 3 1 2 3 3 4 2 2
Mist A 1 1 1
nf
1 1 1 1
Beta3 A 1 1 2
nf
2 3 2 2
Oligo A 0 2 3
nf
2 4 3 3
Net A 1 1 2
nf
1 1 1 1
Delilah A 1 1 0
nf
0 0 0 0
Mesp A 1 1 0 7 4 5 3 3
Twist A 1 1 2 2 4 3 2 2
Paraxis A 1 2 1 2 3 4 2 2
MyoRa A 1 4 1 1 2 2 2 2
MyoRb A 0 1 1
nf
1 2 2 2
Hand A 1 1 1 3 2 1 2 2
PTFa A 1 1 1
nf
1 1 1 1
PTFb A 2 3 1
nf
1 2 1 1
SCL A 1 1 5 1 2 3 3 3
NSCL A 1 1 1 2 2 1 2 2
SRC B 1 1 0 3 3 3 3 3
Fig
α
B 0 1 0 1 0 1 1 1
Myc B 1 1 1 5 3 6 4 4
Mad B 0 1 1 5 3 4 4 4
Mnt B 1 1 1 1 1 2 1 1
Max B 1 1 1 2 1 1 1 1
USF B 1 1 2 3 1 2 2 2
MITF B 1 1 1 1 3 5 4 4
SREBP B 1 1 1 1 2 2 2 2
AP4 B 1 1 1
nf
0 1 1 1
MLX B 1 1 7
nf
3 1 2 2
TF4 B 1 0 1
nf
1 1 1 1
Clock C 3 1 2 1 3 3 2 2
ARNT C 1 1 0 3 2 2 2 2
Bmal C 1 1 0 2 2 2 2 2
AHR C 2 1 1 2 3 4 2 2
Sim C 1 1 1 1 2 2 2 2
Trh C 1 1 0
nf
1 2 1 1
HIF C 1 1 1 4 2 6 4 4
Emc D 1 1 2 5 4 5 4 4
Hey E 1 1 1 1 2 4 4 4
H/E(spl) E 11 11 12 15 6 15 8 8
Coe F 1 1 1 3 3 5 4 4
Orphan ? 0 6 4
nf
4 2 4 4
Total 59 78 82 98 104 139 114 114
注释:
nf
表示某基因家族在有关的研究报道中没有被发现。表中各物种
bHLH
基因数据来自参考文献
[11,13-18]
,其中基因家族排列
的先后顺序参照了
Ledent et al. (2002)
[11]
。
Cop
yright © 2011 Hanspub
HJBM
刘武艺 非洲爪蟾的碱性螺旋–环–螺旋转录因子的鉴定与初步分析
|
14
注释:
Hes
基因家族的最大似然估计进化树序列分别来自于人、小鼠、大鼠、斑马鱼、鸡和个非洲爪蟾,斑马鱼的
HEYL
作为外群
(Out-group)
。图中各分支上的数字为最大似然估计所得自展值
(Bootstrap values)
。此进化树表明,
Hes
家族成员的
Hes1
、
Hes2
、
Hes3
、
Hes5
、
Hes6
和
Hes7
基因均有各自的进化起源和祖先基因。
Figure 3. Phylogenetic tree of the H/E(spl) family
图
3.
脊椎动物
Hes
基因家族的系统进化分析
Cop
yright © 2011 Hanspub
HJBM
刘武艺 非洲爪蟾的碱性螺旋–环–螺旋转录因子的鉴定与初步分析
|
16
Research, 1997, 25(24): 4876-4882.
[22]
G. Dennis Jr., B. T. Sherman, D. A. Hosack, et al. DAVID:
Database for annotation, visualization, and integrated discovery.
Genome Biol., 2003, 4(5): P3.
[23]
D. W. Huang, B. T. Sherman, and R. A. Lempicki. Systematic
and integrative analysis of large gene lists using DAVID Bioinfor-
matics Resources. Nature Protocol, 2009, 4(1): 44-57.
[24]
F. Ronquist, J. P. Huelsenbeck. MrBayes 3: Bayesian phylogenetic
inference under mixed models. Bioinformatics, 2003, 12: 1572-
1574.
[25]
S. Guindon, O. Gascuel. A simple, fast, and accurate algorithm
to estimate large phylogenies by maximum likelihood.
Systematic Biology, 2003, 52(5): 696-704.
[26]
U. Hellsten, M. K. Khokha, T. C. Grammer, et al. A
ccelerated gene
evolution and subfunctionalization in the pseudotetraploid frog Xenopus
laevis. BMC Biology, 2007, 5(1): 31.
[27]
M. Nei, X. Gu, and T. Sitnikova. Evolution by the birth-and-death
process in multigene families of the vertebrate immune system.
Proceedings of the National Academy of Sciences of the USA,
1997, 94(15): 7799-7806.
Cop
yright © 2011 Hanspub
HJBM