添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
刘武艺 非洲爪蟾的碱性螺旋–环–螺旋转录因子的鉴定与初步分析 |
7
录调控区、寡聚化位点及核定位信号区等 [1-5] 。有关转
录因子结构和功能的研究是动植物分子生物学研究
的前沿领域,转录因子因其含有 DNA 结合蛋白的不
同可以划分为不同的基因家族 [1-3] 。碱性螺旋–环–螺
(basic helix-loop-helix bHLH) 转录因子是目前最大
的转录因子家族之一,并被公认为在细胞增殖与分
化、肌肉形成、神经元、肠和血、性别决定等遗传发
育过程中具有重要作用 [4-8] ,许多课题组对 bHLH 转录
因子展开了研究。最早报道的是鼠转录因子 E12
E47 [9] ,后来的研究将动物 bHLH 转录因子划分为 6
大类,这些大类又细分为 45 个亚类或蛋白家族
[4,6,10,11] 。现在,动物的 bHLH 家族成员的分类、进化
及功能分析现已积累大量资料,且基本清楚各家族组
成及成员的功能。由于生物物种基因组测序和全基因
组草图绘制工作的陆续完成,越来越多的转录因子被
分析和鉴定出来,这就为从整体上研究某物种转录因
子的功能和进化等重要问题提供了可能。因此,从全
基因组角度研究某一类型的转录因子或调控因子具
有重要的意义。现今,动物 bHLH 转录因子家族已经
在人、小鼠、大鼠、鸡、蚕、蜜蜂等许多物种的基因
组中被鉴定和研究 [4-17] 。但在非洲爪蟾 ( Xenopus laevis )
基因组中尚未进行有关的研究。
非洲爪蟾是较早用于生物医学的重要模式动 物
之一 [19] 。本研究以 Atchley et al. (1999) bHLH 转录
因子分类原则 [10] Ledent et al. (2001, 2002) 定义的 45
bHLH 代表性基序 (domains) 118 个人 bHLH 基因
序列为鉴定标准 [6,11] ,从非洲爪蟾的基因组数据库鉴
定出 98 bHLH 转录因子,进行基因本体论 (Gene
Ontology GO) 富集分析,以期分析和了解这些 bH LH
基因的功能信息。
2. 材料与方法
2.1. BLAST 搜索和 bHLH 转录因子的鉴定
根据 Atchley et al. (1999) bHLH 转录因子分类
原则和 Ledent et al. (2001, 2002) 定义的 45 个代表性
bHLH 基序 [6,11] 进行 TBLASTN BLASTP ,搜索候选
bHLH 基序。其中,每条序列都被用于对 NCBI 的非
洲爪蟾的基因组数据库 [19] 进行反复搜索 (http://
www.ncbi.nlm.nih.gov/genome/guide/frog/) ,搜索 的严
谨值设为 E < 10 ,以获取所有可能的 bHLH 序列。同
时,我们也检索蛙蟾数据库 Xenbase [20] ,最后根据
scaffold 或基因克隆 (genomic clone) 的编号、编码区、
基因和蛋白获取号、序列比对的结果等信息,去除冗
余序列,得到最终采用的 bHLH 因子序列 。
2.2. 序列比对和基序比较
通过 BLAST 搜索得到的爪蟾蛋白质序列,用
ClustalX 2.0 [21] 进行比对,接着用 GeneDoc 2.6 [12] 做保
守序列的分析和比较。
2.3. 基因本体 (Gene ontology GO) 注释的富集
分布分析
利用 DAVID 生物信息工具 [22,23] GO 注释的富
集分析,富集分布的显著性 P 值和假阳性率 (False
positive rate FDR) 均被控制在 0.05 以下。
2.4. BHLH 同源基因的系统发育分析
系统发育分析 (Phylogenetic analyses) 用最大似然
估计软件 PHYML 2.4.4 [24] 和贝叶斯推断软件 Mrbayes
3.12 [25] 进行系统发育树推断。其中,贝叶斯推断采用
两个独立的马科夫链进行推断 ( 进行 14,000,000 步马
科夫链抽样,抽样频率为每代抽样 100 ) ,取 50%
一致树作为最终的系统发育树。
3. 结果与讨论
3.1. 爪蟾 bHLH 转录因子的鉴定
利用上述 bHLH 代表性基序、 TBLASTN
BLASTP 算法及系统发育分析,搜索鉴定得到了 98
条爪蟾的 bHLH 序列 ( 1 、表 1) 。图 1 所示的 bHLH
转录因子名称通过与人的同源序列 (homolog) 的系统
发育树分析得到。若一条人的 bHLH 因子拥有两个以
上爪蟾同源序列,我们将之分别标注为 a b c ,或 1
2 3 等名称。例如,人的 Hath5 Hath4a 在爪蟾基
因组中发现有两个同源序列,那么爪蟾的相应同源序
列就会被命名为 Xath5a Xath5b ,和 Xath4a1 Xath4a2
本研究发现,爪蟾的 98 bHLH 转录因子分别有 39
22 13 5 16 3 个因子可以被归类到 6 个高阶组
(high-order group)A-F 32 个小家族;而某些小家族,
Mist Beta3 Oligo Net Delilah MyoRb PTFa
TFb AP4 MLX TF4 等家族的成员没有 P
Cop yright © 2011 Hanspub HJBM
刘武艺 非洲爪蟾的碱性螺旋–环–螺旋转录因子的鉴定与初步分析 |
9
Table 1. 98 bHLH genes in phylogenetic analysis and protein identification information
1. 98 bHLH 基因的系统发育分析和蛋白质鉴定信息
各因子与人同源序列的系统发育分析信息
bHLH
基因家族
基因
名称 同源基因 ML 自展值 (%) BI 后验概率 (%)
蛋白质获取号
ASCa Xash 1 Hash 1 n/m* 80 NP_001079247.1
ASCa Xash 2 Hash 2 96 67 NP_001085994.1
ASCb Xash 3 a
Hash 3 a
Hash 3 b
Hash 3 c
n/m n/m NP_001079106.1
ASCb Xash 3 b
Hash 3 a
Hash 3 b
Hash 3 c
n/m n/m NP_001079125.1
MyoD Myf 3 a Myf 3 93 83 NP_001079366.1
MyoD Myf 3 b Myf 3 93 83 NP_001081292.1
MyoD Myf 4 a Myf 4 82 99 NP_001079326.1
MyoD Myf 4 b Myf 4 88 99 NP_001079199.1
MyoD Myf 5 Myf 5 51 59 NP_001095249.1
MyoD Myf 6 a Myf 6 n/m* 94 NP_001081477.1
MyoD Myf 6 b Myf 6 n/m* 94 NP_001088572.1
E12/E47 E 2 A E 2 A 82 n/m NP_001080409.1
E12/E47 TCF 3 TCF 3 n/m* 88 NP_001079668.1
Ngn Xath 4 a 1 Hath 4 a 97 100 NP_001081802.1
Ngn Xath 4 a 2 Hath 4 a 97 100 NP_001081804.1
Ngn Xath 4 b Hath 4 b 83 91 NP_001128257.1
NeuroD NDF 1 NDF 1 82 97 NP_001079263.1
NeuroD NDF 2 NDF 2 82 97 NP_001085596.1
Atonal Xath 2 Hath 2 n/m* 79 NP_001079218.1
Atonal Xath 3 Hath 3 97 99 NP_001081213.1
Atonal Xath 5 a Hath 5 95 100 NP_001079289.1
Atonal Xath 5 b Hath 5 95 100 NP_001079290.1
Mesp Mesp 1 a
Mesp 1
Mesp 2
pMesp 1 n/m n/m NP_001128698.1
Mesp Mesp 1 b
Mesp 1
Mesp 2
pMesp 1 n/m n/m N P_001091431.1
Mesp Mesp 2 a
Mesp 1
Mesp 2
pMesp 1
n/m n/m NP_001079050.1
Mesp Mesp 2 b
Mesp 1
Mesp 2
pMesp 1
n/m n/m NP_001081641.1
Mesp pMeso 1 pMesp 1 99 100 NP_001083813.1
Mesp pMeso 2 pMesp 1 99 100 NP_001136111.1
Twist Twist 1 Twist 1
Twist 2 98 n/m NP_001079352.1
Twist Twist 2 Twist 1
Twist 2 98 n/m NP_001091211.1
Paraxis Paraxis Paraxis 62 77 NP_001087941.1
Paraxis Sclerax Sclerax 80 100 NP_001092152.1
Cop yright © 2011 Hanspub HJBM
刘武艺 非洲爪蟾的碱性螺旋–环–螺旋转录因子的鉴定与初步分析 |
10
MyoRa MyoRa MyoRa 1
MyoRa 2 82 100 NP_001085957.1
Hand Hand 1 Hand 1 92 100 NP_001079128.1
Hand Hand 2 a Hand 2 98 100 NP_001079108.1
Hand Hand 2 b Hand 2 98 100 NP_001107665.1
SCL Tal 1 Tal 1 n/m* 56 NP_001081746.1
NSCL NSCL 1 NSCL 1 n/m* 100 NP_001081852.1
NSCL NSCL 2 NSCL 2 89 100 NP_001088421.1
SRC SRC 1 SRC 1 98 100 NP_001154867.1
SRC SRC 2 SRC 2 92 100 NP_001081139.1
SRC SRC 3 SRC 3 78 99 NP_001081732.1
Fig α Fig α Fig α 87 100 NP_001088667.1
MYC l-Myc 1 L-Myc 1 99 100 NP_001081340.1
MYC l-Myc 2 L-Myc 2 54 100 NP_001079460.1
MYC n-Myc 1 n-Myc 71 99 NP_001079365.1
MYC n-Myc 2 n-Myc 71 99 NP_001084122.1
MYC v-Myc v-Myc 88 100 NP_001080349.1
Mad Mxi 1 Mxi 1 n/m 97 NP_001089170.1
Mad Mad 1 Mad1a n/m* 71 NP_001090200.1
Mad Mad 3 Mad 3 99 100 NP_001090188.1
Mad Mad4a Mad 4 84 97 NP_001079167.1
Mad Mad4b Mad 4 84 97 NP_001084456.1
Mnt Mnt Mnt 72 99 NP_001089310.1
MAX MAX 1 MAX 86 100 NP_001079118.1
MAX MAX 2 MAX 86 100 NP_001089042.1
USF USF 1 USF 1 98 100 NP_001089471.1
USF USF 2 USF 2 99 100 NP_001088134.1
USF USF 3 USF 3 99 100 NP_001088700.1
MITF TFE 3 TFE 3 91 88 NP_001088215.1
SREBP SREBP 2 SREBP 2 82 97 NP_001085554.1
Clock Clock Clock 100 100 NP_001083854.1
ARNT ARNT 1 ARNT 1 n/m* 100 NP_001082130.1
ARNT ARNT 2 a ARNT 2 99 100 NP_001080540.1
ARNT ARNT 2 b ARNT 2 99 100 NP_001083622.1
Bmal Baml 1 a Bmal 1 n/m* 59 NP_001089024.1
Bmal Baml 1 b Bmal 1 n/m* 59 NP_001089031.1
AHR AHR 1 AHR 1 91 100 NP_001082693.1
AHR AHR 2 AHR 2 94 100 NP_001121349.1
Sim Sim 2 Sim 2 82 97 NP_001079101.1
HIF Hif1 α 1 Hif 1 α 99 54 NP_001086426.1
HIF Hif1 α 2 Hif 1 α 99 54 NP_001080449.1
HIF EPAS 1 a EPAS 1 87 92 NP_001085564.1
HIF EPAS 1 b EPAS 1 87 92 NP_001085718.1
Emc Id 2 a Id 2 75 69 NP_001087639.1
Cop yright © 2011 Hanspub HJBM
刘武艺 非洲爪蟾的碱性螺旋–环–螺旋转录因子的鉴定与初步分析 |
12
注释:所有的GO语句均来自国际基因本体数据库 (http://www.geneontology.org)
Figure 2. Forty - two significant GO annotations counts plotted by frequency
2. 42 个统计显著的 GO 注释 (GO Aa nnotation) 出现频次的柱状图统计
录共激活是 bHLH 类因子的主要功能活动。但是,除
了这些转录因子共有的功能之外, bHLH 转录因子还
有其自身特殊的功能活性。为了进一步探讨爪蟾
bHLH 转录因子家族的整体功能特点,我们收集了这
98 bHLH 因子的基因本体论 (GO) 的功能注释信息。
其中, 42 个超几何分布统计检验显著 ( P < 0.05) GO
注释语句显示在图 2 中,这些 GO 语句表示了一些重
要的生物学过程、分子功能和信号通路 (Pathway)
息,如转录调控活性 (GO: 0030528) 、转录调控 (GO:
0045449) DNA 结合 (GO: 0003677) 、转录 (GO:
0006350) DNA 依赖的转录调控 (GO: 0006355) 等出
现的频率很高,表明这些 GO 注释语句是爪蟾 bHLH
基因常见的功能。
同时,爪蟾 bHLH 转录因子家族的 GO 注释语句
显示,除了共同拥有的功能注释信息之外,一些重要
的发育过程或生理过程,如肌肉器官发育、神经管发
育、胚胎脊索发育、血小板、照相机型眼和普通眼的
发育、核内激素受体结合 (nuclear hormone receptor
binding) 和激素受体结合、感官发育及 Notch 信号通路
(notch signaling pathway) 等出现的频率也较高。另外,
6 大高阶组亦具有各个组内其自身的 GO 富集分布特
点。图 2 中显示的均为 GO 超几何分布中统计上显著
富集的功能注释 ( P < 0.05 FDR < 0.05)
3.3. 脊椎动物和无脊椎动物中 bHLH 基因数目
和分布特点的比较及 Hes 基因家族的进化
为了解蟾蜍类与其他动物基因组 bHLH 转录因子
的差异,我们比较了脊椎动物和无脊椎动物基因组中
bHLH 基因数目及其分布。脊椎动物的 bHLH 基因数
明显地比无脊椎动物的要多 ( 2) 。有些基因家族,如
E12/E47 NeuroD Atonal Mesp Twist Paraxis
SCL SRC Myc Mad MITF HIF Emc Hey
Coe 等在脊椎动物是多基因家族,而在无脊椎动物中
Cop yright © 2011 Hanspub HJBM
刘武艺 非洲爪蟾的碱性螺旋–环–螺旋转录因子的鉴定与初步分析 |
13
Table 2. Comparing the number of bHLH transcription factors found among vertebrate and invertebrate species
2. 脊椎动物和无脊椎动物中 bHLH 基因数目和分布特点之比较
Family Group Drosophila Lancelet Giant owl limpet Xenopus Laevis ChickenZebrafish Rat Mouse
ASCa A 4 3 6 2 2 2 2 2
ASCb A 0 1 1 2 2 3 3 3
MyoD A 1 4 1 7 4 4 4 4
E12/E47 A 1 1 4 2 5 5 4 4
Ngn A 1 1 3 3 2 2 3 3
NeuroD A 0 1 1 2 3 5 4 4
Atonal A 3 1 2 3 3 4 2 2
Mist A 1 1 1 nf 1 1 1 1
Beta3 A 1 1 2 nf 2 3 2 2
Oligo A 0 2 3 nf 2 4 3 3
Net A 1 1 2 nf 1 1 1 1
Delilah A 1 1 0 nf 0 0 0 0
Mesp A 1 1 0 7 4 5 3 3
Twist A 1 1 2 2 4 3 2 2
Paraxis A 1 2 1 2 3 4 2 2
MyoRa A 1 4 1 1 2 2 2 2
MyoRb A 0 1 1 nf 1 2 2 2
Hand A 1 1 1 3 2 1 2 2
PTFa A 1 1 1 nf 1 1 1 1
PTFb A 2 3 1 nf 1 2 1 1
SCL A 1 1 5 1 2 3 3 3
NSCL A 1 1 1 2 2 1 2 2
SRC B 1 1 0 3 3 3 3 3
Fig α B 0 1 0 1 0 1 1 1
Myc B 1 1 1 5 3 6 4 4
Mad B 0 1 1 5 3 4 4 4
Mnt B 1 1 1 1 1 2 1 1
Max B 1 1 1 2 1 1 1 1
USF B 1 1 2 3 1 2 2 2
MITF B 1 1 1 1 3 5 4 4
SREBP B 1 1 1 1 2 2 2 2
AP4 B 1 1 1 nf 0 1 1 1
MLX B 1 1 7 nf 3 1 2 2
TF4 B 1 0 1 nf 1 1 1 1
Clock C 3 1 2 1 3 3 2 2
ARNT C 1 1 0 3 2 2 2 2
Bmal C 1 1 0 2 2 2 2 2
AHR C 2 1 1 2 3 4 2 2
Sim C 1 1 1 1 2 2 2 2
Trh C 1 1 0 nf 1 2 1 1
HIF C 1 1 1 4 2 6 4 4
Emc D 1 1 2 5 4 5 4 4
Hey E 1 1 1 1 2 4 4 4
H/E(spl) E 11 11 12 15 6 15 8 8
Coe F 1 1 1 3 3 5 4 4
Orphan ? 0 6 4 nf 4 2 4 4
Total 59 78 82 98 104 139 114 114
注释:
nf
表示某基因家族在有关的研究报道中没有被发现。表中各物种 bHLH 基因数据来自参考文献 [11,13-18] ,其中基因家族排列
的先后顺序参照了 Ledent et al. (2002) [11]
Cop yright © 2011 Hanspub HJBM
刘武艺 非洲爪蟾的碱性螺旋–环–螺旋转录因子的鉴定与初步分析 |
14
注释: Hes 基因家族的最大似然估计进化树序列分别来自于人、小鼠、大鼠、斑马鱼、鸡和个非洲爪蟾,斑马鱼的 HEYL 作为外群
(Out-group) 。图中各分支上的数字为最大似然估计所得自展值 (Bootstrap values) 。此进化树表明, Hes 家族成员的 Hes1 Hes2 Hes3
Hes5 Hes6 Hes7 基因均有各自的进化起源和祖先基因。
Figure 3. Phylogenetic tree of the H/E(spl) family
3. 脊椎动物 Hes 基因家族的系统进化分析
Cop yright © 2011 Hanspub HJBM
刘武艺 非洲爪蟾的碱性螺旋–环–螺旋转录因子的鉴定与初步分析 |
16
Research, 1997, 25(24): 4876-4882.
[22] G. Dennis Jr., B. T. Sherman, D. A. Hosack, et al. DAVID:
Database for annotation, visualization, and integrated discovery.
Genome Biol., 2003, 4(5): P3.
[23] D. W. Huang, B. T. Sherman, and R. A. Lempicki. Systematic
and integrative analysis of large gene lists using DAVID Bioinfor-
matics Resources. Nature Protocol, 2009, 4(1): 44-57.
[24] F. Ronquist, J. P. Huelsenbeck. MrBayes 3: Bayesian phylogenetic
inference under mixed models. Bioinformatics, 2003, 12: 1572-
1574.
[25] S. Guindon, O. Gascuel. A simple, fast, and accurate algorithm
to estimate large phylogenies by maximum likelihood.
Systematic Biology, 2003, 52(5): 696-704.
[26] U. Hellsten, M. K. Khokha, T. C. Grammer, et al. A ccelerated gene
evolution and subfunctionalization in the pseudotetraploid frog Xenopus
laevis. BMC Biology, 2007, 5(1): 31.
[27] M. Nei, X. Gu, and T. Sitnikova. Evolution by the birth-and-death
process in multigene families of the vertebrate immune system.
Proceedings of the National Academy of Sciences of the USA,
1997, 94(15): 7799-7806.
Cop yright © 2011 Hanspub HJBM