PE150
信息分析内容
1、基本数据统计
数据过滤,对原始数据进行去除接头污染及低质量reads的处理
数据搭建,数据拼接,消除测序背景及有效数据构建
数据统计,数据产出统计及测序数据的成分和质量评估
2、数据比对分析
比对分析,与数据库V/D/J基因片段比对
比对结果统计
3、克隆序列特征注释
CDR3区核酸序列和氨基酸序列
鉴定无效序列(包含终止密码子,超出结构范围)
鉴定单碱基突变(替换、删除、插入)(for BCR)
4、单样品克隆群体特征分析
CDR3序列长度分布
V/J基因频率分布
V-J基因组合频率分布(3D, Circos)
克隆群体结构分析(频率分布,D50曲线,甜甜圈图)
5、样品间比较分析
测序饱和度分析
克隆多样性分析(辛普森系数、香农威纳系数等)
样品间共有克隆分析
聚类分析(层次聚类,MDS聚类)
组间差异分析
肿瘤案例: TCR克隆异质性与新抗原异质性及肺癌复发的关系
Cancer Discovery
. 2017
Oct;7(10):1088-1097.
研究目的
:寻找免疫检查点(PD-1、CTLA-4)治疗疗效的biomarker
研究样本
:11例未转移肺腺癌,共45 tumor regions (2 to 5 regions per tumor)
研究技术
:WES、TCR sequencing
研究结果
:病灶特有突变导致新抗原(neoantigen)的内部表达差异,因此,产生不同的免疫原性,形成了TIL克隆内部差异(TCR ITH)。TCR ITH(intratumor
heterogeneity)高与术后疾病复发和低生存率有关。
图1 TCR克隆异质性(ITH)与肺腺癌基因组和临床的相关性
(A)年龄与MOI相关性;(B)新抗原与MOI负相关;(C)复发的病人具有更高的TCR ITH(lower MOI);(D)MOI越高(TCR克隆多样性越低),病人的无病生存期(disease-free survival)越长。MOI:克隆重叠指数,范围0-1,0代表克隆完全不同,1代表克隆完全相同。
感染类疾病案例:TCRβ序列特征可准确预测CMV感染状态
Nature Genetics
. 2017, 49(5): 659-665.
研究目的
:确定是否可以用TCR特征预测CMV(巨细胞病毒)感染状态。
研究样本
:群体1:共计666个样本,其中289个CMV阳性,352个CMV阴性,40个感染状态未知;群体2:120个验证样本。
研究结果
:对289个CMV+和352个CMV-样本进行免疫组库测序,发现了CMV相关的TCRβ序列特征,并且利用TCRβ可以从666个研究样本和120个验证样本中,准确鉴定出CMV感染状态。研究还发现该群体的TCRβ与HLA-A或HLA-B显著相关。
图2 TCRβ可预测CMV感染状态
(a)CMV+和CMV-样本中unique TCRβ分布散点图。(b)ROC曲线显示TCRβ作为CMV感染状态分类器的分类效果。其中虚线表示在群体1中的测试结果,短虚线代表群体1中的交叉验证效果,实线代表群体2中独立验证效果。每条线上的黑圈代表最大后验概率(MAP)的决定阈值。插入图表展示的是群体2中MAP分类效果,敏感度为0.90,特异性为0.89。
自身免疫性疾病案例:杀伤T细胞的突变积累可能与类风湿性关节炎发病有关
Nature Communications
. 2017, 8:15869.
研究目的
:大颗粒淋巴细胞白血病(LGL)常合并发生类风湿性关节炎(RA),研究发现LGL病人的CD8+ T细胞克隆存在STAT3突变,而拥有该突变的LGL病人更容易并发RA(43% vs.
6%)。因此推测,发生体细胞突变的CD8+ T细胞可能与RA发病有关。
研究样本
:82例新诊断未治疗的RA病人,20例健康人,取外周血。
研究结果
:首次采用CD4+ T细胞做对照,过滤生殖系突变(germline mutations),对分选的T细胞进行目标区域测序、外显子测序和TCR β链CDR3测序。发现,大约20%(5/25)病人的CD8+ T细胞有体细胞突变(somatic mutations),而CD4+ T细胞没有,RNA-seq确认了突变基因在CD8+ T细胞中高表达。功能分析发现,这些基因突变与免疫调控、细胞增殖有关,因此推测,发生体细胞突变的CD8+ T细胞可能与RA及其他自身免疫性疾病的发病有关。
图3 病人1中CD8+ T细胞的克隆分布及突变
(a)利用TCR测序获得的CD8+ T细胞克隆分布。(b)病人1中存在两个高频克隆,经过免疫抑制治疗后仍高表达。(c)利用扩增子测序,在流式分选后的亚群中进行突变验证。(d)本文研究思路图。
华大基因已发表IR-seq相关文章
IMPre: An Accurate and Efficient Software for
Prediction of T- and B-Cell Receptor Germline Genes and Alleles from
Rearranged Repertoire Data
Characterization of the B Cell Receptor Repertoire in
the Intestinal Mucosa and of Tumor-Infiltrating Lymphocytes in Colorectal
Adenoma and Carcinoma
≥ 1 mL全血收集的淋巴细胞or ≥ 1 mL Paxgene Blood RNA tube / RNAprotect® Animal Blood Tubes收集的全血
注意:对于组织样品,若淋巴细胞含量低,存在扩增不出来的状况。
Q1: TCR和BCR各条链编码基因的区别?推荐哪条链?
TCR Beta链和BCR重链是由V、D、J基因编码的,而TCR alpha链和BCR轻链是由V、J基因编码的。从发表文章来看,研究TCR
beta链和BCR重链的比较多。
Q2:免疫组库测序可以区分IgG、IgM、IgD、IgE吗?
免疫球蛋白的亚型,通过C区序列可以区分,华大有相应的引物,但必须是RNA样品。利用多重PCR的方法,利用V区-C区的引物,用约30bp的序列区分。产物长度大约是在200-300bp。
Q3:免疫组库的测序深度?能得到多少序列?
分析数据显示,数据量的增加,主要影响低频克隆,并且这些克隆的排序在一千多到九千不等,而研究往往只关注top100的克隆和疾病的关系,所以推荐起始数据量1G raw data。但如果客户想关注更多低频克隆,可以加大测序数据量。
Q4:做免疫组库测序,用基因组DNA做模板好,还是RNA好?
DNA水平侧重于研究基因重组信息,RNA水平侧重于研究基因的表达状态。使用DNA和RNA做模板各有优缺点:
gDNA的优点是:
1)因为每个基因只有两个拷贝,因此可准确地反映免疫细胞受体的克隆数;
2)DNA更稳定,易储存。
缺点是:
1)由于copy数不高,模板含量低,因此可能需要更多的样品;
2)由于J区和C区之间有很大的intron区,受测序长度的局限,缺少特异性扩增引物来扩增CDR全长。
RNA的优点是:
1)J区和C区之间无intron,可用C区进行引物设计,扩增全长CDR;
2)由于表达丰富,模板含量高,样品消耗量少。
缺点是:
1)免疫细胞受体的克隆性受到mRNA表达高低的影响,不能客观地反应本身的克隆数;
2)RNA不如DNA稳定,样品保存和操作要求较高。