平台服务-表观组-全基因组Bisulfite甲基化测序(WGBS)

全基因组甲基化测序(WGBS)介绍

全基因组甲基化测序(WGBS,Whole-genome bisulfite sequencing)结合了亚硫酸氢盐转化方法与新一代高通量测序技术,可在单碱基分辨率水平上高效地检测全基因组DNA甲基化状态。亚硫酸氢盐处理可以使DNA中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变,PCR扩增所需片段,则尿嘧啶全部转化成胸腺嘧啶。对 PCR产物进行高通量测序,与参考序列比对,即可判断CpG/CHG/CHH位点是否发生甲基化。

 

伯豪特色

  1. 建库质量优秀,失败率极低,每年五万例左右各种类型样本文库构建经验。
  2. 质控过程全程可溯,实时跟踪,反馈及时,确保数据真实可靠。
  3. 基础分析丰富,展示形式可个性化定制。
  4. 高级分析服务:专业的生物信息分析团队,熟悉各种分析算法和软件;根据客户的需求,提供多种个性化的实现方案。

 

全基因组甲基化测序(WGBS)项目流程

 

推荐测序模式

  1. Hiseq X Ten, PE150
  2. 至少30 X基因组大小

 

数据分析内容

  1. 测序数据质量控制
    包括:总reads数、总base数,Q20比例、Q20位点分布图、碱基分布图。
  2. 测序数据预处理
    包括:去除总体质量偏低的reads,将质量大于20碱基所占比例小于50%的reads去除;去除3’端质量Q低于20的碱基;去除reads中所含有的接头序列;去除长度小于20的测序片段(reads),去除含有低质量N碱基的reads。
  3. 转化效率评估
    使用lamda噬菌体基因组作为内参,评价BS转化效率。
  4. 全基因组比对和mapping率统计。
  5. CpG岛区域、启动子区域及整个基因组的覆盖及不同深度关系。
  6. CpG/CHG/CHH位点覆盖率、测序深度、甲基化比例和染色体分布。
  7. 差异甲基化位点和区段筛选。
  8. 基因promoter、TSS、gene body区域甲基化水平计算和筛选。
  9. 差异甲基化位点或区段的CpG岛注释和基因注释。
  10. 全基因组甲基化图谱。

 

全基因组甲基化测序(WGBS)样品要求

  1. 样品纯度:OD 260/280值应在1.8~2.0 之间; RNA 应去除干净;
  2. 样品浓度:低浓度不低于50ng/µl;
  3. 样品总量:每个样品总量不少于2µg;
  4. 样品溶剂:应溶解在H20或TE (pH 8.0)中;
  5. 样品运输:DNA低温运输(-20℃);在运输过程中用parafilm将管口密封好,以防出现污染。

 

常见问题

1.哪些物种可以研究WGBS?

要做全基因组甲基化分析,对物种有以下要求:
a. 物种为真核生物;
b. 物种具有参考基因组,至少拼接到scaffold水平;
c. 具有较为完整的注释。

 

2.全基因组甲基化测序有哪些优势?

在全基因组水平,单碱基分辨率检出甲基化位点,不仅能够高精度发现CpG岛等常见区域的甲基化水平的变化,还能够分析gene body区,基因间区等区域的甲基化水平的差异,分析甲基化对染色体的状态以及基因结构变化的影响,从多维度分析解决生物学问题。

 

3.为什么WGBS所得的raw data产量和Q30比例较全基因组重测序的低?

因为在WGBS建库过程中,非甲基化的C会转化为U(测序过程中呈现为T),因此WGBS文库处于碱基极度不平衡的状态(read1中C含量极低、read2中G含量极低)。而Illumina测序仪在cluster定位过程中会过滤较高比例的cluster,使得raw data产量降低;另外由于GC含量较极端,测序过程中质量值也较容易下降。

 

案例展示

全基因组甲基化测序揭示蚕基因组稀疏的甲基化

昆虫的表观遗传学调控可以反映其多样的生物反应过程,本研究采用Illumina高通量亚硫酸盐测序,检测了模式生物蚕在单碱基水平的甲基化情况。保守估计,基因组中0.11%的胞嘧啶被甲基化,且可能全部存在于CG二核苷酸中。基因区域CG甲基化是非常丰富的,这可能与基因表达水平相关,同时也暗示了甲基化在基因转录中扮演了一个正面的角色。研究人员发现转录元素、启动子及核糖体DNAs低甲基化,相反,基因区域与基因座匹配的小RNAs被充分甲基化。该研究有助于我们对于昆虫表观遗传的理解。原文:Single base–resolution methylome of the silkworm reveals a sparse epigenomic map. Nature Biotechnology.2010,28:216-20. 2014年12月3日,深圳华大基因研究院、生物芯片上海国家工程研究中心、国家人类基因组中心和广东医学院附属深圳第三人民医院的研究人员,在国际著名学术期刊《Genome Biology》发表了一项研究成果,题为“Integrated analyses of DNA methylation and hydroxymethylation reveal tumor suppressive roles of ECM1, ATF5, and EOMES in human hepatocellular carcinoma”。这项研究报道了癌症信号通路中具有表观遗传畸变的高富集基因。有6个基因被选作肿瘤抑制基因的候选因子,经siRNA实验证明,其中ECM1、ATF5和EOMES三个基因具有潜在的抗癌功能。

肝细胞癌(HCC),通常是由肝炎病毒(B和C)感染及酗酒引起的,是最常见的原发性肝癌之一,也是世界上癌症死亡的第三大原因。虽然HCC的外科手术治疗和化学疗法不断发展,手术切除仍然是许多患者的治疗选择。接受手术切除的患者五年生存率为50%,然而,有70%的复发率。

我们对HCC发展的机制仍然知之甚少。人们普遍认为,积累的遗传学改变(如染色体改变、基因扩增和突变),与HCC有关。此外,表观遗传学改变,特别是胞嘧啶5位上异常的DNA甲基化,已被广泛地研究。癌细胞中的DNA低甲基化,被认为可导致染色体不稳定和致癌基因激活,已被普遍视为高度稳定的临床癌症标志物。更重要的是,许多研究报道,抑癌基因(TSGs)的高甲基化有助于肝癌的发病机制。因此,DNA甲基化的准确检测,可以为肝癌发生机制提供深入见解,可能对HCC的临床诊断具有潜在的应用价值。

然而,羟甲基胞嘧啶(5hmC)分布的差异,可能会使之前关于异常胞嘧啶甲基化状态的观察结果复杂化。以前的技术,例如重亚硫酸盐处理和限制性内切酶为基础的技术,无法区分5mC和5hmC,5hmC在样品中的存在,可降低DNA甲基化检测的准确度。5hmC是由ten-eleven易位(TET)蛋白所催化,它首先将5mC转换成5hmC,然后转换成5-formylcytosine (5fC),最终转换为5-carboxylcytosine (5caC),从而可能在DNA脱甲基化作用中扮演一定的角色。研究发现,5hmC大量存在于胚胎干细胞和神经元中,但是它在肿瘤细胞中大大减少,包括HCC细胞。

因此,在基因组分析研究的背景下同步检测5mC和5hmC,重新引起了人们的兴趣,这可能会促使我们以更高的准确度在HCC细胞中发现更多的异常甲基化基因。到目前为止,已知的异常启动子甲基化基因的数量,在HCC中少于结肠癌和胃癌。此外,要确定其在肝癌发生中所起的作用,就必须开展一项关于HCC中5hmC状况的、较全面的研究。

为了全面检查5mC和5hmC 在HCC中的状态,本研究采用超高效液相色谱/串联质谱(UPLC-MS/MS)和新开发的单碱基高通量测序方法(羟甲基化和甲基化敏感标签测序,HMST-seq),在HCC样本及它们相邻的非癌肝组织(non-HCCs)中同步检测这两种修饰。

该研究报道了5hmC的一种总体缺失,和包含改变了的甲基化或羟甲基化作用的关键基因,它们富集在重要的肿瘤相关信号通路中。特别是,研究人员确定了三个新的基因(ECM1、ATF5和EOMES),它们可能具有抗癌功能,可促进我们对于HCC发生和发展的分子机制的理解,增强5hmC检测在未来的临床应用前景。

总而言之,本研究报道了癌症信号通路中具有表观遗传畸变的高富集基因。有6个基因被选作肿瘤抑制基因的候选因子,经siRNA实验证明,其中ECM1、ATF5和EOMES三个基因具有潜在的抗癌功能。

 

原文出处:
Integrated analyses of DNA methylation and hydroxymethylation reveal tumor suppressive roles of ECM1, ATF5, and EOMES in human hepatocellular carcinoma.