自然环境中,很大一部分微生物不可用实验室传统培养的方法获得,成为了研究自然界微生物群落结构、生态功能及其相互关系的最大障碍。
随着分子生物学技术在微生物生态学研究中的应用,微生物多样性研究有了新的突破。起初,对于分子微生态学的研究大多是利用微生物16S核糖体RNA(ribosomal ribonucleic acid,rRNA)基因特点及PCR 等分子生物学研究手段,包括变性/温度梯度凝胶电泳(DGGE/TGGE)、16S rRNA基因单链构象多态性分析(SSCP)、末端限制片段长度多态性(T-RFLP)、实时定量PCR(Real-time quantitative PCR)等技术。
进入20世纪90年代末,随着高通量测序技术的发展,基于基因组文库的分析也为微生物多样性结构和功能基因组的研究,提供了崭新的思路。
16S rRNA
16S核糖体RNA(16S ribosomal RNA),简称16S rRNA,是原核生物的核糖体中30S亚基的组成部分,编码16s rRNA的基因被称为16s rRNA基因(16s rDNA)。16S rRNA的长度约为1,542 nt,既含有高度保守区域,又有中度保守和高度变化的区域。保守区为基本所有的细菌所共有,且不同细菌间序列无差别,因而被称为“细菌化石”;而保守区之间为可变区(V1~V10),不同种属之间有不同程度差异,适用于进化距离不同的各类细菌亲缘关系的研究。
我们可以在16S rRNA 基因的保守序列区间设计通用引物,扩增细菌的可变区片段来进行序列比对,并与真菌、病毒等其他微生物相区别。16S rRNA基因测序一般是利用测序平台对16S rRNA基因的V3-V4或V4-V5可变区进行测序,以此来研究微生物多样性。
图1. 16S rRNA基因结构示意图
高通量测序技术原理及发展
高通量测序技术又称“下一代”或“二代”测序技术(Next Generation Sequencing, NGS)。相对一代测序技术(Sanger Sequencing),NGS 一次并行对几十万至几百万条DNA分子进行测定及读长较短等为标志。
目前用于微生物群落多样性研究中的高通量测序平台主要有罗氏公司的454法、Illumina公司的Solexa法和ABI公司的SOLiD法。二代测序仅能对16S rRNA基因的部分可变区测序,而随后出现的三代测序突破读长限制实现了16S rRNA基因的全长测序,进而能更全面、准确地解析微生物群落结构。
图2 高通量测序平台的发展
目前,高通量测序是一个边合成边测序的过程,使用的是荧光可逆终止子。每个可逆终止子的碱基3’端都有一个阻断基团,而在侧边带有一种荧光。由于有4种不同的碱基(ATCG),因此也会有对应4种不同颜色的荧光。开始扩增每次结合上一个碱基,DNA的扩增便会停止,此时能收到一种荧光信号。然后放试剂除去阻断基团,进行下一个碱基的结合,以此类推得到一连串的荧光信号组合序列。而根据荧光的颜色我们便可以确定每一个位点的基因型,即可以得到这一段DNA片段的序列。
图3 高通量测序技术工作原理
二代测序平台一般只能对单个或连续的两三个可变区序列进行测序分析,通常情况下无法获得rRNA基因全长序列的信息,因而往往难以在属、种甚至菌株等精细水平识别测得的序列,并获取对应的微生物物种信息。
2008年,Helicos Biosciences的第一台单分子DNA测序仪以及PacBio SMRT、Nanopore等被相继研发,第三代单分子测序技术问世。可对DNA序列实现单分子级别的超长读长测序,因而非常容易读取微生物的rRNA基因全长序列。但并不能高效地将DNA聚合酶加到测序阵列中;准确性一次性达标的机会低(81-83%);DNA聚合酶在阵列中降解;总体上每个碱基测序成本高,因此其应用尚不及二代测序技术普遍。
高通量测序技术在微生物多样性研究中的应用
随着高通量测序技术的不断升级换代,测序通量、读长和准确度不断提升,成本大幅度下降。16S rRNA测序分析微生物群多样性,包括物种注释和评估、物种组成分析、β多样性分析、物种差异分析、进化树分析等。
在过去十几年间迅速应用于水体、土壤及肠道等微生物群的研究中。在法医学领域,以16S rRNA基因测序为代表的法医微生物研究成果也逐步应用于法医学实践中的生物检材鉴定、个体识别、死亡时间推断、地域推断等方面;在医疗领域,基于高通量测序技术分析皮肤、口腔、肠道及呼吸道等菌群结构特征,为疾病诊断治疗带来了新线索。16S rRNA基因测序技术也在农业、畜牧业,海洋、土壤等环境微生物群落多样性研究中发挥重要作用。
图4 微生物多样性分析流程
展望
近年来高通量测序技术发展迅速,16S rRNA基因测序已广泛应用于各种生态环境中的微生物多样性分析。三代测序技术虽然在准确率和测序成本等方面还有待提高,但随着测序准确度、读长和通量等参数不断优化以及测序费用的下降,高质量、高通量的16S rRNA基因全长测序将会成为现实。
此外,16S rRNA相关数据库的扩大以及生物信息学算法的不断开发,也将为微生物群落多样性研究提供更加准确、全面的信息。16S rRNA基因测序可解读微生物群落结构,挖掘样本特性及群落间物种的关联等,通过与代谢组学、蛋白质组学等多组学联合,共同揭示微生物与环境或机体间的相互作用机及机理。