技术分享|测序知多少之多组学测序
随着1986年美国遗传学家Thomas H. Roderick首次提出基因组学概念以来,基因组学得到了飞速发展,并带动了表观基因组学、转录组学、蛋白质组学、代谢组学等后基因组学时代相关组学的蓬勃发展[1]。高通量多组学测序是一种基于测序技术的生物信息学的分析方法,可以同时对多个基因组、转录组和蛋白质组进行高深度测序,从而提供生物样本的多维度信息。随着高通量测序技术和质谱技术的不断发展多个组学数据联合分析也随之应用而生,研究人员可以从转录组、蛋白质组、代谢组、和微生物组等不同层面获取大量组学数据。虽然单一组学分析可以为我们提供差异的生物学过程相关信息,但这些分析往往具有局限性。高通量多组学测序已经成为生物医学研究的重要工具,可以为生物学机制探究提供更多证据,可以更深层次的了解各个分子间的调控关系,促进我们对生物过程和分子机制有更深刻的理解。
01单组学简介
基因组
基因组是指生命体内包含的所有DNA分子,主要研究内容包括生殖细胞和体细胞的点突变、结构变异、重排突变等[2]。基因组的变化和疾病发生直接相关[3]。全基因组关联分析(Genome-Wide Association Study,GWAS)是研究复杂表型性状关联基因变异的方法,通过对照分析或相关性分析,在全基因组范围内找出存在的序列变异,从中筛选出与复杂表型性状相关的基因变异。除全基因组测序之外,外显子组测序技术通过特异捕获外显子区域DNA序列进行测序,成本明显低于全基因组测序的同时也能有效地检测疾病相关基因[4]。
高通量多组学测序技术在基因组学方面应用广泛,主要用于检测基因组的变异和结构变化等。通过对基因组的变异进行分析,可以发现与疾病相关的突变基因和遗传病致病基因。同时,高通量多组学测序还可以用于研究物种进化、基因组多样性和基因组编辑等方面。
转录组
转录组学为研究转录组的学科,主要是测定某一时期生物体在特定条件下基因的表达谱,即对RNA进行鉴定和定量,表达谱能反映机体的生理状态,如通过分析差别表达情况,去判定机体癌症相关的病变[5]。
转录组学研究方法已经可以检测新的转录本、可变剪接、基因融合和SNP等。
在转录组学方面,高通量多组学测序可以分析不同组织或不同条件下的转录本表达情况。通过对转录本进行分析,可以发现与疾病发生发展相关的关键基因和调控元件。同时,高通量多组学测序还可以用于研究细胞分化、发育和肿瘤转移等方面。
蛋白质组
蛋白质组学概念由Marc Wilkins在1994年首次提出,主要研究细胞、组织或生物体蛋白质组成及其变化规律。生物质谱为探索蛋白质组结构和功能的关键工具[6],主要包括蛋白鉴定、蛋白翻译后修饰鉴定、蛋白复合物鉴定、比较蛋白质组学、修饰组学、糖组学及靶向蛋白质组学研究等[1]。
在蛋白质组学方面,高通量多组学测序可以通过对蛋白质序列进行分析,揭示蛋白质的结构和功能。通过对蛋白质进行分析,可以发现与疾病诊断和治疗相关的关键蛋白质。同时,高通量多组学测序还可以用于研究免疫应答、药物作用机制和微生物鉴定等方面。
代谢组
代谢组学概念最初是由英国伦敦大学的Nicholson教授于1999年首次提出,主要研究生命个体对外源性的刺激、环境变化或遗传修饰所作出的所有代谢应答,并绘制出整体的代谢物动态变化谱图[7]。
代谢组学检测技术主要包括三种,分别是非靶向代谢组、靶向代谢组和广靶代谢组。其中广靶代谢组和非靶向代谢组均属于广筛性代谢组的范畴,可以进行广泛检测,而靶向代谢组是针对性检测,比较适合于有目标关注物质的情况。非靶和广靶实现的是性对定量,而靶向代谢组通过使用标准品可实现绝对定量。利用生物信息学分析方法,对这些数据进行处理和分析,提取与特定生理或病理状态相关的生物标志物和治疗靶点。
02多组学技术平台
随着测序技术的飞速发展,测序成本的降低,超高分辨率的质谱仪的应用,以及统计学和生物信息学的发展,使多组学的研究成为可能,可真正实现从系统生物学角度去解析生物体功能和机理。
多组学主要的使用的技术平台可以分为:
1. 测序平台:主要可以提供基因组学、转录组学及宏基因组学等方面的序列信息;
2. 质谱平台:主要可以提供包括蛋白质组学、代谢组学及修饰组学等方面的数据资料;
3. 配套设备:除了上述的核心平台外,还需要一些配套的设备,比如用于代谢组学研究的核磁共振波谱仪[8]。
多组学技术平台的组成示意图[9-10]
1.优势与挑战
优势
1. 可以同时对多个基因组、转录组和蛋白质组进行高深度测序,提供生物样本的多维度信息;
2. 具有高灵敏度和高分辨率,可以检测到低丰度表达的基因和蛋白质;
3. 可以结合生物信息学分析方法,对数据进行深入挖掘和分析,提供更丰富的生物学信息。
挑战
1. 数据量巨大,需要高性能计算机和大规模存储设备进行数据处理和分析;
2. 不同样本之间的差异较大,需要进行有效的数据标准化和质量控制;
3. 技术复杂度高,需要专业化的实验室和技术人员来进行实验设计和操作。
04发展
随着测序技术和计算机技术的不断发展,高通量多组学测序将会在更多领域得到应用和发展。未来,我们可以期待更多的技术创新和进步,如提高测序速度和降低成本、开发更高效的实验方法和数据分析算法等。同时,随着人工智能和机器学习等技术的不断发展,高通量多组学测序将会与这些技术相结合,实现更高效的数据分析和挖掘。
05生工推荐
生工生物工程(上海)股份有限公司自2011年成立高通量测序部以来,逐步引进了Illumina,Life,DNBSEQ,PacBio、Nanopore、等二代/三代测序平台。建立了2000平米高标准实验室(通过了国家ISO认证)并搭建了50PB级存储及运算能力的服务器集群,能满足绝大多数科研客户的研究需要。同时,生工高通量测序团队建设也在不断完善中,目前有100余专职员工,其中高级技术人员以及高级生物信息工程师占比50%以上,10年来,通过生工高通量测序服务所发表的文章累计影响因子在10000分以上。生工生物可以提供不同种类的多组学测序服务,具体内容详见下表。
如果各位老师对我们多组学测序服务感兴趣的话,欢迎来电与我们技术支持沟通沟通交流,
技术支持联系方式:021-5707 2059/2177/2097(转录组);021-5707 2083/2062/2064(宏基因组)。
参考文献
1. 刘景芳,李维林,王莉,李娟,李二伟,罗元明. 多组学技术及其在生命科学研究中应用概述[J]. 生物工程学报, 2022, 38(10): 3581-3593.
2. 谢兵兵, 杨亚东, 丁楠, 方向东. 整合分析多组学数据筛选疾病靶点的精准医学策略[J]. 遗传, 2015, 37(7): 655-663.
3. Stratton MR, Campbell PJ, Futreal PA. The cancer genome. Nature, 2009, 458(7239): 719-724.
4. Bamshad MJ, Ng SB, Bigham AW, Tabor HK, Emond MJ, Nickerson DA, Shendure J. Exome sequencing as a tool for Mendelian disease gene discovery. Nat Rev Genet, 2011, 12(11): 745–755.
5. Jeong E, Moon SU, Song ME, et al. Transcriptome modeling and phenotypic assays for cancer precision medicine. Arch Pharm Res, 2017, 40(8): 906-914.
6. Aebersold R, Mann M. Mass-spectrometric exploration of proteome structure and function. Nature, 2016, 537(7620): 347-355.
7. Nicholson J, Lindon JC, Holmes E. ‘Metabonomics’: understanding the metabolic responses of living systems to pathophysiological stimuli via multivariate statistical analysis of biological NMR spectroscopic data. Xenobiotica, 1999, 29(11): 1181-1189.
8. Tan AH, Chong CW, Lim SY, et al. Gut microbial ecosystem in parkinson disease: new clinicobiological insights from multi-omics. Ann Neurol, 2021, 89(3): 546-559.
9. Lancaster SM, Sanghi A, Wu S, et al. A customizable analysis flow in integrative multi-omics. Biomolecules, 2020, 10(12): 1606.
10. Pinu FR, Beale DJ, Paten AM, et al. Systems biology and multi-omics integration: viewpoints from the metabolomics research community. Metabolites, 2019, 9(4): 76.