意思是:BRCA2基因,转录本编号NM_000059,exon11表示当前转录本的第11个外显子,c.T2229C表示当前转录本第2229碱基由T突变为C了,小写的c表示核酸,p.H743H表示当前转录本翻译成氨基酸的话,第743位氨基酸没有变化,依然是组氨酸(Histidine),小写的p表示蛋白质的意思。
稍微总结一下就是:BRCA2基因的NM_000059转录本第2229位碱基发生了单碱基同义突变。
特别说明一下:有的时候,一个位置能注释到好几个转录本(由于可变剪切的原因),导致按照转录本上外显子的编号顺序,会出现多个外显子编号,请注意这个转录本上的外显子编号顺序和基因组水平的外显子编号并不是同一个含义。
比如这个注释:BRCA1:NM_007299:exon3:c.G114A:p.K38K,BRCA1:NM_007294:exon3:c.G114A:p.K38K,BRCA1:NM_007298:exon2:c.G114A:p.K38K,BRCA1:NM_007300:exon3:c.G114A:p.K38K。
一行内出现了exon2及exon3,并不是说同一个位置注释到基因组层面的2个外显子,而是不同的转录本的外显子编号顺序不一样。
这是因为早期在数据提交和整合过程中存在重复提交的现象。当不同的研究团队或者实验室独立发现并报告了同一个SNP位点时,如果这些信息最初是分别提交到dbSNP数据库的,并且在提交时未能识别出它们代表的是同一变异位点,则dbSNP会赋予其不同的rsID。不过,dbSNP数据库维护者后续会进行数据清理与合并工作。一旦发现这样的重复记录,核实后会将多余的rsID取消或合并指向正确的唯一SNP位点。如下图所示:
Sanger测序,同一个位置有明显的套峰,且两侧峰形整洁,基线平稳,这个位置大概率就是一个杂合子,即同一个位置有2种碱基。
NGS测序则是将测得的短序列比对参考基因组,通过识别某个位置是否全部碱基发生了变化,或者一部分碱基发生了变化,进而通过发生变化的碱基比例判断其是杂合子突变还是纯合子(突变或者未突变)。
特别说明一下:NGS测序数据是没有峰图的。
生工生物工程(上海)股份有限公司自2011年成立高通量测序部以来,逐步引进了Illumina,Life,DNBSEQ,PacBio、Nanopore、等二代/三代测序平台。建立了2000平米高标准实验室(通过了国家ISO认证)并搭建了50PB级存储及运算能力的服务器集群,能满足绝大多数科研客户的研究需要。同时,生工高通量测序团队建设也在不断完善中,目前有100余专职员工,其中高级技术人员以及高级生物信息工程师占比50%以上,10年来,通过生工高通量测序服务所发表的文章累计影响因子在10000分以上。
生工生物现可提供多种靶向捕获测序服务,感兴趣的小伙伴欢迎来电与我们技术支持沟通沟通。
技术支持联系方式:021-3777 2413。