Cancer Res:基于长读长测序准确全面检测癌症基因融合事件的新方法:FusionSeeker
2022-11-25 测序中国 测序中国 发表于上海
基于模拟和三个癌细胞系的数据,该研究证明了FusionSeeker在检测基因融合事件方面优于现有方法。
近日,美国阿拉巴马大学伯明翰分校的研究团队,提出了一个基因融合检测工具FusionSeeker,可以准确全面地识别长读长癌症转录组测序数据中的基因融合事件,并从原始reads中重建准确的融合转录本。FusionSeeker是根据reads数量检测基因融合调并进行过滤,以去除由于测序错误和reads比对错误造成的噪声信号。经验证,FusionSeeker可识别外显子和内含子区域的基因融合,允许对癌症转录组中的基因融合进行全面表征。
该研究结果发表Cancer Research上,文章题为“Gene fusion detection and characterization in long-read cancer transcriptome sequencing data with FusionSeeker”。
研究团队首先在模拟数据集上对FusionSeeker基因融合检测的准确性进行了基准测试,共随机生成150个基因融合转录本,并分配到不同的表达水平。PacBio Iso-Seq-like和Nanopore-like reads用PBSIM和Badread(v0.2.0)模拟,然后对齐到参考基因组。FusionSeeker和长链基因融合检测工具JAFFAL和LongGF用于从模拟reads中检测基因融合。研究团队重复了三次模拟,FusionSeeker识别出的真阳性事件更多。
同时,FusionSeeker的高召回率主要得益于其检测内含子区域基因融合的能力,其中FusionSeeker识别了94.67%的内含子事件,JAFFAL和LongGF分别报告了14.67%和54.67%。总的来说,以上三种融合检测工具在检测高表达水平和中表达水平因融合时可获得更高的召回率。FusionSeeker丢失的基因融合中,大约67%来自低表达水平组,丢失的原因是reads覆盖率低。
图1.FusionSeeker检测过程
为了生成高精度的转录本序列,FusionSeeker使用包含融合的reads执行部分顺序比对,为每个基因融合事件计算一致序列。在模拟数据集中,FusionSeeker重构了超过99.5%的融合事件的全长转录本,使用Iso-Seq和Nanopore reads的平均序列识别率分别为99.87%和99.14%。表明FusionSeeker可以准确地识别基因融合,并在模拟数据集中报告全长融合转录本序列。
接下来,研究团队利用人类基因组结构变异联盟(HGSVC)的非癌症数据集评估了三种工具的错误发现率。在所有12个非癌症样本中,FusionSeeker报告的基因融合数量最少,表明在三种基因融合检测工具中,FusionSeeker的错误发现率最低。研究团队还将FusionSeeker应用于一个急性髓系白血病(AML)患者样本分析,以证明其临床实用性。最终FusionSeeker识别出了RUNX1和RUNX1T1之间的一个预验证基因融合,并报告了该患者样本中另外7个可信的基因融合事件。
最后,该研究团队评估了由FusionSeeker生成的转录本序列。与原始reads相比,在MCF-7细胞系的Iso-Seq和Nanopore数据集中,FusionSeeker转录本序列与参考基因序列的一致性显著提高(图2)。在SKBR3的Iso-Seq数据集和HCT-116细胞系的Nanopore数据集中,FusionSeeker报告的转录本序列比原始reads更准确。
图2.FusionSeeker转录本序列与参考基因序列对比
综上所述,FusionSeeker可以检测到外显子和内含子区域的基因融合。基于模拟和三个癌细胞系的数据,该研究证明了FusionSeeker在检测基因融合事件方面优于现有方法。此外,研究团队通过正交和实验验证了许多仅由FusionSeeker检测到的基因融合事件。这些新的基因融合可能对肿瘤的发生和进展有重要意义,值得进一步研究。总体而言,FusionSeeker将使用户能够使用长读长测序取数据准确地发现基因融合,促进下游功能分析,并改善癌症的诊断和治疗。
参考文献:
Yu Chen, Yiqing Wang, Weisheng Chen,et al. Gene fusion detection and characterization in long-read cancer transcriptome sequencing data with FusionSeeker. Cancer Res CAN-22-1628. 2022. https://doi.org/10.1158/0008-5472.CAN-22-1628.
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
学习了
84