产业

SURFSeq 5000 双模Q40 强力开启测序错误率“万五时代”!

⾃2023年9⽉上市以来,SURFSeq 5000⾼通量基因测序仪凭借“应用场景多、测序速度快、数据质量好、运行成本省”的产品优势和稳定的性能表现快速获得了临床诊断、分子育种、基础科研等多领域⽤户的高度认可。

在“多、快、好、省”中,“数据质量好”是重中之重,SURFSeq  5000 V1.0全系测序试剂盒(FCM、FCH)现均已支持Balanced+Enhanced双模式Q40(≥85%/≥90%)高质量数据输出。

Enhanced模式下,与市面其他Q40测序产品相比,SURFSeq 5000整体测序错误率减少60%以 上,低⾄0.05%级别,强力开启测序错误率的"万五时代"。

01 双模式Q40高质量数据输出

SURFSeq 5000为用户提供Balanced Mode(BM,均衡模式)和Enhanced Mode(EM,增强模式)两⼤Q40测序模式。

在Balanced Mode下,SURFSeq 5000可实现≥90% bases≥Q30,≥85% bases≥Q40。

在Enhanced Mode下,SURFSeq 5000可实现≥95% bases≥Q30,≥90% bases≥Q40。

*Q30/Q40%基于真迈⽣物企业标准品⽂库多轮测试结果的中位数值设定,该数值受到样本状态、⽂库质量和定量准确性等因素的影响而发⽣变化。

Balanced Mode是平衡数据质量和芯片利用率的最优解。在该模式下,真迈生物统计了近3个⽉,SURFSeq 5000FCH芯片7⼤类应用方向共116轮的测试数据。其中100轮Balanced Mode PE150测序数据的Q30、Q40均值达分别达到了95.1%和91.3%,Output reads均值达到了2500M reads(官标2000M reads)。

全新的Enhanced Mode在Balanced Mode的基础上,加入了基于机器学习构建的序列特征模型等多维信息,全新的“3D Basecall”可更全面的识别测序过程中的“问题序列区域”,并更准确地进⾏碱基识别和Q值打分。统计16轮Enhanced Mode下WGS PE150测序数据,Q30、Q40均值达分别达到了97.1%和95.2%,Output reads均值达到了2350M reads。

*在数据产量Output reads⽅⾯,Enhanced Mode相比Balanced Mode会有5%±2%⽔平的降低(该差异⽔平依据为“对相同原始图像分别使⽤两种模式下basecall算法获得的数据差值”),降低比例受到样本状态、文库构建方式及质量和文库定量精准度等因素影响。

02 SURFSeq 5000 开启"万五时代"

SURFSeq 5000为双芯⽚平台,并⽀持异步滚动上机和分lane样本加载功能。如下表所示,真迈生物采⽤了双FCH芯片在同⼀台机器上同时开展Enhanced Mode和Balanced Mode测试。其中Lane1、Lane2加载E.coli全基因组文库样本(PCR-plus),Lane3、Lane4加载GIAB HG001人全基因组⽂库样本(PCR-plus)。

*GIAB HG001测序错误率使⽤BWA MEM对⽐⾄GRCh37参考基因组(NIST V4.2.1)计算获得,因受参考基因组质量及对比软件性能影响,HG001测序错误率数值中包含了较⾼比例的序列比对错误(非测序错误)。

如上图所示,Enhanced Mode下,PE150测序数据整体错误率相比Balanced Mode下降了50~60%,低至0.05%级别。Q30 /Q40 均值高达97.6%/96.0%。

03 Q值打分体系精准性评估

使⽤Q/Q图对SURFSeq 5000 Q值打分体系精准性进⾏评估,Balanced Mode和Enhanced Mode双模式下Predicted Q Score(x)和Observed Q Score(y)均展现出优秀的⼀致性。

上图展示了目前部分主流测序平台测序整体错误率表现情况,其中SURFSeq 5000 Balanced Mode与NovaSeq X(Q40升级后) 表现相当。在Enhanced Mode下,SURFSeq 5000整体测序错误率下降60%以上,低至0.05%级别,强力开启测序错误率的“万五时代”。

*基于E.coli进⾏计算

▲基于NovaSeq X Software V1.2 Q40升级版本测试

SURFSeq 5000 Balanced Mode(≥85%Q40)和Enhanced Mode(≥90% Q40)为用户提供了更多选择。“万五时代”将快速推动以“超低频突变精准检出”为代表的应⽤进⼊发展快车道,真迈生物期待与各领域合作伙伴在“万五时代”⼀同探索基因测序技术的无限可能。

04 双模式Demo数据下载

 如需获取SURFSeq 5000双模Q40 Demo数据,可关注“真迈生物”官方公众号,并在对话框回复关键词“万五时代”获取下载链接。

关于测序数据错误率计算的补充说明

如上表所示,Q40对应的测序错误率在0.01%级别,但在应用端投入分析流程的是包含了Q40在内的所有Q值碱基(例如Q0~40)的测序数据,所以测序数据错误率是基于各Q值碱基错误率及依据碱基占比加权计算得出。计算公式如下:

Error rate=Q1error×Q1%+Q2error×Q2%+.......+Q40error×Q40%

(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

关键词:

热评文章