确定罕见变异的最佳深度覆盖率和成本效益的重叠混合编码测序

全基因组关联研究已经确定了数以百计的遗传变异和复杂疾病,虽然大多数的变异到目前为止解释只有一小部分的遗传力,这表明罕见的变异是由于丢失的遗传性。通过大规模测序识别罕见变异变得越来越重要,尽管测序成本的快速下降但仍然昂贵。然而,合并群检验为基础的重叠混合编码测序,而不是单个样品进行测序,大大降低了样品制备以及为罕见变异筛选的成本。东南大学生物科学与医学工程学院孙啸教授团队提出了一个重叠混合编码测序去筛选最佳测序深度的罕见变异和相应的成本模型。他们制定了一个模型在汇集测序中计算变异的最佳深度。利用横向偏移设计算法,重叠混合编码测序可以选择适当的参数,以降低成本和保证精度。由于混合约束和合并测序的高深度,结果表明它更符合成本效益,通过自主优化策略将一个大的特定种群分成小块分别进行了测试。最后,研究人员进行了一项实验来筛选频率为1%的变异载体。模拟池和公开的人类基因组测序数据,试验取得了99.93%的准确率。利用重叠混合编码测序,对于200个二倍体在设置为30Mb靶向序列区域筛选频率等于1% 的变异载体的成本下降至少66%。该研究刊登在201312月的《Genetic epidemiology》杂志上。

参考文献:

Identifying Rare VariantsWith Optimal Depth of Coverage and Cost-Effective Overlapping Pool Sequencing. ChangChang Cao,Genetic epidemiology. 2013.Dec

作者简介:

孙啸:东南大学生物科学与医学工程学院教授,江苏省生物医学工程学会生物信息学专业委员会主任。清华973国家重点基础研究发展计划项目《基于新一代测序的生物信息学理论与方法》第一课题组学术骨干。主要从事生物信息学研究。