首页 > 医药医疗 专利正文
一体化检测CNV、单亲二体、三倍体和ROH的方法及装置与流程

时间:2022-02-17 阅读: 作者:专利查询

一体化检测CNV、单亲二体、三倍体和ROH的方法及装置与流程
一体化检测cnv、单亲二体、三倍体和roh的方法及装置
技术领域
1.本发明属于遗传检测技术领域,涉及一体化检测cnv、单亲二体、三倍体和roh的方法及装置。


背景技术:

2.拷贝数变异(cnv)、单亲二体(upd)、三倍体和存在连续性纯合片段(runs of homozygosity,roh)是导致许多常见遗传疾病、癌症和其他复杂疾病的大型基因组畸变。识别这些畸变对于了解疾病至关重要。
3.为了检测cnv和roh区域,单核苷酸多态性(snp)阵列被大量使用。近年来,从高通量下一代全基因组测序(wgs)数据中检测cnv已成为一种广泛使用的研究方法,该方法需要在全基因组范围内进行非常高的覆盖深度。目前检测单亲二体、三倍体的方法包括:1)染色体核型分析:可检测三倍体,但无法识别整体单亲二体、片段roh、小片段cnv,且需较多人力,实验周期长;2)短串联重复序列(str):可检测常见的非整倍体异常、三倍体、整体单亲二体,但无法检测小片段cnv、片段roh;3)荧光原位杂交(fish):无法检测小片段cnv且仅能检测部分染色体异常;4)snparray、wgs:针对全基因组进行测序,基于全基因组数据进行分析的检测方法有:

penncnv:检测全基因组snp基因分型数据中的高分辨率拷贝数变异;

control-freec:使用ngs数据自动检测拷贝数变异和roh区域;

基于lc-wgs的sba方法:基于单核苷酸多态性的低覆盖全基因组测序筛选三倍体。
4.综上所述,现有技术中无有效方法进行一体化的检测,检测成本高,过程复杂,因此,开发检测cnv、单亲二体、三倍体和roh的方法的有效方法,简化检测分析过程,降低成本,对于遗传检测技术领域具有重要意义。


技术实现要素:

5.针对现有技术的不足和实际需求,本发明提供一体化检测cnv、单亲二体、三倍体和roh的方法及装置,所述方法能够基于全基因组测序数据,一体化检测出cnv、单亲二体、三倍体和roh区域,过程简单,成本低,对于遗传检测技术领域具有重要意义。
6.第一方面,本发明提供一体化检测cnv、单亲二体、三倍体和roh的方法,所述方法包括以下步骤:(1)获取样本基因组上覆盖深度信息及snp基因型信息;(2)构建单亲二体及三倍体分析参考数据库、cnv分析参考数据库和roh分析参考数据库;(3)进行单亲二体及三倍体分析、cnv分析和roh分析;所述单亲二体及三倍体分析包括统计样本染色体的b等位基因频率(baf)偏移量和杂合snp比例,并按式(1)计算染色体的z值,其中,为样本染色体的r值,为单亲二体及三倍体分析参考数据库中相应染色体r值的平均值,为单亲二体及三倍体分
析参考数据库中染色体r值的标准差;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1);所述cnv分析包括计算样本与cnv分析参考数据库比对结果log2rr的平均值,并利用所述按式(2)计算拷贝数cn;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2);所述roh分析包括按式(3)计算样本与roh分析参考数据库的比对结果,其中f1为roh分析参考数据库窗口值,f2为样本窗口值,进行断点识别和片段合并;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)。
7.本发明创造性设计遗传检测分析流程,提出了一体化检测cnv、单亲二体、三倍体和roh的方法,流程图如图1所示,所述方法能够基于全基因组测序数据,一体化检测出cnv、单亲二体、三倍体和roh区域,简化了检测流程,提高了检测效率且降低了检测成本。
8.优选地,所述覆盖深度信息包括样本基因组中窗口的覆盖深度,所述窗口的长度为1 kb~100 kb,包括但不限于2 kb、3 kb、4 kb、5 kb、6 kb、7 kb、8 kb、9 kb、10 kb、20 kb、30 kb、40 kb、50 kb、60 kb、70 kb、80 kb、90 kb、91 kb、92 kb、93 kb、94 kb、95 kb、96 kb、97 kb、98 kb或99 kb。
9.优选地,所述snp基因型信息包括snp位点的基因型和b等位基因频率。
10.优选地,将样本进行全基因组测序,获取样本在整个基因组上覆盖深度信息及全基因组的snp(单核苷酸多态性)基因型信息。
11.优选地,所述获取样本在整个基因组上覆盖深度信息包括将基因组分成每10 kb一个的窗口,统计每个窗口的覆盖深度;优选地,所述snp基因型信息包括每个snp位点的基因型和b等位基因频率(baf)。
12.优选地,步骤(2)所述cnv分析参考数据库的构建方法包括以下步骤:(1’)选取样本的覆盖深度信息;(2’)采用定基比率法对窗口进行标准化;(3’)过滤掉覆盖深度一直为0或sd大于sd阈值的窗口;(4’)采用loess算法,对样本进行gc校正;(5’)将样本按照对应窗口合并,取平均值;(6’)选择合适的分析策略,按照步长3~5、滑动1~3(例如步长4、滑动1等)的策略将窗口合并。
13.优选地,本发明基于测序数据的覆盖深度信息,所述cnv分析参考数据库按性别分为男性、女性两类,所述cnv分析参考数据库的构建方法包括以下步骤:(1’)样本选择:选取多个二倍体样本的覆盖深度信息;(2’)标准化:为了消除测序数据量的差别,以每个样本的窗口覆盖深度的中位数为基数,采用定基比率法对每个窗口进行标准化;
(3’)确定过滤阈值:计算每个窗口在多个样本中的sd,确定整体窗口的sd阈值;(4’)窗口过滤:整合所有样本,过滤掉覆盖深度一直为0或在多个样本中sd大于sd阈值的窗口;(5’)gc校正:整个基因组中,不同区域gc含量不同,而不同的gc含量可能会影响实验过程中片段的扩增效率,为了消除gc含量带来的误差,采用loess(局部加权回归)算法,对每个样本分别进行gc校正;(6’)样本合并:将所有样本按照对应窗口合并,取平均值;(7’)窗口合并:选择合适的分析策略,按照步长3~5、滑动1~3的策略(例如步长4、滑动1等)将小窗口合并为大窗口,大窗口值等于其包含的小窗口之和。
14.优选地,步骤(2)所述单亲二体及三倍体分析参考数据库的构建方法包括以下步骤:(1
’’
)选取样本的snp基因型信息;(2
’’
)统计样本染色体的杂合snp的b等位基因频率与二倍体杂合snp的b等位基因频率理论值的距离,取平均值作为该条染色体的b等位基因频率偏移量;(3
’’
)统计杂合snp比例;(4
’’
)整合染色体的b等位基因频率偏移量和杂合snp比例,按式(4)计算r值;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)。
15.优选地,本发明基于snp基因型信息,所述单亲二体及三倍体分析参考数据库按性别分为男性、女性两类,所述单亲二体及三倍体分析参考数据库的构建方法包括以下步骤:(1
’’
)样本选择:选取多个二倍体样本的snp基因型信息;(2
’’
)baf偏移量统计:理论上,若样本只存在一套遗传物质,则其所有snp均为纯合状态,baf为0或1;若样本存在两套遗传物质,则snp存在杂合、纯合两种状态,杂合snp的baf为0.5,纯合snp的baf为0或1;若样本存在三套遗传物质,则snp存在杂合、纯合两种状态,杂合snp的baf为0.33或0.66,纯合snp的baf为0或1;每个样本分别统计其每条染色体的杂合snp的baf与二倍体杂合snp的baf理论值(0.5)的距离,取平均值作为该条染色体的baf偏移量offset
chr
,如式(6)所示;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)(3
’’
)杂合snp比例统计:理论上,若样本只存在一套遗传物质,则其所有snp均为纯合状态,杂合snp比例为0;若样本存在二套遗传物质,在不考虑自然界遗传因素的情况下,其杂合snp比例为1/3;若样本存在三套遗传物质,在不考虑自然界遗传因素的情况下,其杂合snp比例为1/2;每个样本分别统计其每条染色体上杂合snp占该条染色体总snp的比例frac
chr
,如式(7)所示,其中n
het
为杂合snp的数目,n
hom
为纯合snp的数目;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)(4
’’
)参数整合:整合每条染色体的baf偏移量和杂合snp比例,按式(4)计算r值。
16.优选地,步骤(2)所述roh分析参考数据库的构建方法包括以下步骤:(1
’’’
)选取样本的snp基因型信息;(2
’’’
)将基因组划分为大小为400~800 kb的等分窗口(例如可以是410 kb、420 kb、450 kb、460 kb、500 kb、600 kb、650 kb、700 kb、750 kb、780 kb或790 kb),统计窗口的杂合snp比例;(3
’’’
)采用定基比率法对窗口进行标准化;(4
’’’
)将样本按照对应窗口合并,取平均值。
17.优选地,本发明基于snp基因型信息,所述roh分析参考数据库按性别分为男性、女性两类,所述roh分析参考数据库的构建方法包括以下步骤:(1
’’’
)样本选择:选取多个二倍体样本的snp基因型信息;(2
’’’
)杂合snp比例统计:将基因组划分为600 kb窗口,按式(7)统计每个窗口的杂合snp比例;(3
’’’
)窗口标准化:以每个样本的窗口覆盖深度的中位数为基数,采用定基比率法对每个窗口进行标准化;(4
’’’
)样本合并:将所有样本按照对应窗口合并,取平均值。
18.优选地,所述cnv分析包括以下步骤:a.采用定基比率法对窗口进行标准化;b.过滤掉覆盖深度为0或sd大于sd阈值的窗口;c.采用loess算法,对样本进行gc校正;d.按照选择合适的分析策略,按照步长3~5、滑动1~3的策略(例如步长4、滑动1等)将窗口合并;e.按式(5)计算样本与cnv分析参考数据库比对结果log2rr,其中r1为cnv分析参考数据库窗口值,r2为样本窗口值;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5);f.查找染色体的cnv断点;g.针对所述cnv断点,采用游程检验算法合并染色体的片段;h.计算样本与cnv分析参考数据库比对结果log2rr的平均值,并利用所述按式(2)计算拷贝数cn。
19.优选地,所述cnv分析包括以下步骤:a.标准化:为了消除测序数据量的差别,以每个样本的窗口覆盖深度的中位数为基数,采用定基比率法对每个窗口进行标准化;b.窗口过滤:过滤掉cnv分析参考数据库中过滤的窗口(覆盖深度一直为0窗口或sd大于sd阈值的窗口);c.gc校正:采用loess(局部加权回归)算法,对每个样本分别进行gc校正;d.窗口合并:选择合适的分析策略,按照步长3~5、滑动1~3的策略(例如步长4、滑动1等)将小窗口合并为大窗口,大窗口值等于其包含的小窗口之和;e.与cnv分析参考数据库比对:设相应性别的cnv分析参考数据库中某个窗口的值
为r1,处理样本该窗口的值为r2,按式(5)计算与cnv分析参考数据库的比对结果log2rr;f.断点识别:采用环状二元分割算法(circular binary segmentation, cbs)或隐马尔可夫模型(hidden markov model,hmm)等算法查找每条染色体的cnv断点,将染色体划分为多个片段;g.小片段合并:针对cbs或hmm等算法查找的cnv断点,对相同染色体的相邻片段采用游程检验算法进行合并,若检验的p-value 》 1e-5,说明相邻区域无显著差异,则将两个区域进行合并,再与下一个片段进行检验,依次类推,最终每个区域的log2rr值为该区域包含的大窗口的log2rr值的平均值;h.拷贝数计算:正常人类细胞为二倍体,则每条染色体有两个拷贝,按式(2)计算样本区域的拷贝数cn;i.异常区域报告:报告该样本中cn大于重复阈值线的区域与cn小于缺失阈值线的区域。
20.优选地,所述单亲二体及三倍体分析包括以下步骤:a.统计该样本染色体的b等位基因频率偏移量和杂合snp比例,并进行参数整合;b.并按式(1)计算样本染色体的z值,z≥3,则该条染色体为三体;z≤-3,则该条染色体为单体;计算样本所有染色体的z值的中位数z
genome
,z
genome
≥3,则该样本为三倍体;z
genome
≤-3,则该样本为单亲二体。
21.优选地,所述单亲二体及三倍体分析包括以下步骤:a.按照上述构建单亲二体及三倍体分析参考数据库的方法统计样本每条染色体的baf偏移量与杂合snp比例,并进行参数整合;b.z-score标准化:结合样本与相应性别单亲二体及三倍体分析参考数据库中所有样本,对每条染色体的r值分别进行z-score标准化,按式(1)计算出每条染色体的z值,衡量该条染色体是否异常;c.异常报告:z≥3,则该条染色体为三体;z≤-3,则该条染色体为单体;计算样本所有染色体的z值的中位数z
genome
,z
genome
≥3,则该样本为三倍体;z
genome
≤-3,则该样本为单亲二体。
22.优选地,所述roh分析包括以下步骤:a.统计窗口的杂合snp比例;b.按式(3)计算样本与roh分析参考数据库的比对结果;c.查找染色体的cnv断点;d.针对所述cnv断点,采用游程检验算法合并染色体的片段,报告样本中log
10
ff小于阈值线的区域。
23.优选地,所述roh分析包括以下步骤:a.按照roh分析参考数据库的构建方法统计每个窗口的杂合snp比例;b.与roh分析参考数据库比对:设相应性别的roh分析参考数据库中某个窗口的值为f1,样本该窗口的值为f2,按式(3)计算与roh分析参考数据库的比对结果log
10
ff;c.断点识别:采用环状二元分割算法(circular binary segmentation, cbs)或隐马尔可夫模型(hidden markov model,hmm)等算法查找每条染色体的cnv断点,将染色体划分为多个片段;
d.小片段合并:针对cbs或hmm等算法查找的cnv断点,对相同染色体的相邻片段采用游程检验算法进行合并,若检验的p-value 》 1e-5,说明相邻区域无显著差异,则将两个区域进行合并,再与下一个片段进行检验,依次类推,最终每个区域的log
10
ff值为该区域包含的大窗口的log
10
ff值的平均值;e.异常区域报告:报告该样本中log
10
ff小于阈值线的区域。
24.本发明可对任意核酸样本进行分析检测,可应用于人体核酸样本分析检测,也可用于非疾病诊断和/或治疗为目的的体外基因组相关科学研究,如三倍体发生机制的研究、女性年龄与流产组织拷贝数变异的相关性研究等。
25.第二方面,本发明提供一体化检测cnv、单亲二体、三倍体和roh的装置,所述装置包括采集信息模块、构建对比库模块和分析模块。
26.所述采集信息模块包括:获取样本在整个基因组上覆盖深度信息及全基因组的snp基因型信息。
27.所述构建对比库模块包括:分别构建单亲二体及三倍体分析参考数据库、cnv分析参考数据库和roh分析参考数据库。
28.所述分析模块包括:进行单亲二体及三倍体分析、cnv分析和roh分析。
29.所述单亲二体及三倍体分析包括统计样本染色体的b等位基因频率偏移量和杂合snp的比例,并按式(1)计算染色体的z值,其中,为样本染色体的r值,为单亲二体及三倍体分析参考数据库中相应染色体r值的平均值,为单亲二体及三倍体分析参考数据库中染色体r值的标准差。
30.所述cnv分析包括计算样本与cnv分析参考数据库比对结果log2rr的平均值,并利用所述按式(2)计算拷贝数cn。
31.所述roh分析包括按式(3)计算样本与roh分析参考数据库的比对结果,其中f1为roh分析参考数据库窗口值,f2为样本窗口的值,进行断点识别和片段合并。
32.第三方面,本发明提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序执行第一方面所述的一体化检测cnv、单亲二体、三倍体和roh的方法中的步骤。
33.第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序执行第一方面所述的一体化检测cnv、单亲二体、三倍体和roh的方法中的步骤。
34.本发明所述一体化检测cnv、单亲二体、三倍体和roh检测装置、计算机设备和计算机可读存储介质,获取待测样本的基因组测序信息,并根据设计的方法和算法构建对比库并进行分析,通过利用全基因组比对结果对染色体进行检测分析,不使用额外实验手段。可以提高染色体的检测效率、降低检测成本,基于机器学习模型和相应分析算法,可以提高检测的覆盖率和准确性。
35.与现有技术相比,本发明具有以下有益效果:(1)本发明的一体化检测cnv、单亲二体、三倍体和roh的方法,能够基于全基因组测序数据,一体化检测出cnv、单亲二体、三倍体和roh区域,简化了检测流程,提高了检测效率且降低了检测成本;(2)本发明所述一体化检测cnv、单亲二体、三倍体和roh检测装置、计算机设备和
计算机可读存储介质,通过利用全基因组比对结果对染色体进行检测分析,不使用额外实验手段。可以提高染色体的检测效率、降低检测成本,基于机器学习模型和相应分析算法,可以提高检测的覆盖率和准确性。
附图说明
36.图1为本发明一体化检测cnv、单亲二体、三倍体和roh的方法的分析流程图;图2为小cnv样本检测结果图;图3为单亲二体样本检测结果图;图4为三倍体样本检测结果图;图5为区域性roh样本检测结果图。
具体实施方式
37.为进一步阐述本发明所采取的技术手段及其效果,以下结合实施例和附图对本发明作进一步地说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明,而非对本发明的限定。
38.实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。
39.实施例1本实施例利用本发明一体化检测cnv、单亲二体、三倍体和roh的方法对小cnv样本(细胞系样本)进行检测,包括以下步骤:1、构建基因组测序文库;2、上机测序,获得处理样本1的全基因组测序数据;3、获得分析参数:每个窗口的覆盖深度信息及snp基因型信息;4、基于测序深度信息按照cnv分析流程获得100 kb以上小cnv;5、基于snp基因型信息按照单亲二体/三倍体分析流程检测单亲二体与多倍体;6、基于snp基因型信息按照roh分析流程检测5m以上roh。
40.检测结果如图2所示,cnv检测结果为:dup(4)(p16.1).seq[grch37/hg19](8930001-9500000)
×
3dup(8)(p23.1).seq[grch37/hg19](7000001-12500000)
×
3dup(12)(p11.21).seq[grch37/hg19](31220001-31430000)
×
3del(12)(q12).seq[grch37/hg19](40890001-41240000)
×
1。
[0041]
如图2(cnv检测/copy number)所示,在4号染色体、8号染色体、12号染色体检出了大于100 kb的cnv;如图2(倍性检测/z-score)所示,所有染色体的z-score中位数为-1.0745,在(-3,3)之间,则其单亲二体/三倍体检测结果为:二倍体;如图2(roh检测/logff)所示,所有染色体的logff值均在0附近,表明处理样本1的f值与roh分析参考数据库中f值相差较小,未检测出roh区域。
[0042]
实施例2本实施例利用本发明一体化检测cnv、单亲二体、三倍体和roh的方法对单亲二体
样本(细胞系样本)进行检测,包括以下步骤:1、构建基因组测序文库;2、上机测序,获得处理样本2的全基因组测序数据;3、获得分析参数:每个窗口的覆盖深度信息及snp基因型信息;4、基于测序深度信息按照cnv分析流程获得100 kb以上小cnv;5、基于snp基因型信息按照单亲二体/三倍体分析流程检测单亲二体与多倍体;6、基于snp基因型信息按照roh分析流程检测5 m以上roh。
[0043]
检测结果如图3所示,cnv检测结果:未检测到100kb以上cnv;倍性检测结果:单亲二体。从图3可以看出,处理样本2所有染色体z-score《-3,表明其为单倍体样本;roh检测结果:整个基因组均为roh状态。从图3可以看出,处理样本2所有染色体logff《-1,表明其为roh区域,出现这种情况的原因是该样本为单亲二体,整个基因组只有一套遗传物质,所以都表现为纯合状态,与倍性检测结果一致。
[0044]
实施例3本实施例利用本发明一体化检测cnv、单亲二体、三倍体和roh的方法对三倍体样本(细胞系样本)进行检测,包括以下步骤:1、构建基因组测序文库;2、上机测序,获得处理样本3的全基因组测序数据;3、获得分析参数:每个窗口的覆盖深度信息及snp基因型信息;4、基于测序深度信息按照cnv分析流程获得100 kb以上小cnv;5、基于snp基因型信息按照单亲二体/三倍体分析流程检测单亲二体与多倍体;6、基于snp基因型信息按照roh分析流程检测5 m以上roh。
[0045]
检测结果如图4所示,cnv检测结果:+(mosaic)(x);-(mosaic)(y);倍性检测结果:三倍体;处理样本3所有染色体z-score》3,其中位数为6.865,表明该样本为三倍体;roh检测结果:roh(x)(p22.31-p11.4)(32.4m);roh(x)(q25-q28)(28.8m);处理样本3的x染色体上存在两个区域logff《-1,表明其为roh区域。
[0046]
综合三个检测结果,可以得到该样本核型为69,xxy,即其他染色体都存在3条,chrx存在2条,chry存在一条。所以在与正常样本的cnv分析参考数据库对比的时候,出现了cnv检测结果中chrx嵌合重复,chry嵌合缺失的情况。由于该样本的两条chrx可能均来自母亲,所以同源重组的存在会导致roh的出现。三个结果是一致,相互验证的。
[0047]
实施例4本实施例利用本发明一体化检测cnv、单亲二体、三倍体和roh的方法对区域性roh样本(细胞系样本)进行检测,包括以下步骤:1、构建基因组测序文库;2、上机测序,获得处理样本4的全基因组测序数据;3、获得分析参数:每个窗口的覆盖深度信息及snp基因型信息;4、基于测序深度信息按照cnv分析流程获得100kb以上小cnv;5、基于snp基因型信息按照单亲二体/三倍体分析流程检测单亲二体与多倍体;6、基于snp基因型信息按照roh分析流程检测5m以上roh。
[0048]
检测结果如图5所示,cnv检测结果:
del(2)(p11.2-p11.2).seq[grch37/hg19](89150001-90280000)
×
1dup(10)(q11.21).seq[grch37/hg19](45190001-45380000)
×
3dup(12)(p11.21).seq[grch37/hg19](31210001-31430000)
×
3del(14)(q32.33).seq[grch37/hg19](106190001-106970000)
×
1dup(16)(p12.3).seq[grch37/hg19](20420001-20640000)
×
3dup(16)(p11.2-p11.1).seq[grch37/hg19](34440001-34770000)
×
3dup(17)(q21.31).seq[grch37/hg19](44140001-44370000)
×
3。
[0049]
倍性检测结果:二倍体,处理样本4所有染色体的中位数为1.309,在(-3,3)区间内,表明该样本为二倍体。
[0050]
roh检测结果:roh(15)(q11.2-q22.2)(38.4m);roh(15)(q26.2-q26.3)(5.4m),从图5可以看出,处理样本4的15号染色体上存在两个区域logff《-1,表明其为roh区域。
[0051]
综合三个检测结果,我们可以得出该样本15号染色体存在较大的roh区域,则会导致z-score下降,结果一致,可以相互验证。
[0052]
综上所述,本发明的一体化检测cnv、单亲二体、三倍体和roh的方法,能够基于全基因组测序数据,一体化检测出cnv、单亲二体、三倍体和roh区域,简化了检测流程,提高了检测效率且降低了检测成本。
[0053]
申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。