1.本发明涉及检测动物日龄的技术领域,具体涉及一种预测猪日龄的生物标志物,预测猪日龄的试剂和试剂盒,以及预测猪日龄的方法。
背景技术:2.开发精确的标记用于估计人和动物的生物年龄,评估不同干预措施对寿命的影响,一直是发育和衰老研究领域的热点。先前的研究利用各种生物标记来预测年龄,包括端粒长度、突变积累、基因表达水平或t细胞特异性dna重排等。然而,由于检测的年龄有较大的差异,这些方法在评估年龄过程的能力和准确性相对有限。dna甲基化研究为准确的估计生物体的年龄提供了新的思路。在哺乳动物中,发现数量众多的cpg位点的甲基化与年龄高度关联。这些关联位点可以用来建立模型,称为表观遗传时钟,可以作为一种生物标记物对年龄进行定量预测,用于解决发育、衰老研究和相关领域中的一些关键科学问题。
3.到目前为止,dna甲基化是已知最准确预测年龄的生物标记。研究者最早使用人类的唾液样本的甲基化位点进行年龄预测,其后,开发出基于不同组织和血液的甲基化标记。最近,基于一小部分cpg位点的dna甲基化水平的年龄预测模型已经在小鼠、狼、狗、鲸鱼等多个物种中相继建立,但是在猪中,基于dna甲基化的年龄预测模型还没有报道。
技术实现要素:4.本发明第一方面提供了一种预测猪日龄的生物标志物,包含一个或多个不同甲基化水平的cpg位点,所述cpg位点不同的甲基化水平对应猪的不同日龄。
5.进一步,在本发明提供的技术方案的基础上,所述cpg位点的位置信息包括chr1:265469121、chr1:6993958、chr1:77278255、chr1:77278255、chr1:90279146、chr1:10222822、chr1:200765194、chr1:252703561、chr1:127811329、chr1:218682018、chr1:272166208、chr2:112726051、chr2:131821312、chr3:79519033、chr3:71354421、chr3:96708114、chr3:4786944、chr4:110707399、chr4:51236025、chr4:61693637、chr4:35277986、chr4:71941843、chr4:38392750、chr5:46167692、chr5:3442060、chr5:83823568、chr5:86678792、chr6:63915584、chr6:98241827、chr6:7667231、chr6:59654560、chr6:148902979、chr6:131779338、chr6:131779339、chr6:63915581、chr6:151183086、chr6:107410789、chr6:134649996、chr7:15916877、chr7:1722548、chr7:89164845、chr7:14846023、chr7:70113867、chr7:89164756、chr7:86102364、chr7:89164755、chr8:46226086、chr8:71696260、chr8:138571452、chr8:78759323、chr8:116621205、chr8:41380820、chr9:116669694、chr9:68467395、chr9:96069192、chr9:36094595、chr9:73739560、chr9:114311129、chr10:14130890、chr10:14130912、chr10:27158773、chr11:43923343、chr11:13802486、chr12:52792396、chr13:158289588、chr13:32034512、chr13:77838609、chr13:30455076、chr13:85584193、chr13:1535436、chr13:111038503、chr14:31839031、chr14:71122259、chr16:57712066、chr17:43961681、chr18:
17893916中的至少一个,优选多个,最优选75个。
6.进一步,所述的生物标志物还包括所述cpg位点的权重。
7.骨骼肌在动物的体重中占据45%~60%的比重,由骨骼肌纤维组成,是动物中最丰富的组织,同时也是畜禽动物生长发育最重要的生产性状之一。猪动物产肉性能的高低及肉质质量取决于动物个体骨骼肌肌肉的生长发育。
8.猪的肌肉发育是一个十分复杂的过程,包括出生前肌纤维数量的增殖以及出生后肌纤维体积的增大、肌纤维类型的转变。这个过程中受到很多基因和转录因子的表达的调控,同时dna甲基化、转录后调控修饰等也在其中扮演着重要的角色。深入理解猪骨骼肌的发育机制对提高猪产肉性状的育种效率,培育高产优质猪新品种(系)具有重要的意义。对于保障我国粮食安全,实现猪种源产业的可持续发展,提升国际竞争力,具有重要的战略意义和市场前景。
9.本发明提供的上述生物标志物中,cpg位点的甲基化与哺乳动物的生长发育密切相关,可以用于预测猪生长日龄,为猪的产肉性状机制研究提供了新的思路,有利于猪的分子设计育种。
10.本发明第二方面提供了一种预测猪日龄的试剂或试剂盒,包含能够检测所述的生物标志物的试剂,以及任选的说明书。
11.此外,所述的试剂和试剂盒还可以包括任选地用于检测猪日龄的试剂。例如提取猪基因组dna的试剂,基因测序试剂,测试基因甲基化水平的试剂,以及其他本领域技术人员能够想到的其他试剂,耗材或说明书等。
12.本发明第三方面提供了一种预测猪日龄的方法,其包括测量猪的基因组dna中生物标记物cpg的甲基化水平,以及任选地还包括利用统计预测算法来确定猪的日龄,示例性地,所述算法包括(a)获得所述生物标志物cpg的甲基化水平的线性组合,和(b)对所述线性组合应用变换以确定猪的日龄。
13.进一步,在本发明提供的技术方案的基础上,其中所述生物标记物cpg为所述75个生物标志物cpg位点中的一个或多个。
14.进一步,所述生物标记物cpg包括但不限于至少10个,或至少20个,或至少30个,或至少40个,或至少50个,或至少60个,或至少70个,或至少75个甲基化生物标志物。
15.进一步,在本发明提供的技术方案的基础上,利用cpg位点的甲基化水平,以及每个cpg位点相应的权重,构建elastic net线性回归模型,预测待测猪的日龄。
16.进一步,所述模型所需的cpg位点为所述的75个cpg位点,和/或所用的猪参考基因组版本为sscrofa11.1版。
17.本发明利用猪不同发育阶段的肌肉全基因组dna甲基化数据,提出了一种基于75个cpg位点中的一个多个,优选75个cpg位点的甲基化水平准确预测猪生长日龄的方法。
18.上述基于cpg甲基化预测猪生长日龄方法不仅为猪的产肉性状机制研究提供了新的思路,有利于猪的分子设计育种。由于猪的亲缘关系与人较为相近,该方法为研究人和动物的发育、衰老等重要科学问题提供了一个理想的模型。
19.进一步,在本发明提供的技术方案的基础上,所述cpg位点及对应的权重信息如下表所示:
20.21.[0022][0023]
进一步,在本发明提供的技术方案的基础上,所述模型:日龄=w1·
β1+w2·
β2+..wi·
βi+w
75
·
β
75
+383.90,其中wi是cpg位点i的权重,βi是位点i的甲基化水平。
[0024]
进一步,所述生物标记物cpg的甲基化水平是通过测定生物样品的基因组中cpg的甲基化水平而测得的。
[0025]
进一步,其中所述生物样品是猪的肌肉、血液、唾液、表皮、脑、肾脏或肝脏样品。优选猪的肌肉。
[0026]
在本发明的一种实施方式中,所述预测猪日龄的方法包括以下步骤:
[0027]
步骤1,提取生物样品的基因组dna;
[0028]
步骤2,对提取的基因组dna进行全基因组甲基化测序;
[0029]
步骤3,计算相应位点在不同日龄样品的甲基化水平;
[0030]
步骤4,构建日龄预测的elastic net线性回归模型;
[0031]
步骤5,鉴定预测日龄的cpg位点
[0032]
步骤6,确定各位点的权重;
[0033]
步骤7,验证样本中确定位点和模型的准确性。
[0034]
本发明人经过研究,得到一种基于dna甲基化水平预测猪日龄的方法,该方法在猪基因组上筛选鉴定出了75个cpg位点,并对每个位点分别计算出一个对应的权重值,根据这75个cpg位点的甲基化水平和相应的权重,构建出了预测猪日龄的线性回归模型。
[0035]
本发明采用上述技术方案具有以下有益效果:
[0036]
(1)本发明提供的上述生物标志物可以用于预测猪生长日龄,为猪的产肉性状机制研究提供了新的思路,有利于猪的分子设计育种。
[0037]
(2)本发明提供的基于cpg甲基化预测猪生长日龄方法,填补了关于猪的dna甲基化的日龄预测模型方面的空白,为研究人和动物的发育、衰老等重要科学问题提供了一个理想的模型。
[0038]
(3)本发明提供的基于cpg甲基化预测猪生长日龄的模型,准确性高,检测猪的日龄准确可靠。
附图说明
[0039]
图1所示为实施例2构建的模型中甲基化位点预测表观日龄与实际日龄的比较图。
具体实施方式
[0040]
除非另有定义,本发明中所使用的所有科学和技术术语具有与本发明涉及技术领域的技术人员通常理解的相同的含义。
[0041]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0042]
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
[0043]
下面结合具体实施例详细描述本发明,这些实施例用于理解而不是限制本发明。
[0044]
如本文中所使用的术语“生物标志物”是指可能甲基化的cpg位置。甲基化通常发生在含cpg的核酸中。含cpg的核酸可能存在于例如基因的cpg岛、cpg二联核苷、启动子、内含子或外显子中。
[0045]
如本文所用,术语“dna甲基化”是指向cpg双核苷酸之间的胞嘧啶残基的5’碳添加甲基(即,5-甲基胞嘧啶)。dna甲基化可在其他情况下发生在胞嘧啶中,例如chg和chh,其中
h是腺嘌呤、胞嘧啶或胸腺嘧啶。胞嘧啶甲基化还可呈5-羟甲基胞嘧啶的形式。dna甲基化可包括非胞嘧啶甲基化,诸如n6-甲基腺嘌呤。
[0046]
如本文中所使用的术语“基因组”或“基因组的”是生物体染色体中的所有遗传物质。来源于特定生物体的染色体中的遗传物质的dna是基因组dna。
[0047]
如本文中所使用的术语“基因”是指与指定基因相关的基因组dna区域。举例来说,所述区域可以由特定基因(诸如蛋白质编码序列外显子、插入内含子和相关表达控制序列)和其侧接序列来定义。然而,本领域中已经认识到特定区域中的甲基化通常指示近端基因组位点上的甲基化状态。
[0048]
实施例1
[0049]
一种构建预测猪日龄模型的方法,包括以下步骤:
[0050]
一.提取猪基因组dna
[0051]
对试验猪肌肉组织进行采样,采用0.5ml裂解液(0.5mol/l edta、0.5mol/l edta、1mol/l nacl、10%sds、rnase stock)进行裂解,采用10μl蛋白酶k(5mg/ml)进行消化处理,采用酚仿法进行dna提取,具体步骤如下:
[0052]
(1)将组织剪碎加到1.5ml离心管,在管中加裂解液和蛋白酶k,放入摇床(56℃,5h);
[0053]
(2)加入等体积的tris饱和酚(500μl),摇匀(10分钟);
[0054]
(3)12000rpm离心5分钟,取上层液体转移到新的离心管;
[0055]
(4)配置tris饱和酚:氯仿:异戊醇=25:24:1;
[0056]
(5)向装有上清液的新离心管中加入0.45ml步骤4配置的混合液;
[0057]
(6)12000rpm离心5分钟,取上清液转移到新的离心管,加入等体积的氯仿和异戊醇混合液0.4ml(氯仿:异戊醇=24:1);
[0058]
(7)12000rpm离心5分钟,取上清液转移到新的离心管,加入2.5倍-20℃预冷的无水乙醇,-20℃过夜;
[0059]
(8)12000rpm离心5分钟,弃上清,保留白色沉淀,加入0.4ml 75%乙醇,反复吹打,离心去液体;
[0060]
(9)重复步骤8;
[0061]
(10)加入ddh2o,提取完成。
[0062]
二.全基因组甲基化测序和cpg位点的甲基化水平计算
[0063]
全基因组甲基化测序结果进行比对,计算cpg位点的甲基化水平,具体方法如下:
[0064]
(1)使用covaris s220将上步骤提取的基因组dna随机打断至200-300bp;对打断后的dna片段进行末端修复、加a尾,并连接上所有胞嘧啶均经过甲基化修饰的测序接头。
[0065]
(2)随后进行bisulfite处理(采用ez dna methylation gold kit,zymo research),经过处理,未发生甲基化的c变成u(pcr扩增后变为t),而甲基化的c保持不变,最后进行pcr扩增,得到最终的dna文库。
[0066]
(3)对dna文库进行illumina测序,测序平台为hiseq x ten。采用bismark进行甲基化位点检测,对于鉴定出的甲基化位点,计算其甲基化水平。
[0067]
三.构建可预测猪日龄的线性模型,模型内容:
[0068]
日龄(age)=w1·
β1+w2·
β2+..wi·
βi+w
75
·
β
75
+383.90,其中wi是cpg位点i的权重,
βi是位点i的甲基化水平。
[0069]
cpg位点和权重信息见表1。
[0070]
表1
[0071]
[0072]
[0073]
[0074][0075]
实施例2
[0076]
验证实施例1的cpg位点和模型的准确性
[0077]
一、提取猪基因组dna,全基因组甲基化测序
[0078]
对试验猪27个时间点的骨骼肌组织进行采样,每个时间点3个重复,总共81个样本,其中随机抽取80%的样本(n=64)作为训练样本,剩余20%样本(n=17)作为验证样本。采用0.5ml裂解液(0.5mol/l edta、0.5mol/l edta、1mol/l nacl、10%sds、rnase stock)进行裂解,采用10μl蛋白酶k(5mg/ml)进行消化处理,采用酚仿法进行dna提取,具体步骤如下:
[0079]
(1)将组织剪碎加到1.5ml离心管,在管中加裂解液和蛋白酶k,放入摇床(56℃,5h);
[0080]
(2)加入等体积的tris饱和酚(500μl),摇匀(10分钟);
[0081]
(3)12000rpm离心5分钟,取上层液体转移到新的离心管;
[0082]
(4)配置tris饱和酚:氯仿:异戊醇=25:24:1;
[0083]
(5)向装有上清液的新离心管中加入0.45ml步骤4配置的混合液;
[0084]
(6)12000rpm离心5分钟,取上清液转移到新的离心管,加入等体积的氯仿和异戊醇混合液0.4ml(氯仿:异戊醇=24:1);
[0085]
(7)12000rpm离心5分钟,取上清液转移到新的离心管,加入2.5倍-20℃预冷的无水乙醇,-20℃过夜;
[0086]
(8)12000rpm离心5分钟,弃上清,保留白色沉淀,加入0.4ml 75%乙醇,反复吹打,离心去液体;
[0087]
(9)重复步骤8;
[0088]
(10)加入ddh2o,基因组dna提取完成。
[0089]
二、全基因组甲基化测序和cpg位点的甲基化水平计算
[0090]
(1)使用covaris s220将基因组dna随机打断至200-300bp;对打断后的dna片段进行末端修复、加a尾,并连接上所有胞嘧啶均经过甲基化修饰的测序接头。
[0091]
(2)随后进行亚硫酸盐处理(采用ez dna methylation gold kit,zymo research),经过处理,未发生甲基化的c变成u(pcr扩增后变为t),而甲基化的c保持不变,
最后进行pcr扩增,得到最终的dna文库。
[0092]
(3)对dna文库进行illumina测序,测序平台为hiseq x ten。采用bismark进行甲基化位点检测,对于鉴定出的甲基化位点,计算其甲基化水平。
[0093]
(4)随机选择64个不同日龄的样本的甲基化水平数据作为测试数据构建模型,剩余17个不同日龄的样本的数据作为验证数据,根据构建的模型计算出推测日龄并与实际日龄相比较(比较结果如图1所示),检验模型的准确性。图1的结果显示,在训练群体中,61个样本的表观日龄和实际日龄绝对误差的中位数为1.22天,日龄相关性为0.9999。在测试群体中,21个样本的出生前和出生后表观日龄和实际日龄绝对误差的中位数分别为6.3天和12.06天,日龄相关性为0.9776。证明构建的模型准确性高,选取的75个cpg位点的甲基化信息可以有效的预测猪的日龄。
[0094]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换等,均应包含在本发明的保护范围之内。