1.本发明涉及诊断领域,并具体地涉及肠易激综合征(ibs)的诊断。
背景技术:
::2.肠易激综合征(ibs)是影响消化系统的常见疾患。全球流行病学研究的结果显示,ibs在3%至30%的人群中存在,不同国家之间没有共同趋势(1)。症状包括痉挛、腹胀、腹泻及便秘,并在很长一段时间内(通常为数年)发生。ibs患者常见诸如焦虑、重度抑郁及慢性疲劳综合征的症状。目前尚未知ibs的治愈方法,且治疗通常是为了改善症状而进行。治疗可包括饮食变化、用药、益生菌和/或心理辅导。通常被建议作为治疗方法的饮食措施包括:增加可溶性纤维摄入量;无麸质饮食;或短期低可发酵寡糖、双糖、单糖及多元醇(fodmap)的饮食。用药洛哌丁胺(loperamide)用于帮助治疗腹泻,而泻药用于帮助治疗便秘。抗抑郁剂可改善整体症状及疼痛。像大多数慢性非传染性病症一样,ibs似乎是异质性的(2)。其严重程度范围从恼人的肠紊乱到社交失能,伴有明显的症状异质性(3)。尽管经常被视为脑-肠轴的病症(4,5),但尚不清楚ibs是起于肠,还是起于脑,还是起于两者。感染后ibs(6)的发生表明,一部分病例起始于终末器官(end-organ),但具有易感性风险因素,其中一些可为社会心理因素。微生物组科学的进步,以及出现针对微生物群对神经发育及可能对行为的影响不断变化的证据,将心/身联系的概念拓宽成涵盖微生物群-肠-脑轴(7)。3.但是,理解及治疗ibs的进步受到不存在可靠的生物标志物的限制,且ibs仍通过症状来定义。目前,使用罗马准则(romecriteria)对胃肠道(gi)疾病诸如ibs进行归一化。使用罗马准则诊断ibs是基于患者是否有与ibs相关的症状。这些准则由功能性胃肠病症专家组(称为罗马共识委员会(romeconsensuscommission))建立,以开发及提供研究指导。它们已在五个单独版本中进行了更新,以使它们在研究之外更相关,且有助于改善临床试验(1,8)。但是,一项研究(1)的结果表明,ibs的盛行率取决于所采用的罗马准则的版本;后来的版本表现出群体中的ibs盛行率较低。4.用于诊断ibs的其他准则包括:wonca准则,其涉及其他器质病的排除;及dsm(精神病症诊断及统计手册(diagnosticandstatisticalmanualformentaldisorders))。在此,诊断前所包括的分析很少,只有例外情况下才进行专家检查(1)。研究了与对照(非ibs)组相比,患有ibs的患者中的肠微生物群改变(9,10,11,12)。微生物组与饮食、抗生素及肠道感染(可能全部都涉及ibs)的相互作用与微生物组改变可能激活或延长综合征的病理生理机制的假说相符(13,14)。已发现生物标志物与ibs相关,其为定义不基于临床症状的ibs亚群体提供了更大灵活性(1)。然而,缺乏将ibs患者与对照分开且有助于告知疗法的健全的微生物组识别标志(signature)或生物标志物,但是提出了ibs严重程度的识别标志(12)。此外,迄今为止,大多数微生物群研究均采用16srrna定量分析(profiling),且不分析细菌代谢物。5.罗马准则也用于对ibs亚型进行分类。当前,ibs亚型由罗马准则(15)定义。这些亚型为ibs-c、ibs-d及ibs-m。ibs-c为便秘型ibs,其中大便类型1及2(根据布里斯托大便图表(bristolstoolchart))的存在时间多于25%,且大便类型6及7的存在时间少于25%。ibs-d为腹泻型ibs,其中大便类型1及2的存在时间少于25%,且大便类型6及7的存在时间多于25%。ibs-m为存在ibs-c及ibs-d的混合的ibs,其中大便类型1、2、6及7的存在时间多于25%,且被称为混合型ibs。尽管这些分类可以确立便秘胜于腹泻型及腹泻胜于便秘型,但鉴于疾病的异质性以及患者在给定时间段内自一种亚型分类转变为另一亚型分类的趋势,它们对于ibs的长期治疗来说不是很有用(16)。当前方法具有显著的局限性,包括未能告知有时在几天之内在亚型之间交替的患者的治疗方法(17)。对于此种疾病需要更多的了解,且像其他肠相关疾病一样,肠微生物群中的变化可能标志着疾病模式的变化(18)。此外,腹泻或便秘的形式可以多种多样。如果对误分类的患者开具处方,则被设计以应对截然相反症状的药剂可能产生严重的非所要的不良作用(19)。令人感兴趣的是患有ibs的患者的微生物组的改变以及与ibs症状的相关性(若存在)。但是,根据罗马准则,ibs亚型(ibs-c、ibs-d、ibs-m)不可用于区分诊断为ibs的患者的不同微生物组。6.需要用于诊断肠病症诸如ibs的进一步且改进的方法,包括各种ibs亚型的诊断。技术实现要素:7.本发明开发了用于诊断ibs的新的且改进的方法。对患者及对照(非ibs)个体中的微生物、代谢组(metabolome)及基因途径的全面且详细的分析允许对新的疾病指标进行鉴别。因此,本发明提供一种诊断患者中的ibs的方法,其包括检测:与ibs相关的分类群的细菌菌株;参与与ibs相关的途径中的微生物基因;和/或与ibs相关的代谢物。发明人还开发了用于对患有ibs的患者进行分层的新的且改进的方法。因此,本发明提供一种基于微生物组将ibs患者分类为亚组的方法,其包括检测:与ibs亚组相关的分类群的细菌菌株和/或与ibs亚组相关的代谢物。附图说明8.图1.对照及ibs组的微生物群组成分析。(a)微生物群β多样性的主坐标分析(pcoa),其显示对照与ibs组之间的显著差异。在16s属水平下使用spearman距离进行pcoa(p值=0.001;对照:n=63,ibs组:n=78)。(b)通过散弹枪数据集上的随机森林机器学习确定的ibs的预测分类群(对照:n=59;ibs组:n=80)。(c)微生物群组成的pcoa,其显示ibs临床亚型之间没有显著差异。在16sotu水平下使用spearman距离进行pcoa(p值=0.976;ibs-c:n=29,ibs-d:n=20,ibs-m:n=29)。(d)对照及ibs组的散弹枪属概况(对照:n=58,ibs:n=78)。使用置换manova(r函数/程序包:adonis/vegan)计算图a及c中显示的数据/测试的p值。9.图2.微生物群多样性的pcoa显示对照与ibs组之间有显著差异。在散弹枪属水平下使用spearman距离进行pcoa(p值=0.001;对照:n=58,ibs:n=78)。10.图3.ibs组及对照组的微生物群多样性。(a)基于wilcoxon秩和检验,ibs组的多样性(观察到的丰富度)与对照组显著不同(p值=9.215e-08,对照:n=63,ibs:n=78)。(b)基于kruskal-wallis,ibs临床亚型的多样性(观察到的丰富度)与对照组显著不同(p值=1.28e-06,对照:n=63;ibs-c:n=29;ibs-d:n=20;ibs-m:n=29)。(c)使用基于wilcoxon的差异,对照的多样性(shannon指数)与ibs组显著不同,(p值=0.00032,对照:n=63,ibs:n=78)。11.图4.对照及ibs组尿液及粪便代谢组的比较。(a)尿液挥发性有机物(faims)代谢组的pcoa。adonisp值=0.001;(对照:n=65;ibs:n=80)。(b)使用spearman距离的尿液ms代谢组学的pcoa。adonisp值=0.001;(对照:n=63;ibs:n=80)。(c)使用spearman距离的粪便ms代谢组学的pcoa。adonisp值=0.001;(对照:n=63;ibs:n=80)。使用置换manova(r函数/程序包:adonis/vegan)计算p值12.图5.使用spearman距离的faims尿液代谢组学的pcoa显示,对照与ibs临床亚型之间有显著差异(adonisp值=0.001;对照:n=63;ibs-c:n=29;ibs-d:n=20;ibs-m:n=29)。13.图6.区分ibs与对照状态的尿液代谢组学接受者操作特征(receiveroperatingcharacteristic;roc)曲线。(a)使用10倍交叉验证对尿液lc/gc-ms代谢组学进行的roc曲线分析(对照:n=61;ibs:n=78,其中85%(52/61)的对照组及95%(74/78)的ibs组被正确预测)。(b)使用10倍交叉验证对尿液faims代谢组学进行的roc曲线分析(对照:n=63;ibs:n=78,其中70%(44/63)的对照组及83%(65/78)的ibs组被正确预测)。14.图7.使用spearman距离的粪便代谢组学的pcoa显示ibs临床亚型之间没有显著差异(p值=0.202;ibs-c:n=29;ibs-d:n=20;ibs-m:n=29)。15.图8.类间分析(bca),其显示当与对照组相比时的两个微生物群-ibs聚类(对照:n=63,ibs聚类i:n=35,ibs聚类ii:n=43)。16.图9.替代性机器学习管线的核心工作流程。n代表最小绝对紧缩与选择算子(lasso)返回的特征数。17.图10.宏基因组学样品中的共丰富基因的主坐标分析显示,ibs组(80个样品)与对照(59个样品)之间有显著分裂。使用pmanova确定分裂的显著性(p<0.001)。18.图11.利用使用canberra距离及ward连接的阶层分群法的微生物组otu数据热图。19.图12.健康对照及三个ibs亚组(ibs-1、ibs-2、ibs-3)的α多样性(观察到的种)。观察到的种(丰富度)定义为样品中独特otu的数量。使用anova确定显著性。20.图13.健康对照及三个ibs亚组(ibs-1、ibs-2、ibs-3)的使用16s测序的样品在属水平下的canberra距离的pcoa。21.图14.健康对照及三个ibs亚组(ibs-1、ibs-2、ibs-3)的散弹枪测序的样品在种水平下的canberra距离的pcoa。22.图15.健康对照及三个ibs亚组(ibs-1、ibs-2、ibs-3)的粪便代谢组学样品的canberra距离的pcoa。23.图16.健康对照及三个ibs亚组(ibs-1、ibs-2、ibs-3)的尿液代谢组学样品的canberra距离的pcoa。24.图17.对照及ibs组的微生物群组成分析。宏基因组种分析(共丰富基因,cag)的pcoa,其显示对照与ibs组之间有显著差异。(对照:n=59;ibs:n=80)。使用置换manova(r函数/程序包:adonis/vegan)计算显示的数据/测试的p值。具体实施方式25.作为ibs的预测特征的细菌分类群26.如实施例中所说明,发明人已鉴别出预测ibs的细菌分类群。因此,本发明提供用于诊断ibs的方法,其包括检测某些细菌分类群的存在。如下所详述,本发明中所用的细菌分类群可参考16srrna基因序列来定义,或本发明可使用林奈分类法(linnaeantaxonomy)。可使用演化支特有的细菌基因、16s序列、转录组学、代谢组学或此类技术的组合来检测分类群中任一类目的细菌。优选地,这些方法包括检测患者的粪便样品中的细菌(即一种或多种细菌菌株)。替代地,可检测诸如拭子的口腔样品的细菌。通常,在本发明的方法中检测与ibs相关的细菌分类群包含测量样品中的细菌的相对丰度,例如相对于对照(非ibs)个体的对应样品或相对于参考值。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测细菌种,细菌种可包括以下属中的一者或多者:放线菌属(actinomyces)、颤杆菌属(oscillibacter)、副普雷沃菌属(paraprevotella)、毛螺菌科属(lachnospiraceae)、韦荣球菌科属(erysipelotrichaceae)及粪球菌属(coprococcus)。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测属于选自由以下组成的群的属的细菌菌株:埃希氏杆菌属(escherichia)、梭菌属(clostridium)、链球菌属(streptococcus)、副拟杆菌属(parabacteroides)、苏黎世杆菌属(turicibacter)、真杆菌属(eubacterium)、拟杆菌属(bacteroides)、克雷伯氏菌属(klebsiella)、假黄杆菌属(pseudoflavonifractor)及肠球菌属(enterococcus)。在一个具体实施方案中,细菌种属于放线菌属。在一个具体实施方案中,细菌种属于颤杆菌属。在一个具体实施方案中,细菌种属于副普雷沃菌属。在一个具体实施方案中,细菌种属于毛螺菌科属。在一个具体实施方案中,细菌种属于韦荣球菌科属。在一个具体实施方案中,细菌种属于粪球菌属。在一个具体实施方案中,细菌种属于埃希氏杆菌属。在一个具体实施方案中,细菌种属于梭菌属。在一个具体实施方案中,细菌种属于链球菌属。在一个具体实施方案中,细菌种属于副拟杆菌属。在一个具体实施方案中,细菌种属于苏黎世杆菌属。在一个具体实施方案中,细菌种属于真杆菌属。在一个具体实施方案中,细菌种属于拟杆菌属。在一个具体实施方案中,细菌种属于克雷伯氏菌属。在一个具体实施方案中,细菌种属于假黄杆菌属。在一个具体实施方案中,细菌种属于肠球菌属。在优选实施方案中,本发明的方法包括检测表1中列出的属中的多于一者的细菌(即一种或多种细菌菌株),诸如检测放线菌属、颤杆菌属、副普雷沃菌属、毛螺菌科属、韦荣球菌科属及粪球菌属的细菌。在某些实施方案中,可使用演化支特有的细菌基因、16s序列、转录组学或代谢组学来检测细菌(即一种或多种细菌菌株)。在任何此类实施方案中,检测细菌包含测量样品中的细菌的相对丰度,例如相对于对照(非ibs)个体的对应样品或相对于参考值。实例表明,此类方法特别有效。27.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测选自以下的一种或多种细菌种:活泼瘤胃球菌(ruminococcusgnavus)、灵巧粪球菌(coprococcuscatus)、肠道巴恩斯氏菌(barnesiellaintestinihominis)、人结肠厌氧棍状菌(anaerotruncuscolihominis)、挑剔真杆菌(eubacteriumeligens)、共生梭菌(clostridiumsymbiosum)、食葡糖罗斯拜瑞氏菌(roseburiainulinivorans)、克拉副普雷沃菌(paraprevotellaclara)、酸奶瘤胃球菌(ruminococcuslactaris)、奇特龙梭菌(clostridiumcitroniae)、柔嫩梭菌(clostridiumleptum)、布氏瘤胃球菌(ruminococcusbromii)、多形拟杆菌(bacteroidesthetaiotaomicron)、两形真杆菌(eubacteriumbiforme)、青春双岐杆菌(bifidobacteriumadolescentis)、狄氏副拟杆菌(parabacteroidesdistasonis)、隐蔽小杆菌(dialisterinvisus)、粪便拟杆菌(bacteroidesfaecis)、穗状丁酸弧菌(butyrivibriocrossotus)、系结梭菌(clostridiumnexile)、解纤维拟杆菌(bacteroidescellulosilyticus)、多毛假黄杆菌(pseudoflavonifractorcapillosus)、咽峡炎链球菌(streptococcusanginosus)、血链球菌(streptococcussanguinis)、脱硫脱硫弧菌(desulfovibriodesulfuricans)和/或多枝梭菌(clostridiumramosum)。在某些实施方案中,本发明的方法包括检测上文清单的两种或更多种,诸如至少5、10、15、20种或所有种。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测一种或多种细菌菌株,所述一种或多种细菌菌株可选自由以下组成的清单:毛螺菌科细菌3_1_46faa、毛螺菌科细菌7_1_58faa、毛螺菌科细菌1_4_56faa、毛螺菌科细菌2_1_58faa、粪球菌属art55_1、另枝菌属ap11和/或拟杆菌种1_1_6、或对应菌株诸如具有与参考细菌的16srrna基因序列有至少95%、96%、97%、98%、99%、99.5%或99.9%同一性的16srrna基因序列的菌株。在某些实施方案中,本发明的方法包括检测上文清单的两种或更多种细菌,诸如至少3、4、5种或所有细菌。在任何此类实施方案中,检测细菌包含测量样品中的细菌的相对丰度,例如相对于对照(非ibs)个体的对应样品或相对于参考值。在某些实施方案中,可使用演化支特有的细菌基因、16s序列、转录组学或代谢组学来检测细菌(即一种或多种细菌菌株)。28.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测选自以下的一种或多种细菌种:口颊普雷沃菌(prevotellabuccalis)、白痢丁酸球菌(butyricicoccuspullicaecorum)、细长颗粒链菌(granulicatellaelegans)、多毛假黄杆菌、多枝梭菌、血链球菌、奇特龙梭菌、脱硫脱硫弧菌、皮氏嗜血杆菌(haemophiluspittmaniae)、克拉副普雷沃菌、咽峡炎链球菌、人结肠厌氧棍状菌、共生梭菌、多酸光岗菌(mitsuokellamultacida)、系结梭菌、发酵乳杆菌(lactobacillusfermentum)、两形真杆菌、柔嫩梭菌、嗜果胶拟杆菌(bacteroidespectinophilus)、灵巧粪球菌、挑剔真杆菌、食葡糖罗斯拜瑞氏菌、粪便拟杆菌、肠道巴恩斯氏菌、多形拟杆菌(bacteroidesthetaiotaomicron)、布氏瘤胃球菌、活泼瘤胃球菌、酸奶瘤胃球菌、狄氏副拟杆菌、穗状丁酸弧菌、解纤维拟杆菌、青春双岐杆菌和/或隐蔽小杆菌。在某些实施方案中,本发明的方法包括检测上文清单的两种或更多种,诸如至少5、10、15、20种或所有种。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测一种或多种细菌菌株,所述一种或多种细菌菌株可选自由以下组成的清单:毛螺菌科细菌2_1_58faa、毛螺菌科细菌7_1_58faa、毛螺菌科细菌1_4_56faa、毛螺菌科细菌3_1_46faa、另枝菌属ap11、拟杆菌种1_1_6和/或粪球菌属art55_1、或对应菌株诸如具有与参考细菌的16srrna基因序列有至少95%、96%、97%、98%、99%、99.5%或99.9%同一性的16srrna基因序列的菌株。在某些实施方案中,本发明的方法包括检测上文清单的两种或更多种细菌,诸如至少3或4种或所有细菌。在任何此类实施方案中,检测细菌包含测量样品中的细菌(即一种或多种细菌菌株)的相对丰度,例如相对于对照(非ibs)个体的对应样品或相对于参考值。在某些实施方案中,可使用演化支特有的细菌基因、16s序列、转录组学或代谢组学来检测细菌(即一种或多种细菌菌株)。29.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测属于与ibs相关的操作分类单元(otu)的一种或多种细菌菌株。如所属领域中所已知,操作分类单元(otu)为用于对密切相关个体的群进行分类的操作定义。如本文所用,“otu”为通过特有的分类学标志基因的dna序列相似性进行分组的一组生物(49)。在一些实施方案中,特有的分类学标志基因为16srrna基因。在一些实施方案中,核糖体数据库项目(ribosomaldatabaseproject;rdp)分类学分类器用于为代表性otu序列分配分类。例如,表12中的序列信息可用于分类细菌(即一种或多种细菌菌株)是否属于表11中所列出的otu。与表12中的序列具有至少97%序列同一性的细菌属于表11中的对应otu。在优选实施方案中,otu选自表1、11和/或12。在任何此类实施方案中,检测细菌包含测量样品中的细菌(即一种或多种细菌菌株)的相对丰度,例如相对于对照(非ibs)个体的对应样品或相对于参考值。30.在某些实施方案中,细菌种属于基于序列的分类群。在优选实施方案中,基于序列的分类群选自表1-3。31.在一个实施方案中,预测ibs的细菌种或菌株在患有ibs的患者中较丰富。在一个具体实施方案中,本发明的方法包括测量细菌种或菌株的丰度,其中增加的丰度与ibs相关,并且其中菌株或种选自:活泼瘤胃球菌、毛螺菌科细菌3_1_46faa、毛螺菌科细菌7_1_58faa、人结肠厌氧棍状菌、毛螺菌科细菌1_4_56faa、共生梭菌、奇特龙梭菌、毛螺菌科细菌2_1_58faa、系结梭菌和/或多枝梭菌。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测患有ibs的患者中较丰富的一种或多种细菌种或菌株。在某些实施方案中,本发明的方法包括检测上文清单的两种或更多种或菌株,诸如至少5、10、15、20种或所有种。32.在一个实施方案中,预测ibs的细菌种在患有ibs的患者中显著较丰富。在一个优选实施方案中,在患有ibs的患者中显著较丰富的预测ibs的细菌种为活泼瘤胃球菌和/或毛螺菌科种(lachnospiraceaespp)。33.在一个实施方案中,预测ibs的细菌种或菌株在患有ibs的患者中较不丰富。在一个具体实施方案中,本发明的方法包括测量细菌种或菌株的丰度,其中降低的丰度与ibs相关,并且其中菌株或种选自:灵巧粪球菌、肠道巴恩斯氏菌、挑剔真杆菌、克拉副普雷沃菌、酸奶瘤胃球菌、两形真杆菌和/或粪球菌属art551。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测一种或多种在患有ibs的患者中较不丰富的细菌种或菌株。34.在一个实施方案中,预测ibs的细菌种在患有ibs的患者中显著较不丰富。在一个优选实施方案中,在患有ibs的患者中显著较不丰富的预测ibs的细菌种为肠道巴恩斯氏菌和/或灵巧粪球菌。35.在一个具体实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测选自表2的预测ibs的细菌分类群:在某些实施方案中,预测ibs的细菌分类群在患有ibs的患者中显著较丰富,例如,如表2和/或表3所示。在其他实施方案中,预测ibs的细菌分类群在患有ibs的患者中显著较不丰富,例如,如表2和/或表3所示。36.在一个实施方案中,预测ibs的细菌种或菌株在患有ibs的患者中为差异丰富的。在一个具体实施方案中,本发明的方法包括测量细菌种的丰度,其中差异性丰度与ibs相关,且其中种选自:活泼瘤胃球菌、鲍氏梭菌(clostridium_bolteae)、人结肠厌氧棍状菌、普氏黄杆菌(flavonifractorplautii)、梭状梭菌(clostridiumclostridioforme)、哈氏梭菌(clostridiumhathewayi)、共生梭菌、扭链瘤胃球菌(ruminococcustorques)、塞内加尔另枝菌(alistipessenegalensis)、人体普雷沃菌(prevotellacopri)、迟缓埃格特菌(eggerthellalenta)、天门冬形梭菌(clostridiumasparagiforme)、肠道巴恩斯氏菌、奇特龙梭菌、挑剔真杆菌、多枝梭菌、灵巧粪球菌、两形真杆菌、酸奶瘤胃球菌、马赛拟杆菌(bacteroidesmassiliensis)、副流感嗜血杆菌(haemophilusparainfluenzae)、系结梭菌、无害梭菌(clostridiuminnocuum)、溶木聚糖拟杆菌(bacteroidesxylanisolvens)、产甲酸草酸杆菌(oxalobacterformigenes)、腐生另枝菌(alistipesputredinis)、克拉副普雷沃菌和/或内脏臭气杆菌(odoribactersplanchnicus)。在一个具体实施方案中,本发明的方法包括测量细菌菌株的丰度,其中差异性丰度与ibs相关,且其中菌株选自:梭菌目(clostridiales)细菌1747faa、毛螺菌科细菌1456fa、毛螺菌科细菌5157faa、毛螺菌科细菌3146faa、毛螺科菌7158faa、粪球菌种art551、毛螺菌科细菌3157faact1、毛螺菌科细菌2158faa和/或真杆菌属3131。在某些实施方案中,可使用演化支特有的细菌基因、16s序列、转录组学或代谢组学来检测细菌(即一种或多种细菌菌株)。37.在一个实施方案中,预测ibs的细菌种或菌株在患有ibs的患者中为差异丰富的。在一个具体实施方案中,本发明的方法包括测量细菌种的丰度,其中差异性丰度与ibs相关,且其中种选自:大肠杆菌(escherichiacoli)、咽峡炎链球菌、约氏副拟杆菌(parabacteroidesjohnsonii)、格氏链球菌(streptococcusgordonii)、鲍氏梭菌、血苏黎士杆菌(turicibactersanguinis)、xylaniphila副普雷沃菌、变形链球菌(streptococcusmutans)、平常拟杆菌(bacteroidesplebeius)、梭状梭菌、肺炎克雷伯氏菌(klebsiellapneumoniae)、哈氏梭菌、脆弱拟杆菌(bacteroidesfragilis)、解糖胨普雷沃菌(prevotelladisiens)、柔嫩梭菌、多毛假黄杆菌、肠拟杆菌(bacteroidesintestinalis)、粪肠球菌(enterococcusfaecalis)、婴儿链球菌(streptococcusinfantis)、沙氏另枝菌(alistipesshahii)、天门冬形梭菌、共生梭菌和/或血链球菌。在一个具体实施方案中,本发明的方法包括测量细菌菌株的丰度,其中差异性丰度与ibs相关,且其中菌株选自:梭菌目细菌1747faa、真杆菌属3131、毛螺菌科细菌5157faa、梭菌科细菌jc118和/或毛螺菌科细菌1456fa。在某些实施方案中,可使用演化支特有的细菌基因、16s序列、转录组学或代谢组学来检测细菌(即一种或多种细菌菌株)。38.在一个实施方案中,患有ibs的患者的粪便微生物群α多样性降低。在一个实施方案中,患有ibs的患者的个体内微生物群多样性降低。在一个实施方案中,患有患有ibs的患者的粪便微生物群α多样性显著低于非ibs患者。在一个实施方案中,患有ibs的患者个体内微生物群多样性显著低于非ibs患者。在另一个实施方案中,ibs临床亚型之间的微生物群α多样性没有显著不同。39.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测属于与ibs相关的操作分类单元(otu)的一种或多种细菌菌株。在优选实施方案中,otu选自表11。在一个实施方案中,与ibs相关的otu经分类为属于厚壁菌门(firmicutesphylum)。在一个具体实施方案中,与ibs相关的otu经分类为属于梭菌纲(clostridiaclass)。在一个具体实施方案中,与ibs相关的otu经分类为属于梭菌目(clostridialesorder)。在一个具体实施方案中,与ibs相关的otu经分类为属于梭菌目毛螺菌科或瘤胃球菌科。在一个具体实施方案中,与ibs相关的otu经分类为属于丁酸球菌属。40.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测属于表11中所列出的一个或多个otu的细菌菌株:表12中的序列可用于将细菌分类为属于表11中所列出的otu。与表12中的序列具有至少97%序列同一性的细菌(即一种或多种细菌菌株)属于表11中的对应otu。比对在序列的长度上进行。在metaphlan2及humann2运行中,使用bowtie2进行种组成的比对。bowtie2以“非常敏感的引数”运行,且比对方式为“全域比对”。41.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测与seqidno:1有至少97%(例如98%、99%、99.5%或100%)同一性的16srrna基因序列的细菌(即一种或多种细菌菌株)。在某些此类实施方案中,细菌经分类为属于毛螺菌科。42.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测与seqidno:2有至少97%(例如98%、99%、99.5%或100%)同一性的16srrna基因序列的细菌(即一种或多种细菌菌株)。在某些此类实施方案中,细菌经分类为属于厚壁菌门。43.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测与seqidno:3有至少97%(例如98%、99%、99.5%或100%)同一性的16srrna基因序列的细菌(即一种或多种细菌菌株)。在某些此类实施方案中,细菌经分类为属于丁酸球菌属。44.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测与seqidno:4有至少97%(例如98%、99%、99.5%或100%)同一性的16srrna基因序列的细菌(即一种或多种细菌菌株)。在某些此类实施方案中,细菌经分类为属于毛螺菌科。45.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测与seqidno:5有至少97%(例如98%、99%、99.5%或100%)同一性的16srrna基因序列的细菌(即一种或多种细菌菌株)。在某些此类实施方案中,细菌经分类为属于梭菌目。46.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测与seqidno:6有至少97%(例如98%、99%、99.5%或100%)同一性的16srrna基因序列的细菌(即一种或多种细菌菌株)。在某些此类实施方案中,细菌经分类为属于瘤胃球菌科。47.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测与seqidno:7有至少97%(例如98%、99%、99.5%或100%)同一性的16srrna基因序列的细菌(即一种或多种细菌菌株)。在某些此类实施方案中,细菌经分类为属于瘤胃球菌科。48.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测与seqidno:8有至少97%(例如98%、99%、99.5%或100%)同一性的16srrna基因序列的细菌(即一种或多种细菌菌株)。在某些此类实施方案中,细菌经分类为属于厚壁菌门。49.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测与seqidno:9有至少97%(例如98%、99%、99.5%或100%)同一性的16srrna基因序列的细菌(即一种或多种细菌菌株)。在某些此类实施方案中,细菌经分类为属于瘤胃球菌科。50.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测与seqidno:10有至少97%(例如98%、99%、99.5%或100%)同一性的16srrna基因序列的细菌(即一种或多种细菌菌株)。在某些此类实施方案中,细菌经分类为属于毛螺菌科。51.在优选实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测与seqidno:1-10(诸如seqidno:1-10中的5、8或所有)具有至少97%(例如98%、99%、99.5%或100%)同一性的16srrna基因序列的不同细菌(即一种或多种细菌菌株)。52.作为ibs的预测因子的途径改变53.发明人已鉴别出,某些途径在患有ibs的患者的微生物群的基因组中过量或不足。因此,本发明提供用于基于基因、途径、携带这些基因的细菌的存在或丰度来诊断ibs的方法。诊断方法包括检测参与一个或多个本文所鉴别的途径的基因,可对于用于不同的患者群体来说特别有用,因为不同的患者群体可能具有不同的微生物组群体。54.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测参与选自表4中的清单的一个或多个途径的微生物基因。在某些实施方案中,参与表4中所列举的途径的基因的存在或相对于对照(非ibs)个体增加的丰度与ibs相关。在一个优选实施方案中,所述方法包括检测参与氨基酸生物合成/降解途径的基因。数据表明,这些途径在患有ibs的患者中显著较丰富。在一个优选实施方案中,所述方法包括检测参与淀粉降解v途径的基因。数据表明,这些基因在患有ibs的患者中显著较丰富。在另一个实施方案中,在患有ibs的患者中显著较丰富的基因与毛螺菌科及瘤胃球菌属相关。在某些实施方案中,本发明的方法包括检测参与表4中的至少2、5、10、15、20或30种途径的基因。在任何此类实施方案中,检测基因包含测量样品中的基因或携带所述基因的细菌的相对丰度,例如相对于来自对照(非ibs)个体的对应样品或相对于参考值。在某些实施方案中,通过检测样品中的代谢物来检测微生物基因的存在。在某些实施方案中,通过检测已知携带微生物基因的细菌分类群来检测微生物基因的存在。55.在其他实施方案中,参与途径(例如,如表4所示)的基因的丰度相对于对照(非ibs)个体不存在或降低与ibs相关。在一个优选实施方案中,检测参与半乳糖降解、硫酸盐还原、硫酸盐同化及半胱氨酸生物合成途径的基因。数据表明,这些途径在患有ibs的患者中显著较不丰富。在一个具体实施方案中,指示硫代谢的途径在患有ibs的患者中较不丰富。在任何此类实施方案中,检测基因包含测量样品中的基因或携带所述基因的细菌的相对丰度,例如相对于来自对照(非ibs)个体的对应样品或相对于参考值。56.在某些实施方案中,包括检测参与途径的基因是否存在或相对丰度的方法包括检测来自患者的样品中的核酸序列。另外或替代地,所述方法包括检测已知携带相关途径的基因的细菌种。57.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测相对于对照(非ibs)个体的预测ibs的一个或多个途径的差异性丰度。在一个具体实施方案中,相对于对照(非ibs)个体,ibs中的腺苷核糖核苷酸从头生物合成功能途径为差异丰富的。在一个优选实施方案中,相对于对照(非ibs)个体,ibs患者中的腺苷核糖核苷酸从头生物合成功能途径较丰富。58.作为ibs的预测因子的代谢组改变59.发明人已鉴别出与ibs相关的代谢物,且本发明提供用于诊断ibs的方法,其包括检测此类代谢物。包括检测本文中鉴别的代谢物的诊断方法可对于用于不同的患者群体来说特别有用,因为不同的患者群体可能具有不同的微生物组群体,但是就可检测的代谢物而言可能较一致。通常,在本发明的方法中检测与ibs相关的代谢物包含测量样品中代谢物的浓度或测量代谢物的浓度变化,以及视情况将浓度与来自对照(非ibs)个体的对应样品或相对于参考值进行比较。在一些实施方案中,在本发明的方法中检测与ibs相关的代谢物包含测量代谢物的前体的浓度,以及视情况将浓度与来自对照(非ibs)个体的对应样品或相对于参考值进行比较。在一些实施方案中,在本发明的方法中检测与ibs相关的代谢物包含测量代谢物的分解产物的浓度,以及视情况将浓度与来自对照(非ibs)个体的对应样品或相对于参考值进行比较。在某些实施方案中,所述方法包括检测已知产生预测ibs的代谢物的细菌分类群。60.作为ibs的预测因子的尿液代谢组改变61.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测尿液代谢物,尿液代谢物可包含以下中的一者或多者:a80987、ala-leu-trp-gly、苜蓿酸3-o-b-d-葡糖苷酸和/或(-)-表没食子儿茶素硫酸盐。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测选自表5中的清单的一种或多种尿液代谢物。在任何此类实施方案中,检测代谢物包含测量样品中的代谢物的浓度,例如相对于来自对照(非ibs)个体的对应样品或相对于参考值。在其他实施方案中,检测代谢物包含测量样品中的代谢物的浓度,且相对于各样品中的尿液肌酸酐水平对浓度进行归一化。在一些实施方案中,所述方法包括检测上述代谢物的前体或分解产物。在一个实施方案中,将机器学习应用于尿液代谢组数据以诊断ibs。62.在一个具体实施方案中,所述方法包括检测腺苷,诸如测量样品中的腺苷浓度。实例表明,相对于对照(非ibs)个体,ibs患者中腺苷较丰富。因此,腺苷水平相对于健康对照增加指示ibs。63.在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测一种或多种尿液代谢物,与健康对照(即来自一个或多个未患有ibs的个体)相比,所述一种或多种尿液代谢物在患有ibs的患者中为差异丰富的。在一个实施方案中,在患有ibs的患者中为差异丰富的一种或多种尿液代谢物为:n-十一酰基甘氨酸、γ-谷氨酰基-半胱氨酸、alloathyriol、trp-ala-pro、a80987、苜蓿酸3-o-b-d-葡糖苷酸、ala-leu-trp-gly、琥珀酸氢布酰胺、(-)-表儿茶素硫酸盐、1,4,5-三甲基-萘、五羟黄酮(tricetin)3′‑甲醚7,5′‑二葡糖苷酸、托拉塞米(torasemide)、(-)-表没食子儿茶素硫酸盐、十二烷二酰基肉碱、1,6,7-三甲基萘、四氢吡啶二羧酸酯(tetrahydrodipicolinate)、sumiki氏酸、硅酸、飞燕草素3-(6″‑o-4-苹果单酰基-葡萄糖苷基)-5-葡萄糖苷、l-精氨酸、亮氨酰基-蛋氨酸、phe-gly-gly-ser、gln-met-pro-ser、肌酸酐、ala-asn-cys-gly、2-羟基-2-(羟甲基)-2h-吡喃-3(6h)-酮、硫乙哌丙嗪、5-((2-碘乙酰胺基)乙基)-1-氨基萘硫酸盐、dctp、异亮氨酰基-脯氨酸、3,4-亚甲基癸二酸、二甲基烯丙基焦磷酸酯/异戊烯基焦磷酸酯、(4-羟基苯甲酰基)胆碱、二氮嗪、3,5-二-o-没食子酰基-1,4-半乳糖二酸内酯、2-羟基吡啶、癸酰基肉碱、asp-met-asp-pro、3-甲基二氧吲哚、(1s,3r,4s)-3,4-二羟基环己烷-1-甲酸酯、ala-lys-phe-cys、3-吲哚羟丙酸、[fa(18:0)]n-(9z-十八烯酰基)-牛磺酸、阿魏酸4-硫酸盐、尿素、n-羧乙酰基-d-苯基丙氨酸、4-甲氧基苯基乙醇硫酸盐、udp-4-脱氢-6-脱氧-d-葡萄糖、甲酸芳樟酯、去甲基橄榄苦苷、5′‑鸟苷基-亚甲基-三磷酸酯、壬酸烯丙酯、辛酸2-苯乙酯、β-纤维双糖、d-吡喃半乳糖基-(1->3)-d-吡喃半乳糖基-(1->3)-l-阿拉伯糖、cys-phe-phe-gln、马尿酸、cys-pro-pro-tyr、met-met-thr-trp、甲基膦酸酯、3′‑唾液酸乳糖胺、2,4,6-辛三酸、飞燕草素3-o-3″,6″‑o-二丙二酰葡萄糖苷、l-缬氨酸、met-met-cys、半胱氨酰基-半胱氨酸、(全部-e)-1,8,10-十七碳三烯-4,6-二炔-3,12-二醇、l-赖氨酸、三甲基乙酰基肉碱、lenticin、苯酚葡糖苷酸、酪氨酰基-半胱氨酸、紫萁内酯(osmundalin)、四氢醛固酮-3-葡糖苷酸、n-甲基吡啶、l-脯氨酰基-l-脯氨酸、戊二酰肉碱、[fa(15:4)]6,8,10,12-十五碳四烯醛、甲基双降生物素酮、乙偶姻、lysopc(18:2(9z,12z))、2-呋喃甲酸己酯、n-氨甲酰基-l-谷氨酸酯、l-高丝氨酸、l-天冬酰胺、甲基巴豆酰肉碱、胸腺嘧啶、3-羟基吡啶、二琥珀酸甲萘醌、9-癸酰肉碱、硫酸邻苯二酚、景天庚酮糖酐、(+)-γ-羟基-l-高精氨酸、甲硫哒嗪、cys-glu-glu-glu、异紫花前胡内酯芸香糖苷、l-丝氨酸、l-尿胆素原、异丁酰甘氨酸、s-腺苷基同型半胱氨酸、2,3-二辛酰基甘油酰胺、3-甲氧基-4-羟基苯乙二醇葡糖苷酸、磺乙基半胱氨酸、羟基苯乙酰甘氨酸、吡咯啉羟基甲酸、1-(α-甲基-4-(2-甲基丙基)苯乙酸酯)-β-d-吡喃葡萄糖醛酸、2-乙酸甲基丁酯、n1-甲基-4-吡啶酮-3-甲酰胺、皮固醇四醇-3-葡糖苷酸、asn-cys-gly、n6,n6,n6-三甲基-l-赖氨酸、苄胺、5-羟基-l-色氨酸、蜜环菌酸、亮氨酸/异亮氨酸、2-丁基苯并噻唑、d-景天庚酮糖7-磷酸盐、[fv二甲氧基,甲基(9:1)](2s)-5,7-二甲氧基-3′,4′‑亚甲二氧基黄酮、氧代己二酸、thr-cys-cys、肌酸、羟丁酸肉碱、5′‑脱氢腺苷、phe-thr-val、dudp、l-谷氨酰胺和/或山奈酚3-(2″,3″‑二乙酰-4″‑对香豆酰基鼠李糖苷)。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测一种或多种预测ibs的尿液代谢物。在一个实施方案中,预测ibs的尿液代谢物选自:n-十一酰基甘氨酸、γ-谷氨酰基-半胱氨酸、alloathyriol、trp-ala-pro、a80987、苜蓿酸3-o-b-d-葡糖苷酸、ala-leu-trp-gly、琥珀酸氢布酰胺、(-)-表儿茶素硫酸盐、1,4,5-三甲基-萘、五羟黄酮3′‑甲醚7,5′‑二葡糖苷酸、托拉塞米、(-)-表没食子儿茶素硫酸盐、十二烷二酰基肉碱、1,6,7-三甲基萘、四氢吡啶二羧酸酯、sumiki氏酸、硅酸、飞燕草素3-(6″‑o-4-苹果单酰基-葡萄糖苷基)-5-葡萄糖苷、l-精氨酸、亮氨酰基-蛋氨酸、phe-gly-gly-ser、gln-met-pro-ser、肌酸酐、ala-asn-cys-gly、2-羟基-2-(羟甲基)-2h-吡喃-3(6h)-酮、硫乙哌丙嗪、5-((2-碘乙酰胺基)乙基)-1-氨基萘硫酸盐、dctp、异亮氨酰基-脯氨酸、3,4-亚甲基癸二酸、二甲基烯丙基焦磷酸酯/异戊烯基焦磷酸酯、(4-羟基苯甲酰基)胆碱、二氮嗪、3,5-二-o-没食子酰基-1,4-半乳糖二酸内酯、2-羟基吡啶、癸酰基肉碱、asp-met-asp-pro、3-甲基二氧吲哚、(1s,3r,4s)-3,4-二羟基环己烷-1-甲酸酯、ala-lys-phe-cys、3-吲哚羟丙酸、[fa(18:0)]n-(9z-十八烯酰基)-牛磺酸、阿魏酸4-硫酸盐、尿素、n-羧乙酰基-d-苯基丙氨酸、4-甲氧基苯基乙醇硫酸盐、udp-4-脱氢-6-脱氧-d-葡萄糖、甲酸芳樟酯、去甲基橄榄苦苷、5′‑鸟苷基-亚甲基-三磷酸酯、壬酸烯丙酯、辛酸2-苯乙酯、β-纤维双糖、d-吡喃半乳糖基-(1->3)-d-吡喃半乳糖基-(1->3)-l-阿拉伯糖、cys-phe-phe-gln、马尿酸、cys-pro-pro-tyr、met-met-thr-trp、甲基膦酸酯、3′‑唾液酸乳糖胺、2,4,6-辛三酸、飞燕草素3-o-3″,6″‑o-二丙二酰葡萄糖苷、l-缬氨酸、met-met-cys、半胱氨酰基-半胱氨酸、(全部-e)-1,8,10-十七碳三烯-4,6-二炔-3,12-二醇、l-赖氨酸、三甲基乙酰基肉碱、lenticin、苯酚葡糖苷酸、酪氨酰基-半胱氨酸、紫萁内酯、四氢醛固酮-3-葡糖苷酸、n-甲基吡啶、l-脯氨酰基-l-脯氨酸、戊二酰肉碱、[fa(15:4)]6,8,10,12-十五碳四烯醛、甲基双降生物素酮、乙偶姻、lysopc(18:2(9z,12z))、2-呋喃甲酸己酯、n-氨甲酰基-l-谷氨酸酯、l-高丝氨酸、l-天冬酰胺、甲基巴豆酰肉碱、胸腺嘧啶、3-羟基吡啶、二琥珀酸甲萘醌、9-癸酰肉碱、硫酸邻苯二酚、景天庚酮糖酐、(+)-γ-羟基-l-高精氨酸、甲硫哒嗪、cys-glu-glu-glu、异紫花前胡内酯芸香糖苷、l-丝氨酸、l-尿胆素原、异丁酰甘氨酸、s-腺苷基同型半胱氨酸、2,3-二辛酰基甘油酰胺、3-甲氧基-4-羟基苯乙二醇葡糖苷酸、磺乙基半胱氨酸、羟基苯乙酰甘氨酸、吡咯啉羟基甲酸、1-(α-甲基-4-(2-甲基丙基)苯乙酸酯)-β-d-吡喃葡萄糖醛酸、2-乙酸甲基丁酯、n1-甲基-4-吡啶酮-3-甲酰胺、皮固醇四醇-3-葡糖苷酸、asn-cys-gly、n6,n6,n6-三甲基-l-赖氨酸、苄胺、5-羟基-l-色氨酸、蜜环菌酸、亮氨酸/异亮氨酸、2-丁基苯并噻唑、d-景天庚酮糖7-磷酸盐、[fv二甲氧基,甲基(9:1)](2s)-5,7-二甲氧基-3′,4′‑亚甲二氧基黄酮、氧代己二酸、thr-cys-cys、肌酸、羟丁酸肉碱、5′‑脱氢腺苷、phe-thr-val、dudp、l-谷氨酰胺和/或山奈酚3-(2″,3″‑二乙酰-4″‑对香豆酰基鼠李糖苷)。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测选自表6中的清单的一种或多种尿液代谢物的差异性丰度。在某些实施方案中,本发明的方法包括检测表6中的2、5、10、15或20种或所有代谢物。在任何此类实施方案中,检测代谢物包含测量样品中的代谢物的浓度,例如相对于来自对照(非ibs)个体的对应样品或相对于参考值的浓度。在一些实施方案中,检测代谢物包含测量样品中的代谢物的浓度,且相对于各样品中的尿液肌酸酐水平对浓度进行归一化。在一些实施方案中,所述方法包括检测上述代谢物的前体或分解产物。[0064]在某些实施方案中,患有ibs的患者中的尿液代谢物的丰度显著增加,例如如表6中所示。在一个实施方案中,所述方法包括检测参与脂肪酸氧化和/或脂肪酸代谢的代谢物,其在患有ibs的患者中显著较丰富。在一个优选实施方案中,检测了n-十一酰基甘氨酸,其在患有ibs的患者中显著较丰富。在另一个优选实施方案中,检测了癸酰基肉碱,其在患有ibs的患者中显著较丰富。[0065]在一个实施方案中,与健康对照相比,预测ibs的尿液代谢物在患有ibs的患者中较丰富。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测已发现预测患者患有ibs的一种或多种尿液代谢物。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测一种或多种尿液代谢物,与健康对照(即来自一个或多个未患有ibs的个体)相比,所述一种或多种尿液代谢物在患有ibs的患者中较丰富。在某些实施方案中,患有ibs的患者中的尿液代谢物的丰度增加,例如如表6和/或表21b所示。在一个实施方案中,在患有ibs的患者中较丰富的一种或多种尿液代谢物为:a80987、苜蓿酸3-o-b-d-葡糖苷酸、n-十一酰基甘氨酸、ala-leu-trp-gly、γ-谷氨酰基-半胱氨酸、琥珀酸氢布酰胺、(-)-表儿茶素硫酸盐、1,4,5-三甲基-萘、trp-ala-pro、十二烷二酰基肉碱、1,6,7-三甲基萘、sumiki氏酸、phe-gly-gly-ser、2-羟基-2-(羟甲基)-2h-吡喃-3(6h)-酮、5-((2-碘乙酰胺基)乙基)-1-氨基萘硫酸盐、硫乙哌丙嗪、dctp、二甲基烯丙基焦磷酸酯/异戊烯基焦磷酸酯、asp-met-asp-pro、3,5-二-o-没食子酰基-1,4-半乳糖二酸内酯、癸酰基肉碱、[fa(18:0)]n-(9z-十八烯酰基)-牛磺酸、udp-4-脱氢-6-脱氧-d-葡萄糖、飞燕草素3-o-3″,6″‑o-二丙二酰葡萄糖苷、紫萁内酯和/或半胱氨酰基-半胱氨酸。在一个优选实施方案中,检测了一种或多种选自以下的尿液代谢物:a80987、苜蓿酸3-o-b-d-葡糖苷酸、n-十一酰基甘氨酸、ala-leu-trp-gly和/或γ-谷氨酰-半胱氨酸,与健康对照相比,其在患有ibs的患者中较丰富。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测选自表6和/或表21b中的清单的一种或多种尿液代谢物的丰度的增加。在某些实施方案中,本发明的方法包括检测表6和/或表21b中的2、5、10、15或20种或所有代谢物。在任何此类实施方案中,检测代谢物包含测量样品中的代谢物的浓度,例如相对于来自对照(非ibs)个体的对应样品或相对于参考值的浓度。在一些实施方案中,检测代谢物包含测量样品中的代谢物的浓度,且相对于各样品中的尿液肌酸酐水平对浓度进行归一化。在一些实施方案中,所述方法包括检测上述代谢物的前体或分解产物。在一个优选实施方案中,检测了表儿茶素硫酸盐,其在患有ibs的患者中较丰富。在一个优选实施方案中,检测了苜蓿酸3-o-b-d-葡糖苷酸,其在患有ibs的患者中较丰富。[0066]在某些实施方案中,患有ibs的患者中的尿液代谢物的丰度显著降低,例如如表6所示。在一个实施方案中,所述方法包括检测参与一氧化氮的生物合成的代谢物,其在患有ibs的患者中显著较不丰富。在一个实施方案中,氨基酸在患有ibs的患者中显著较不丰富,例如l-精氨酸。[0067]在一个实施方案中,与健康对照相比,预测ibs的尿液代谢物在患有ibs的患者中较不丰富。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测已发现预测患者未患有ibs(即患者为健康对照)的一种或多种尿液代谢物。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测一种或多种尿液代谢物,与健康对照(即来自一个或多个未患有ibs的个体)相比,所述一种或多种尿液代谢物在患有ibs的患者中较不丰富。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测一种或多种尿液代谢物,与患有ibs的患者相比,所述一种或多种尿液代谢物在健康对照(即来自一个或多个未患有ibs的个体)中较丰富。在某些实施方案中,患有ibs的患者中的尿液代谢物的丰度降低,例如如表6和/或表21a所示。在一个实施方案中,在患有ibs的患者中较不丰富的一种或多种尿液代谢物为:五羟黄酮3′‑甲醚7,5′‑二葡糖苷酸、alloathyriol、托拉塞米、(-)-表没食子儿茶素硫酸盐、四氢吡啶二羧酸酯(tetrahydrodipicolinate)、硅酸、飞燕草素3-(6″‑o-4-苹果单酰基-葡萄糖苷基)-5-葡萄糖苷、肌酸酐、l-精氨酸、亮氨酰基-蛋氨酸、gln-met-pro-ser、ala-asn-cys-gly、异亮氨酰基-脯氨酸、3,4-亚甲基癸二酸、(4-羟基苯甲酰)胆碱、二氮嗪、(1s,3r,4s)-3,4-二羟基环己烷-1-甲酸酯、2-羟基吡啶、ala-lys-phe-cys、3-甲基二氧吲哚、n-羧乙酰基-d-苯基丙氨酸、尿素、阿魏酸4-硫酸盐、3-吲哚羟丙酸、去甲基橄榄苦苷、5′‑鸟苷基-亚甲基-三磷酸酯、甲酸芳樟酯、4-甲氧基苯基乙醇硫酸盐、壬酸烯丙酯、d-吡喃半乳糖基-(1->3)-d-吡喃半乳糖基-(1->3)-l-阿拉伯糖、met-met-thr-trp、cys-pro-pro-tyr、甲基膦酸酯、辛酸2-苯乙酯、马尿酸、戊二酰肉碱和/或cys-phe-phe-gln。在一个优选实施方案中,检测了一种或多种选自以下的尿液代谢物:五羟黄酮3′‑甲醚7,5′‑二葡糖苷酸、alloathyriol、托拉塞米、(-)-表没食子儿茶素硫酸盐和/或四氢吡啶二羧酸酯,与健康对照相比,其在患有ibs的患者中较不丰富。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测选自表6和/或表21a中的清单的一种或多种尿液代谢物的丰度的降低。在某些实施方案中,本发明的方法包括检测表6和/或表21a中的2、5、10、15或20种或所有代谢物。在任何此类实施方案中,检测代谢物包含测量样品中的代谢物的浓度,例如相对于来自对照(非ibs)个体的对应样品或相对于参考值的浓度。在一些实施方案中,检测代谢物包含测量样品中的代谢物的浓度,且相对于各样品中的尿液肌酸酐水平对浓度进行归一化。在一些实施方案中,所述方法包括检测上述代谢物的前体或分解产物。[0068]在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测一种或多种尿液代谢物,与健康对照(即来自一个或多个未患有ibs的个体)相比,所述一种或多种尿液代谢物在患有ibs的患者中为差异丰富的。在一个优选实施方案中,在患有ibs的患者中为差异丰富的一种或多种尿液代谢物为:硫酸盐、葡糖苷酸、肉碱、甘氨酸及谷氨酰胺结合物。在一个实施方案中,所述方法包括检测参与第2相代谢的代谢物,其在患有ibs的患者中上调。在任何此类实施方案中,检测代谢物包含测量样品中的代谢物的浓度,例如相对于来自对照(非ibs)个体的对应样品或相对于参考值的浓度。在其他实施方案中,检测代谢物包含测量样品中的代谢物的浓度,且相对于各样品中的尿液肌酸酐水平对浓度进行归一化。[0069]作为ibs的预测因子的粪便代谢物改变胡萝卜素/β,ψ-胡萝卜素、神经调节肽b(1-3)、庚-1-硫醇、堇菜黄质、异柠檬烯、ile-lys-cys-gly、his-met-val-val、辛酸烯丙酯、羟脯氨酰基-色氨酸、十二烷二酸、2-o-苯甲酰基-d-葡萄糖、2-乙基辛二酸、d-尿胆素、20-羟基-e4-神经前列腺素、pg(o-31:1)、anigorufone、乙酸壬酯、l-精氨酸、pg(p-32:1)、glu-ala-gln-ser、pg(31:0)、葫芦素i、arg-lys-phe-val、京尼平尼酸、己糖、lys-phe-phe-phe、pi(4l:2)、d-半乳醛、愈伤酸、腺嘌呤、pc(22:2(13z,16z)/15:0)、2-苯乙基β-d-吡喃葡萄糖苷、pg(37:2)、三丁酸甘油酯、arg-leu-pro-arg、2-o-对酰基-d-葡萄糖、3,4-二羟基苯基乳酸甲酯、pg(p-28:0)、pg(34:0)、l-赖氨酸、核糖醇、lysope(18:2(9z,12z)/0:0)、pa(20:4(5z,8z,11z,14z)e/2:0)、5-脱氢莽草酸酯、苏氨酰基-异亮氨酸、l-蛋氨酸、ps(26:0))、α-蒎烯、葑烯、glu-ile-ile-phe、gln-phe-phe-phe、熊去氧胆酸、pc(34:2)、3,17-雄烷二醇葡糖苷酸、吡哆胺、[st羟基](25r)-3α,7α-二羟基-5β-胆甾-27-酰基牛磺酸、pa(42:2)、[fa(16:0)]2-溴-十六醛、3,6-二氢-4-(4-甲基-3-戊烯基)-1,2-二噻烯、3-甲基巴豆酰基甘氨酸ξ-7-羟基十六烷二酸、莰烯、2-羟基-3-羧基-6-氧代-7-甲基辛-2,4-二烯酸酯、7c-糖苷配基、1-(3-氨丙基)-4-氨基丁醛、异丁酸苄酯、(s)-(e)-8-(3,6-二甲基-2-庚烯基)-4′,5,7-三羟基黄烷酮、1,3-二-(5z,8z,11z,14z,17z-二十碳五烯酰基)-2-羟基甘油(d5)、sm(d18:0/18:0)、l-高丝氨酸、17β-(乙酰硫基)雌-1,3,5(10)-三烯-3-醇乙酸酯、[st(2:0)]5β-胆酸-3,11-二烯-24-油酸、pg(33:2)、pe(22:4(7z,10z,13z,16z)/p-16:0)、原卟啉原ix、α-生育酚琥珀酸酯、(9z)-6′‑氧代-6,5′‑diapo-6-胡萝卜酸甲酯、pg(16:1(9z)/16:1(9z))、pc(o-22:1(13z)/20:4(8z,11z,14z,17z))、pg(31:2)、α-水芹烯、[ps(12:0/13:0)]1-十二酰基-2-十三酰基-sn-甘油-3-磷酸丝氨酸(铵盐)、glu-asp-asp、pg(33:1)、pa(o-20:0/22:6(4z,7z,10z,13z,16z,19z))、[fa氧代(19:0)]18-氧代-十九酸、pg(16:1(9z)/18:0)、leu-val、去甲基甲萘醌-6、pc(o-16:1(9z)/14:1(9z))、pg(p-32:0)、(24e)-3β,15α,22s-三乙酰氧基羊毛甾-7,9(11),24-三烯-26-油酸、pa(33:5)、lysopc(0:0/18:0)、ile-arg-ile、乙酸月桂酯、glu-glu-gly-tyr、3-(甲硫基)-1-丙醇、(-)-(e)-1-(4-羟基苯基)-7-苯基-6-庚-3-醇、丁酸二甲基苄基原酯和/或甲基2,3-二氢-3,5-二羟基-2-氧代-3-吲哚乙酸。在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测选自表8中的清单的一种或多种粪便代谢物的差异性丰度。在某些实施方案中,本发明的方法包括检测至少2、5、10、15或20种或所有这些代谢物。在一些实施方案中,所述方法包括检测上述代谢物的前体或分解产物。[0075]在某些实施方案中,患有ibs的患者中的代谢物的丰度显著增加,例如如表8中所示。在一个实施方案中,胆汁酸在患有ibs的患者中显著较丰富。在一个具体实施方案中,检测或测量了[st羟基](25r)-3α,7α-二羟基-5β-胆甾-27-酰基牛磺酸。其在患有ibs的患者中显著较丰富。在一个具体实施方案中,检测或测量了[st(2:0)]5β-胆-3,11-二烯-24-油酸。其在患有ibs的患者中显著较丰富。在一个具体实施方案中,检测或测量了udca,其在患有ibs的患者中显著较丰富。在另一个实施方案中,氨基酸在患有ibs的患者中显著较丰富,例如酪氨酸和/或赖氨酸。在具体实施方案中,本发明的方法包括检测或定量样品中酪氨酸或赖氨酸的水平且诊断ibs。在某些实施方案中,患有ibs的患者中的代谢物的丰度显著降低,例如如表8中所示。[0076]在一个实施方案中,本发明提供一种用于诊断ibs的方法,其包括检测一种或多种粪便代谢物,与健康对照(即来自一个或多个未患有ibs的个体)相比,所述一种或多种粪便代谢物在患有ibs的患者中为差异丰富的。在一个优选实施方案中,在患有ibs的患者中为差异丰富的一种或多种粪便代谢物为:硫酸盐、葡糖苷酸、肉碱、甘氨酸及谷氨酰胺结合物。在一个实施方案中,所述方法包括检测参与第2相代谢的代谢物,其在患有ibs的患者中上调。在任何此类实施方案中,检测代谢物包含测量样品中的代谢物的浓度,例如相对于来自对照(非ibs)个体的对应样品或相对于参考值的浓度。[0077]在一个实施方案中,本发明提供一种用于诊断ibs-d(与腹泻相关的ibs)的方法,其包括检测在患有ibs-d的患者中为差异丰富的一种或多种粪便代谢物。在一个实施方案中,胆汁酸在患有ibs-d的患者中为差异丰富的。在一个实施方案中,总胆汁酸、次级胆汁酸、硫酸化胆汁酸、udca和/或结合胆汁酸在患有ibs-d的患者中为差异丰富的。在一个具体实施方案中,总胆汁酸在患有ibs-d的患者中为差异丰富的。在一个具体实施方案中,次级胆汁酸在患有ibs-d的患者中为差异丰富的。在一个具体实施方案中,硫酸化胆汁酸在患有ibs-d的患者中为差异丰富的。在一个具体实施方案中,udca在患有ibs-d的患者中为差异丰富的。在一个具体实施方案中,结合胆汁酸在患有ibs-d的患者中为差异丰富的。在任何此类实施方案中,检测代谢物包含测量样品中代谢物的浓度,例如相对于来自对照(非ibs)个体的对应样品或相对于参考值的浓度。[0078]检测尿液代谢物的方法[0079]gc/lc-ms[0080]代谢物可通过所属领域中已知的任何合适方法来检测。在一个实施方案中,使用gc/lc-ms检测与健康对照(即来自一个或多个未患有ibs的个体)相比,在患有ibs的患者中为差异丰富的尿液代谢物。在一个具体实施方案中,gc/lc-ms优选用于检测预测ibs的尿液代谢物。对于尿液代谢组学,可参考各样品中的尿液肌酸酐水平对代谢物的值进行归一化。[0081]faims(高场不对称波形离子迁移率光谱术)[0082]在一个实施方案中,使用faims检测在患有ibs的患者中为差异丰富的尿液代谢物。在一个具体实施方案中,faims优选用于检测预测ibs的尿液代谢物。对于尿液代谢组学,可参考各样品中的尿液肌酸酐水平对代谢物的值进行归一化。[0083]离子迁移率光谱术(ims)为一种众所周知的技术,其用于基于在电场影响下的离子迁移率的差异来分析气相中的离子分离。场不对称离子迁移率光谱术(faims)为ims技术的一个具体实例,其使用在射频下的高压不对称波形与施加在两个电极之间的静态补偿电压相结合,以在大气压下分离离子。不同离子在不同补偿电压下穿过电场到达检测器。因此,通过改变补偿电压,faims分析仪可以检测样品中不同离子的存在。faims仪器得益于大小较小且无需泵送,从而实现作为独立仪器的可携性。参考文献(20)中更详细地描述了faims。[0084]faims输出由两种模式组成:正模式(用于带正电荷的离子)及负模式(用于带负电荷的离子)。各模式均由51个分散场(dispersionfield;df)组成,总共102个df,同时考虑了两种模式。按照线性扫描伏安法的原理,将各df施加到测试样品,即补偿电压从初始值变化至最终值,由512个等间隔电压隔开。测量在各等间隔电压下的离子电流值。各对补偿电压及测量离子电流可以称为数据点。在正模式及负模式的所有分散场中,有52224个数据点。[0085]faims的先前应用已使用所述方法研究胃肠道毒性、胆汁酸腹泻及结直肠癌。例如,pct申请wo2016/038377描述了一种用于诊断乳糜泄或胆汁酸腹泻的方法,其通过以下进行:使用faims分析测试个体的人体样品中的识别标志化合物的浓度,及将所述浓度与未患有所述疾病的个体中的识别标志化合物的参考浓度进行比较。测个体的人体样品中的识别标志化合物的浓度与参考相比而增加表明所述个体正患有所筛查的疾病、或有此体质、或提供个体的疾患的消极预后。[0086]在使用中,通过用空气(无样品)及水运行装置来操作faims分析仪,以清洁分析仪。然后引入尿液样品以获得信号。用水然后再用空气运行faims分析仪,之后运行下一测试样品。然后,使用交叉相关对所有分散场的信号进行对齐。[0087]在一些实施方案中,本发明的诊断ibs的方法为计算机实施方法。在一个优选实施方案中,计算机实施方法为用于分析尿液样品的faims概况以确定ibs是否存在和/或将尿液样品分类为ibs子集的方法。所述方法包括:[0088]-获得与尿液、空气及水的faims概况对应的信号;[0089]-通过执行以下中的一者或多者来对获得的信号进行预处理:将信号平滑化、从信号中修剪基线噪声及对齐感兴趣的区域中的信号;[0090]-从经预处理的信号中提取多个特征;及[0091]-使用经提取的特征应用经训练的分类器以确定ibs是否存在和/或将尿液样品分类为ibs子集。[0092]有利地,通过对接收的信号应用信号平滑化,保留原始信号强度,同时降低信号中的“噪声”。通过修剪信号,降低了噪声,改善了输出质量,且减少有交叉污染及残留信号导致的运行之间的技术假影。[0093]总体而言,与现有技术方法相比,所述方法保留了更多分析特征,从而在诊断应用的背景下改进了在群体之间区分及对群体中的亚组进行分层的能力。[0094]优选地,预处理获得的信号包含将信号平滑化、修剪信号中的基线噪声及对齐感兴趣的区域中信号的所有三个步骤。[0095]获得faims信号可以包含用faims系统分析生物样品以产生对应于生物样品的faims概况的信号。[0096]优选地,如anal.chem.,36(8),1964,savitzkya.,golaymje.“smoothinganddifferentiationofdatabysimplifiedleastsquaresprocedures”,第1627-1639页(21)中所描述,使用savitzky-golay滤波器进行信号平滑化。使用savitzky-golay滤波器为有利的,因为它使峰值信号值保持完整,从而可改进分类的准确度。信号平滑化可以同时应用于信号的正模式及负模式的分散场。[0097]可以使用经优化的基线截止来进行信号修剪。可以使用交叉相关来进行信号对齐。[0098]可以使用线性回归模型从信号中选择特征,例如lasso。journaloftheroyalstatisticalsociety,seriesb,58(1),1996,r.tibshirani,“regressionshrinkageandselectionviathelasso”,第267-288页(22)中更详细地描述了lasso。[0099]经训练的分类器优选为支持向量机。替代地,分类器可为随机森林。在一个优选实施方案中,分类器为随机森林。[0100]ibs患者中的饮食、微生物组及代谢组的综合分析[0101]在某些实施方案中,本发明提供一种诊断ibs的方法,其包括以下中的一者或多者:i)检测细菌种,例如如上所论述;ii)检测参与一种或多种途径的基因,例如如上所论述;iii)检测代谢物,例如如上所论述。在任何此类实施方案中,检测细菌、基因或代谢物包含测量样品中的所述标志物的丰度或浓度,例如相对于来自对照(非ibs)个体的对应样品或相对于参考值。[0102]在一个实施方案中,本发明提供一种诊断ibs的方法,其包括检测细菌种的耗乏。在一个实施方案中,耗乏的细菌种为以下中的一者或多者:副普雷沃菌属、拟杆菌属、肠道巴恩斯氏菌、挑剔真杆菌、酸奶瘤胃球菌、两形真杆菌、脱硫脱硫弧菌、粪球菌属及真杆菌属。在某些实施方案中,本发明的方法包括检测以下中的一者或多者:副普雷沃菌属、拟杆菌属、肠道巴恩斯氏菌、挑剔真杆菌、酸奶瘤胃球菌、两形真杆菌、脱硫脱硫弧菌、粪球菌属及真杆菌属。[0103]在一个实施方案中,本发明提供一种诊断ibs的方法,其包括检测饮食成分的差异性利用。在一个具体实施方案中,本发明提供一种诊断ibs的方法,其包括检测高蛋白饮食的差异性利用。[0104]在一个实施方案中,本发明提供一种诊断ibs的方法,其包括检测较高水平的肽及氨基酸。在另一个实施方案中,本发明提供一种诊断ibs的方法,其包括检测增加水平的l-丙氨酸、l-赖氨酸、l-蛋氨酸、l-苯丙氨酸和/或酪氨酸。[0105]在一个实施方案中,本发明提供一种诊断ibs的方法,其包括检测增加水平的胆汁酸。在一个具体实施方案中,本发明提供一种诊断ibs的方法,其包括检测增加水平的udca、巯石胆酰基甘氨酸及[st羟基](25r)-3α,7α-二羟基-5β-胆甾-27-酰基牛磺酸和/或尿胆素。[0106]在一个实施方案中,本发明提供一种诊断ibs的方法,其包括检测增加水平的代谢物。在另一个实施方案中,本发明提供一种诊断ibs的方法,其包括检测增加水平的尿囊素、顺式-4-癸烯二酸、癸酰基肉碱和/或十二烷二酰基肉碱。[0107]诊断方法[0108]本发明开发了用于诊断ibs的新的且改进的方法。[0109]在优选实施方案中,本发明的方法用于诊断居住在欧洲(诸如北欧,优选地爱尔兰)的患者或具有欧洲、北欧或爱尔兰饮食习惯的患者。实例说明,本发明的方法对此类患者尤其有效。[0110]在本发明任何方面的某些实施方案中,评估了细菌、基因或代谢物相对于对照(非ibs)个体的丰度。在优选实施方案中,评估了尿液代谢物相对于对照(非ibs)个体的丰度。可以使用所属领域中建立的任何技术来生成这些参考值。[0111]在本发明任何方面的某些实施方案中,与来自对照(非ibs)个体的对应样品的比较为与来自健康个体的对应样品的比较。[0112]优选地,诊断ibs的方法的灵敏性大于40%(例如大于45%、50%或52%,例如53%或58%)且特异性大于90%(例如大于93%或95%,例如96%)。[0113]在某些实施方案中,诊断方法为监测对ibs的治疗过程的方法。[0114]在某些实施方案中,检测(诸如粪便样品中)细菌的存在或丰度的步骤包含基于核酸的定量方法,例如16srrna基因扩增子测序。使用16srrna基因扩增子测序法定性及定量确定样品中的细菌的方法在文献中有所描述,且为熟习此项技术者已知的。其他技术可涉及pcr、rtpcr、qpcr、高通量测序、总体转录体测序或16srrna分析。[0115]在本发明的任何实施方案的替代方面中,本发明提供一种用于诊断发展ibs的风险的方法。[0116]在本发明的任何实施方案中,细菌菌株、种、代谢物或基因途径的经调节的丰度指示ibs。在优选实施方案中,测量样品中作为总微生物群一部分的细菌菌株、种或otu的丰度,以确定菌株、种或otu的相对丰度。在优选实施方案中,测量代谢物的浓度,具体而言尿液代谢物的浓度。在优选实施方案中,测量样品中作为总微生物群一部分的携带感兴趣的基因途径的细菌菌株的丰度,以确定菌株的相对丰度,或测量基因序列的浓度。然后,在此类优选实施方案中,将样品中细菌或otu的相对丰度或代谢物或基因序列的浓度与来自对照(非ibs)个体的相同样品中的相对丰度或浓度进行比较。样品中细菌或otu的相对丰度与参考相比的差异,例如减少或增加,为经调节的相对丰度。如本文中所解释的,也可以绝对方式,通过将样品丰度值与绝对参考值进行比较,来进行经调节的丰度的检测。因此,本发明提供一种确定个体中的ibs状态的方法,其包括以下步骤:测定来自个体的生物样品的一种或多种ibs相关细菌的相对丰度和/或代谢物或基因途径的经调节的浓度,其中细菌的经调节的相对丰度、或代谢物或基因途径的经调节的浓度指示ibs。类似地,本发明提供一种确定个体患ibs的风险是否增加的方法,其包括以下步骤:测定来自所述个体的生物样品的一种或多种ibs相关口腔细菌或ibs相关代谢物或基因途径的相对丰度,其中经调节的相对丰度或浓度指示风险增加。[0117]在本发明的任何实施方案中,检测细菌可以包括检测“经调节的相对丰度”。如本文所用,当应用于个体样品中的细菌或otu时术语“经调节的相对丰度”应理解为意谓样品中的细菌或otu的相对丰度与来自对照(非ibs)个体的相同样品中的相对丰度(以下称为“参考相对丰度”)相比的差异。在一个实施方案中,与参考相对丰度相比,细菌或otu表现出增加的相对丰度。在一个实施方案中,与参考相对丰度相比,细菌或otu表现出减少的相对丰度。也可以绝对方式,通过将样品丰度值与绝对参考值进行比较,来进行经调节的丰度的检测。在一个实施方案中,参考丰度值获自年龄和/或性别匹配的个体。在一个实施方案中,参考丰度值获自与样品相同的群体(即凯尔特种源、北非种源、中东种源)的个体。从口腔及粪便样品中分离细菌的方法为所属领域中常规的且下面将进一步描述,以及检测细菌丰度的方法。可以采用任何合适的方法来分离细菌的特定种或属,所述方法对所属领域技术人员而言为显而易见的。可以采用任何合适的检测细菌丰度的方法,包括琼脂平板定量测定、荧光样品定量、qpcr、16srrna基因扩增子测序以及基于染料的代谢物耗乏或代谢物产生测定。[0118]患者分层[0119]在某些实施方案中,本发明的方法用于根据患者所患ibs的类型对患者进行分层。具体而言,在某些实施方案中,本发明的方法用于将患有ibs的患者诊断为具有类正常的微生物群(即,与未患ibs的人的微生物群组成相似的微生物群组成)或改变的微生物群(即,与未患ibs的人的微生物群不相似的微生物群)(参见jefferyib,o′toolepw,ohmanl,claessonmj,deanej,quigleyem,simrenm.2012.“anirritablebowelsyndromesubtypedefinedbyspecies-specificalterationsinfecalmicrobiota.”gut61:997-1006(23))。与具有改变的微生物群的患者相比,具有类正常的微生物群的患有ibs的患者可以受益于不同的治疗,因此本发明的方法可以为患者带来更合适的治疗策略以及更好的结果。因此,在某些实施方案中,本发明的方法包括基于患者微生物群为患者制定和/或推荐治疗计划。具有类正常的微生物群的ibs患者可得益于已知缓解焦虑或抑郁的治疗。具有改变的微生物群的ibs患者可得益于能够引起微生物群的有益变化和/或解决生态失调的治疗,诸如活的生物治疗产品,具体而言包含产氢营养型布劳特氏菌(blautiahydrogenotrophica)的组合物(如wo2018109461中所述)。具有改变的微生物群的ibs患者也可得益于饮食调整,诸如fodmap(可发酵寡糖、双糖、单糖及多元醇)饮食。包含产氢营养型布劳特氏菌的组合物也有效治疗内脏超敏反应(如wo2017148596中所述),具有类正常的微生物群的患者可经历所述内脏超敏反应,因此此类组合物也可用于治疗此类患者。[0120]在某些实施方案中,本发明提供一种基于患者微生物组和/或代谢组将患有ibs的患者分层至亚组中的方法。在一个具体实施方案中,本发明的方法包括检测一种或多种属于至少一个选自由以下组成的群的属的细菌菌株:厌氧棒状菌属(anaerostipes)、厌氧棍状菌属(anaerotruncus)、厌氧细杆菌属(anaerofilum)、拟杆菌属、布劳特氏菌属、埃格特菌属、链球菌属、戈登氏杆菌属(gordonibacter)、霍尔德曼氏菌属(holdemania)、瘤胃球菌属、韦荣氏球菌属(veilonella)、艾克曼菌属(akkermansia)、另枝菌属、巴恩斯氏菌属、丁酸球菌属、丁酸单胞菌属(butyricimonas)、梭菌属、粪球菌属、栖粪杆菌属(faecalibacterium)、嗜血杆菌属、霍华德氏菌属(howardella)、甲烷短杆菌属(methanobrevibacter)、颤杆菌属、普雷沃菌属、假黄杆菌属、罗斯拜瑞氏菌属、斯莱克氏菌属(slackia)、孢杆菌属(sporobacter)及食物谷菌属(victivallis)。在一个具体实施方案中,本发明的方法包括检测可属于梭菌属聚类iv、xi或xviii的细菌种。在一个具体实施方案中,本发明的方法包括检测细菌菌株,其可包含以下一个或多个种:哈德厌氧棒状菌(anaerostipeshadrus)、卵形拟杆菌(bacteroidesovatus)、多形拟杆菌、天门冬形梭菌、鲍氏梭菌、哈氏梭菌、共生梭菌、伴生粪球菌(coprococcuscomes)、活泼瘤胃球菌、唾液链球菌(streptococcussalivarius)、扭链瘤胃球菌、塞内加尔另枝菌、挑剔真杆菌、惰性真杆菌(eubacteriumsiraeum)、普氏栖粪杆菌(faecalibacteriumprausnitzii)、人罗斯拜瑞氏菌(roseburiahominis)、副流感嗜血杆菌、伶俐瘤胃球菌(ruminococcuscallidus)、小韦荣氏球菌(veilonellaparvula)及粪球菌属art55/1。在一个具体实施方案中,本发明的方法包括检测以下一种或多种细菌菌株:毛螺菌科细菌3146faa、毛螺菌科细菌5163faa、毛螺菌科细菌7158faa及毛螺菌科细菌8157faa。在一个具体实施方案中,本发明的方法包括检测选自表17、18、19和/或20的细菌分类群。在某些实施方案中,本发明的方法包括检测与ibs亚组相关的代谢物。在某些实施方案中,检测粪便样品中的代谢物。在某些实施方案中,检测尿液样品中的代谢物。[0121]在某些实施方案中,本发明提供一种评估患有ibs的患者是否受益于能够引起微生物群的有益变化和/或解决生态失调的治疗诸如活的生物治疗产品的方法。在一个具体实施方案中,本发明的方法包括检测一种或多种属于至少一个选自由以下组成的群的属的细菌菌株:厌氧棒状菌属(anaerostipes)、厌氧棍状菌属(anaerotruncus)、厌氧细杆菌属(anaerofilum)、拟杆菌属、布劳特氏菌属、埃格特菌属、链球菌属、戈登氏杆菌属(gordonibacter)、霍尔德曼氏菌属(holdemania)、瘤胃球菌属、韦荣氏球菌属(veilonella)、艾克曼菌属(akkermansia)、另枝菌属、巴恩斯氏菌属、丁酸球菌属、丁酸单胞菌属(butyricimonas)、梭菌属、粪球菌属、栖粪杆菌属(faecalibacterium)、嗜血杆菌属、霍华德氏菌属、甲烷短杆菌属(methanobrevibacter)、颤杆菌属、普雷沃菌属、假黄杆菌属、罗斯拜瑞氏菌属、斯莱克氏菌属(slackia)、孢杆菌属及食物谷菌属(victivallis)。在一个具体实施方案中,本发明的方法包括检测可属于梭菌属聚类iv、xi或xviii的细菌种。在一个具体实施方案中,本发明的方法包括检测细菌菌株,其可包含以下一个或多个种:哈德厌氧棒状菌(anaerostipeshadrus)、卵形拟杆菌(bacteroidesovatus)、多形拟杆菌、天门冬形梭菌、鲍氏梭菌、哈氏梭菌、共生梭菌、伴生粪球菌(coprococcuscomes)、活泼瘤胃球菌、唾液链球菌(streptococcussalivarius)、扭链瘤胃球菌、塞内加尔另枝菌、挑剔真杆菌、惰性真杆菌(eubacteriumsiraeum)、普氏栖粪杆菌(faecalibacteriumprausnitzii)、人罗斯拜瑞氏菌(roseburiahominis)、副流感嗜血杆菌、伶俐瘤胃球菌(ruminococcuscallidus)、小韦荣氏球菌(veilonellaparvula)及粪球菌属art55/1。在一个具体实施方案中,本发明的方法包括检测以下一种或多种细菌菌株:毛螺菌科细菌3146faa、毛螺菌科细菌5163faa、毛螺菌科细菌7158faa及毛螺菌科细菌8157faa。在一个具体实施方案中,本发明的方法包括检测选自表17、18、19和/或20的细菌分类群。在某些实施方案中,本发明的方法包括检测与ibs亚组相关的代谢物。在某些实施方案中,检测粪便样品中的代谢物。在某些实施方案中,检测尿液样品中的代谢物。[0122]在某些实施方案中,本发明的方法包括鉴别特征在于相对于健康对照个体而改变的微生物组和/或代谢组的亚组。在某些实施方案中,本发明的方法包括鉴别特征在于与健康对照个体相似的微生物组和/或代谢组的亚组。在某些实施方案中,本发明的方法用于基于患者微生物组将患有ibs的患者分类至亚组。在某些实施方案中,本发明的方法用于确定患有ibs的患者是否受益于能够引起微生物群的有益变化和/或解决生态失调的治疗诸如活的生物治疗产品。在某些实施方案中,如果ibs患者经分类为属于特征在于相对于健康对照个体而改变的微生物组和/或代谢组的亚组,则可以认为所述患者受益于能够引起微生物群有益改变和/或解决生态失调的治疗诸如活的生物治疗产品。在某些实施方案中,如果ibs患者经分类为属于特征在于与健康对照个体相似的微生物组和/或代谢组的亚组,则可以认为所述患者不受益于能够引起微生物群改变和/或解决生态失调的治疗诸如活的生物治疗产品。[0123]试剂盒[0124]本发明还提供了包含用于进行本发明方法的试剂的试剂盒,诸如包含用于检测一种或多种(诸如两种或更多种)上文所述的细菌种、基因或代谢物的试剂的试剂盒。因此,提供了用于实践如上所提及的诊断ibs的标的方法的试剂盒。所述试剂盒可被配置来收集生物样品,例如尿液样品或粪便样品。在一个优选实施方案中,所述试剂盒被配置来收集尿液样品。所述个体可疑似患有ibs。所述个体可疑似患有ibs的风险增加。试剂盒可包含被配置来接收生物样品的可密封容器。试剂盒可包含多核苷酸引物。多核苷酸可被配置用于扩增至少一种ibs相关的细菌的引物16srrna多核苷酸序列以形成经扩增的16srrna多核苷酸序列。试剂盒可以包含用于检测经扩增的16srrna序列的检测试剂。试剂盒可以包含使用说明。[0125]实施例[0126]概述[0127]背景和目的:肠易激综合征(ibs)的诊断及分层是基于症状和其他疾病的排除。尚不清楚发病机制是否在中央和/或在末端器官开始。一些患者的微生物群发生了改变。因此,进行了微生物组及代谢组学定量分析以鉴别所述疾患的生物标志物。[0128]为了对患有ibs的患者进行基于证据的分层,进行了粪便样品的宏基因组学研究以及与对照相比,患有ibs的患者的尿液及粪便的代谢组学分析(根据romeiv标准)。微生物组及代谢组学识别标志在ibs中很明显,但它们独立于传统基于临床症状的ibs子集(ibs-d对ibs-c、ibs交替或混合)。[0129]方法:纳入80例患有ibs的患者(罗马iv)及65例非ibs对照。收集人体测量学、医学及饮食信息,且粪便及尿液样品用于微生物组及代谢组学分析。对粪便进行散弹枪及16srrna扩增子测序,且通过气相色谱法(gc)及液相色谱法(lc)质谱法(ms)分析尿液及粪便代谢物。[0130]结果:在ibs中饮食与微生物组之间的差异性联系以及代谢组的改变是显而易见的。患有ibs的患者的微生物群组成及预测的微生物组功能与对照显著不同,但这些与ibs症状亚型无关。ibs患者与对照之间的粪便代谢组学概况也显著不同,且对于疾患而言具有辨识性。尿液代谢组含有一系列预测性代谢物,但主要以饮食及用药相关的代谢物为主。[0131]结论:尽管有临床异质性,但是ibs可通过种、宏基因组学及粪便代谢组学识别标志来鉴别,所述识别标志与ibs的基于症状的亚型无关。这些发现可用于诊断ibs及开发ibs的精确疗法。[0132]实施例1-ibs患者及对照的微生物群定量分析[0133]材料和方法[0134]个体招募:在科克大学医院招募了80名年龄在16-70岁符合罗马iv标准的ibs患者。患者的临床亚型(15)如下:便秘型ibs(ibs-c)、混合型ibs(ibs-m)或腹泻型ibs(ibs-d)。招募了65名年龄范围相同且种族及地理区域相同的对照。表10列出了研究群体的描述性统计。[0135]排除标准包括:纳入研究前6周内使用抗生素;其他慢性疾病,包括胃肠道疾病;严重精神性疾病;除疝气修补术或阑尾切除术以外的腹部手术。如果没有最新结果,则对所有参与者进行注意标准血液分析,且对所有个体进行血清学检查以排除乳糜泄。除必须满足ibs的罗马iv标准之外,对照群体的纳入/排除标准与ibs群体相同。收集各参与者(ibs及对照)的胃肠道(gi)症状史、精神症状、饮食、病史及用药数据,且使用以下问卷:布里斯托大便得分(bss)、医院焦虑与忧郁量表(hads)(24)、食物频率问卷(ffq)(25)。在研究开始之前,这项研究获得了科克研究伦理委员会的伦理批准(协议编号:4dc001),且所有参与者均提供了参加的书面知情同意书。[0136]样品收集:自所有参与者收集粪便及尿液样品以进行微生物组及代谢组学定量分析。个体使用收集试剂盒在家里收集新排泄的粪便样品,且在收集了新鲜尿液样品的当天将样品带到诊所。在样品收集后数小时内,将样品保存在4℃下直至送到实验室在-80℃下保存。[0137]微生物组定量分析及宏基因组学-16s扩增子测序:使用brown等人(26)所述的方法从冷冻粪便样品(0.25g)中提取基因组dna且扩增。brown等人(26)所述的方法的修改包括由0.5g的0.1mm氧化锆珠及4x3.5mm的玻璃珠组成的珠磨管。经由珠磨3x60s循环使粪便样品均质化,且在各循环之间在冰上冷却。在0.8%琼脂糖凝胶上可视化基因组dna,且使用simplinano分光计(biochromtm,us)对基因组dna进行定量。pcrmastermix使用2xphusiontaq高保真mix(thermoscientific,ireland)及15ngdna。将所得pcr产物纯化、定量,然后合并等摩尔量各扩增子,然后送至商业供应商(gatcbiotechag,konstanz,germany)在miseq(2×250bp)化学平台上进行测序。测序由德国gatcbiotech在illuminamiseq仪器上使用2×250bp双末端测序运行来进行。[0138]微生物组定量分析及宏基因组学-16s扩增子测序:使用qiagendneasyblood&tissue试剂盒且按照制造商的说明,自144份冷冻粪便样品(ibs:n=80及对照:n=64)中的各0.25g中提取微生物dna。一名对照个体没有粪便样品可供使用。使用由illumina(sandiego,california,usa)开发的16s测序文库制备nextera协议进行16srrna基因扩增子制备及测序。使用pcr扩增15ng各dna粪便提取物,且靶向16srrna基因的v3=v4可变区的引物使用以下基因特异性引物:[0139]16s扩增子pcr前向引物(s-d-bact-0341-b-s-17)=5′(seqidno:40)[0140]tcgtcggcagcgtcagatgtgtataagagacagcctacgggnggcwgcag[0141]16s扩增子pcr反向引物(s-d-bact-0785-a-a-21)5′(seqidno:41)[0142]gtctcgtgggctcggagatgtgtataagagacaggactachvgggtatctaatcc[0143]扩增子大小为531bp。将产物纯化,且通过第二轮接头pcr连接正向及反向条形码。[0144]微生物组定量分析及宏基因组学-散弹枪测序:对于散弹枪测序,将各样品的1μg(浓度>5ng/μl)高分子量dna送至德国gatcbiotech,以用于使用2×250bp双端化学在illuminahiseq平台(hiseq2500)上测序。这返回了2,714,158,144个原始读长(2,612,201,598个经处理的读长(read)),其中45.6%经映射至每个样品平均222,945个基因家族,平均计数值为每个样品8,924,302±2,569,353。[0145]生物信息学分析(16s扩增子测序):返回了144位个体的miseq16s测序数据。由于从测序返回的读长数太少而无法进行分析,因此移除3个样品(2个ibs及1个对照)生成的数据,留下141个样品(对照:n=63,ibsn=78)。合并原始扩增子序列数据且使用快速方法学(27)修剪读长。使用usearch管线生成otu表(28)。使用uparse算法以在97%相似度下将序列分群为otu(29)。uchime嵌合体移除算法与chimeraslayer一起使用以移除嵌合序列(30)。使用核糖体数据库项目(rdp)分类学分类器为代表性otu序列分配分类(28),且生成了微生物群组成(丰度及多样性)信息。[0146]生物信息学分析(散弹枪宏基因组测序):对于散弹枪宏基因组学,由于数据未通过qc或无可用样品,未对6份对照样品进行测序(对照:n=59;ibsn=80)。测序后获得的原始读长对的数量从5,247,013到21,280,723变化(平均值=9,763,159±2,408,048)。根据人类微生物组计划(hmp)联盟的标准操作程序对读长进行处理(31)。使用humann2管线生成宏基因组组成及功能概况(32)。对于各样品,获得了多个概况,其包括:演化支特有的基因信息的微生物组成概况(使用metaphlan2)、基因家族丰度、根据生物分层的途径、总途径覆盖率及丰度。[0147]机器学习:使用两步方法,采用最小绝对紧缩与选择算子(lasso)特征选择,然后进行随机森林(rf)建模(33),将内部机器学习管线应用于各数据类型(16s、散弹枪、及尿液及粪便ms代谢组学)。使用r软件3.4.0版、使用针对lasso特征选择的程序包glmnet2.0-10版及r程序包随机森林4.6-12版实现模型(34)。[0148]各变量由来自78名ibs患者及64名对照的数据组成。首先,使用lasso算法进行特征选择,以通过有效选择相关特征来改善模型的准确度及可解释性。此过程通过参数λ调谐,针对各数据集使用网格搜索将参数优化。过滤训练数据以仅包括由lasso算法选择的特征,然后将rf用于建模,从而构建了1500棵树。lasso特征选择及rf建模均使用10倍交叉验证(cv)进行,重复10次(10倍,10次重复,r程序包插入符号6.0-76版),这生成了内部10倍预测,产生了预测样品的ibs或对照分类的最优模型。将此10倍交叉验证程序重复十次,且报告曲线下平均面积(auc)、灵敏性及特异性。[0149]结果[0150]ibs与对照之间的微生物组有差异,但ibs临床亚型中的微生物组没有差异[0151]通过16srrna扩增子测序的微生物群定量分析以及微生物群组成数据的主坐标分析(pcoa)证实,患有ibs的个体的微生物群与对照组不同(图1a),但有一定程度的重叠。[0152]机器学习用于鉴别预测ibs及对照的细菌分类群(图1b)。这些分类群属于瘤胃球菌科、毛螺菌科及拟杆菌属科/属。[0153]机器学习(基于散弹枪数据)鉴别了6个预测ibs的属,其包括毛螺菌科、颤杆菌属及粪球菌属,曲线下面积(auc)为0.835(灵敏性:0.815且特异性:0.704;表1)。[0154]在种水平下,鉴别了40种预测特征(auc为0.878;灵敏性:0.894,特异性:0.687,表2),其包括在ibs中显著更丰富的活泼瘤胃球菌及毛螺菌科种,而基于成对比较,肠道巴恩斯氏菌及灵巧粪球菌属于在ibs中显著较不丰富的分类群(表3)。这些变化与先前研究(10-12)一致,其中显著差异丰富的分类群属于瘤胃球菌科、毛螺菌科及拟杆菌门科/属。[0155]ibs的临床亚型在源自16s定量分析数据的微生物群β多样性的pcoa中未分开(图1c)。宏基因组散弹枪测序证实了将ibs个体与对照分开的16s定量分析(图2)。此外,在属及种水平下的微生物群组成(如使用散弹枪序列数据所分配)强调了ibs与对照之间的微生物群组成差异。(图1d)。注释的宏基因组数据集的成对比较鉴别了根据生物分层的232条散弹枪途径,与对照相比,ibs组中的所述散弹枪途径显著较丰富(表4)。这些特别地包括许多氨基酸生物合成/降解途径,其活性改变可能与ibs病理生理学有关(35)。[0156]患有ibs的个体的宏基因组中较不丰富的其他途径包括半乳糖降解、硫酸盐还原、硫酸盐同化及半胱氨酸生物合成,共同指示ibs中硫代谢降低。在ibs个体中,编码12条途径的基因更丰富,包括用于淀粉降解v的那些。在ibs组显著较丰富的总计232条功能途径中,113条与毛螺菌科或瘤胃球菌属相关。[0157]讨论[0158]鉴别了ibs的种水平微生物组识别标志,其包括一些广泛的分类学组群(拟杆菌属的丰度较低,毛螺菌科及瘤胃球菌科种的丰度升高),以及32种分类群的清单,其集中的丰度值可以区分ibs及对照。区分患有ibs的个体与对照的微生物群的能力优于基于监督分裂的早期研究(10),或无法区分对照与ibs微生物群的研究(12),但也报道在ibs个体及对照的对于焦虑、抑郁、大便频率及布里斯托大便形状的表型方面没有统计学差异。所述ibs组的相对温和的疾病症状(12)可能使得难以鉴别微生物组识别标志。支持这一点的是,在最近的ibs及ibd中的肠道微生物组的研究中,微生物组改变与医师诊断的ibs组显著相关,但在自我诊断的ibs亚组中较少且显著性较低(36)。[0159]实施例2-ibs患者及对照的尿液代谢组定量分析[0160]材料和方法[0161]如实施例1中所述进行个体招募及样品收集。[0162]尿液faims:使用自arasaradnam等人(37)的方法修改的方案进行faims分析,且在下文描述。所属领域中已知用于检测代谢物的任何其他合适的方法可以用于本发明的方法中。将冷冻的(-80℃)尿液样品在4℃下解冻隔夜,将5ml各尿液样品等分到20ml玻璃小瓶中,且放入附接至lonestarfaims仪器(owlstone,uk)的atlas取样器(owlstone,uk)中。将样品加热至40℃且依次运行3次。[0163]各样品运行的流速超过500ml/min洁净干燥空气的样品。[0164]再添加补充空气以产生2.5l/min的总流速。在51个步骤中从0到99%的分散场,在512个步骤中从′+6v到-6v补偿电压扫描faims,且检测正离子及负离子以产生各样品的非靶向挥发性有机物(voc)概况。使用savitzky-golay滤波器(窗口大小=9,度=3)将各样品在各df下的信号平滑化。基于针对正模式输出为0.007的优化截止值及针对负模式输出为-0.007的优化截止值对信号进行修剪,以获得感兴趣的区域且降低基线噪声。使用交叉相关将各df下的信号与经修剪的信号对齐,使用平均信号作为参考使它们具有可比性。由于faims信号的初始df及较高df没有提供信息,因此考虑了对应于正模式及负模式的第17个df至第42个df的信号。这些预处理步骤使用具有相关程序包(scipy1.1版及numpy1.15.2版)的python2.7.11版中开发的定制程序执行。为了进一步降低复杂度且保留信息充足的数据,对各特征向量执行峰度常态性检验,考虑原始p值>0.1的特征,且生成各种统计分析的最终概况。[0165]尿液代谢组数据的生物信息学分析(faims):使用faims分析的各尿液样品产生具有约52,224个数据点的概况。生成各样品的含有这些数据点的合并概况以进行预处理,以减少数据的噪声、大小及复杂性。[0166]尿液gc/lcms:将5ml冷冻尿液样品在干冰上送至德国波茨坦(potsdam,germany)的metabolomicdiscoveries(现在为metabolon)。使用液相色谱法(lc)及固相微萃取(spme)气相色谱法(gc)进行非靶向代谢组学分析,且使用电洒游离质谱(esi-ms)鉴别代谢物。还通过lc串联式质谱法进行了短链脂肪酸(scfa)分析。[0167]对于尿液代谢组学,参考各样品中的尿液肌酸酐水平对代谢物的值进行归一化。[0168]尿液代谢组数据的生物信息学分析(ms):返回所有ibs个体(n=80)及除2个对照以外的所有对照(n=63)的尿液ms代谢组学数据,因为这2个对照未通过qc或没有可用样品。从非靶向尿液代谢组学分析返回共计2,887种代谢物,其中594种经鉴别。仅考虑峰值通过尿液中的肌酸酐水平(mg/dl)经归一化的经鉴别的特征用于进一步分析。[0169]机器学习:使用两步方法,采用最小绝对紧缩与选择算子(lasso)特征选择,然后进行随机森林(rf)建模(38),将内部机器学习管线应用于各数据类型(在此实施例中,尿液ms代谢组学),如实施例1中所述。使用r软件3.4.0版、使用针对lasso特征选择的程序包glmnet2.0-10版及rf程序包随机森林4.6-12版实现模型(34)。使用带有线性核的支持向量机(svm),使用python2.7及scikit-learn(0.19.2版),测试了尿液faims代谢组学区分健康类别的能力(39)。使用峰度常态性检验选择faims概况的特征。这些特征经集中且缩放。将样品分为训练集及测试集,进行10倍交叉验证。类别权重经平衡。其他参数设置为默认。没有使用监督特征选择。[0170]结果[0171]ibs中的尿液代谢组改变[0172]将代谢组学分析延伸至所有个体,最初聚焦于尿液作为非侵入性测试样品。比较了两种方法:针对挥发性有机物的高场不对称波形离子迁移率光谱术(faims)分析以及gc-ms及lc-ms。[0173]faims技术不直接鉴别辨识性代谢物,而是通过离子化代谢物的特征性羽流(plume)来分开样品/个体。在无监督的分析中,faims易于鉴别出对照及ibs的尿液样品(图4a),但不能区分ibs临床亚型(图5)。[0174]尿液代谢组的gc/lc-ms分析还将ibs患者与对照分开(图4b),且其准确度大于faims(图6a及6b)。[0175]机器学习鉴别了预测ibs的四个尿液代谢组学特征(auc0.999;灵敏性:0.988,特异性:1.000),这些尿液代谢组学特征反映出饮食组分(表5)。对照及ibs尿液代谢组的成对比较鉴别了127种差异丰富的特征(表6)。ibs个体中89种尿液代谢物显著较不丰富,包括许多氨基酸诸如l-精氨酸,其为一氧化氮的生物合成前体,一氧化氮与粘膜防御以及ibs病理生理学相关(40)。ibs中另外38种代谢物以显著较高水平存在,包括酰基甘氨酸(n-十一酰基甘氨酸)及酰基肉碱(癸酰基肉碱)。这些组中代谢物的水平升高与脂肪酸氧化/代谢的改变及疾病相关(41,42,43)。[0176]讨论[0177]尿液代谢组学对ibs具有高度辨识性。机器学习模型显示,鉴别出的化合物主要与饮食或用药相关。[0178]实施例3-ibs患者及对照的粪便代谢组定量分析[0179]材料和方法[0180]如实施例1中所述进行个体招募及样品收集。[0181]粪便gc/lcms:将1g冷冻粪便样品在干冰上送至德国波茨坦的metabolomicdiscoveries(现在为metabolon)。对于lc-ms,在分析之前,将样品干燥且重悬浮至最终浓度为10mg/400μl。使用湿样品进行gc-ms及scfa分析。如先前针对尿液ms代谢组学所述,进行了非靶向代谢组学及scfa分析。[0182]粪便代谢组数据的生物信息学分析:返回所有ibs个体(n=80)及除2个对照以外的所有对照(n=63)的粪便ms代谢组学数据,因为这2个对照未通过qc或没有可用样品。由服务提供商进行的非靶向粪便代谢组学分析返回了2,933种代谢物,其中753种经鉴别。使用lc-ms鉴别的代谢物未经归一化,因为粪便样品在样品制备期间已以干重(10mg/400μl)归一化。使用gc-ms鉴别的代谢物以对应样品湿重归一化。仅考虑经鉴别的代谢物用于进一步分析。如先前针对尿液代谢组所述,进行了机器学习分析。使用wilcoxon秩和检验生成所有数据集的汇总统计,其中q值调整用于多重测试。[0183]机器学习:使用两步方法,采用最小绝对紧缩与选择算子(lasso)特征选择,然后进行随机森林(rf)建模(38),将内部机器学习管线应用于各数据类型(在此实施例中,粪便ms代谢组学),如实施例1中所述。使用r软件3.4.0版、使用针对lasso特征选择的程序包glmnet2.0-10版及rf程序包随机森林4.6-12版实现模型(39)。[0184]结果[0185]ibs中的粪便代谢组改变[0186]通过gc/lc-ms的粪便代谢组的分析将ibs患者与对照分开(图4c),但在临床ibs亚型之间未观察到差异(图7)。应用到所述数据集的机器学习鉴别出40种预测ibs的粪便代谢物(auc:0.862,灵敏性:0.821且特异性:0.647;表7),其包括氨基酸l-酪氨酸及l-精氨酸、胆汁酸udca、胆色素尿胆素以及脂肪酸氧化缺陷(44)指示剂十二烷二酸。[0187]基于40个预测性种(表2),应用于散弹枪种数据集的机器学习与粪便代谢组学模型(auc0.878,灵敏性0.894及特异性0.687)相比产生略好的ibs预测模型。在32个预测性种中的11个中,腺苷核糖核苷酸从头生物合成功能途径显著更丰富,这与腺苷为ibs排名第四的预测性代谢物产生共鸣。[0188]代谢物的成对比较分析鉴别了128个显著差异丰富的特征,包括77个在ibs中显著耗乏的特征(表8)。51种粪便代谢物显著更丰富,包括酪氨酸及赖氨酸以及三种胆汁酸(ba):[st羟基](25r)-3α,7α-二羟基-5β-胆甾-27-酰基牛磺酸、[st(2:0)]5β-胆酸-3,11-二烯-24-油酸以及udca,udca为ibs的预测性代谢物之一。ba影响肠中的吸水率,且可导致腹泻(45)。[0189]分析了亚组中胆汁酸代谢物的水平,且与对照个体相比,在ibs-d亚型中观察到大多数胆汁酸类别(总ba、次级ba、硫酸化ba、udca及共轭ba)的显著差异,如表9a中所示。这些差异与功能电位的改变相关,这由与次级ba、udca及总ba水平相关的熊去氧胆酸生物合成和甘胆酸盐代谢途径基因丰度反映(表9b)。在各组中,初级ba及牛磺酸:甘氨酸结合ba没有显著差异。针对次级ba、硫酸化ba及udca以及牛磺酸:甘氨酸结合ba,dior及其同事(46)报道了类似结果(在较小的ibs/对照中)。[0190]因此,ibs患者及对照中粪便微生物组组成及预测功能的差异通过两种样品类型中经测量的代谢组的差异来反映。[0191]讨论[0192]在此显示,患有ibs的患者的微生物组与对照的微生物组不同,且这在粪便代谢组概况中得到反映。但是,宏基因组及代谢组组态不区分所谓ibs的临床亚型(ibs-c、ibs-d、ibs-m)。[0193]粪便代谢组与微生物群的分类学及功能数据相关性很好。[0194]实施例4-用替代性机器学习管线的ibs患者及对照的粪便代谢组定量分析[0195]材料和方法[0196]如实施例1中所述进行个体招募及样品收集。[0197]粪便gc/lcms:将1g冷冻粪便样品在干冰上送至德国波茨坦的metabolomicdiscoveries(现在为metabolon)。对于lc-ms,在分析之前,将样品干燥且重悬浮至最终浓度为10mg/400μl。使用湿样品进行gc-ms及scfa分析。如先前针对尿液ms代谢组学所述,进行了非靶向代谢组学及scfa分析。[0198]粪便代谢组数据的生物信息学分析:返回所有ibs个体(n=80)及除2个对照以外的所有对照(n=63)的粪便ms代谢组学数据,因为这2个对照未通过qc或没有可用样品。由服务提供商进行的非靶向粪便代谢组学分析返回了2,933种代谢物,其中753种经鉴别。使用lc-ms鉴别的代谢物未经归一化,因为粪便样品在样品制备期间已以干重(10mg/400μl)归一化。使用gc-ms鉴别的代谢物以对应样品湿重归一化。仅考虑经鉴别的代谢物用于进一步分析。如先前针对尿液代谢组所述,进行了机器学习分析。使用wilcoxon秩和检验生成所有数据集的汇总统计,其中q值调整用于多重测试。[0199]机器学习:将内部机器学习管线应用于粪便代谢组学数据。本实施例中使用的机器学习管线与实施例1至3中使用的机器学习管线相似,但包含额外优化及验证步骤,在十倍交叉验证中使用两步法。在各验证倍数中,进行最小绝对紧缩与选择算子(lasso)特征选择,然后进行随机森林(rf)建模,且针对在交叉验证训练子集之外的交叉验证测试数据验证经优化的模型。[0200]将经分类的粪便代谢组样品概况进行log10转换,之后在机器学习管线中进行分析。然后使用经转换的概况将样品分类为ibs(80个样品)或对照(63个样品)。然后在机器学习管线中分析经分类的样品。[0201]图9示出了本实施例中使用的机器学习管线。首先将经分类的粪便代谢组样品概况分为训练集及测试集。然后将训练集用于生成最优λ范围,以供lasso算法使用。使用先前所述的交叉验证lasso且使用glmnet程序包(2.0-18版)生成最优λ范围。最优λ范围的预先确定减少了运行管线的计算时间,且无需使用者手动指定范围。[0202]确定λ范围后,基于其类别机率为样品分配权重。在此步骤中分配给训练样品的权重用于所有后续适用步骤中。[0203]然后将实质上如实施例1至3中所述的lasso算法应用于加权训练样品。在本实施例中,lasso算法使用了先前计算的最优λ范围,且使用了caret(在本实施例中为6.0-84版)及glmnet(在本实施例中为2.0-18版)程序包,使用10倍内部交叉验证,重复10次来计算rocauc(接受者操作特征,曲线下面积)度量。提取通过经优化的lasso算法所鉴别的特征系数,且选择具有非零系数的特征进行进一步分析。在图9中,n表示lasso算法返回的特征数。若lasso选择的特征数少于5,则所有特征(lasso之前)都将用于生成随机森林,即随机森林生成器忽略lasso过滤。若lasso选择的特征数大于或等于5,则仅lasso选择的特征用于生成随机森林(下游分类器生成);否则,考虑所有特征用于分类器生成步骤。[0204]使用lasso进行特征选择后,使用如n所确定的选定特征或所有特征生成经优化的随机森林分类器(具有1500棵树)。此经优化的随机森林分类器可用于预测外部测试倍数。通过调谐“mtry”参数以最大化rocauc度量,使用caret(6.0-84版)及内部交叉验证进行随机森林生成。针对调谐,若所选特征的数量大于或等于5,则mtry范围为1至所选特征数的平方根,否则范围为1至6。然后将经优化的随机森林分类器应用于测试集,且经由auc、灵敏性及特异性度量来计算分类器的性能。[0205]lasso特征选择及rf建模均在10倍交叉验证(cv)内进行,其生成了内部10倍预测模型,从而预测样品的ibs或对照分类。将此10倍交叉验证程序重复十次,且报告平均auc、灵敏性及特异性。然后,将经优化的模型用于预测交叉验证测试子集,且由十倍交叉验证(auc、灵敏性及特异性)计算最终分类器性能度量。[0206]结果[0207]粪便代谢组预测ibs[0208]研究了经优化的随机森林分类器将样品分类为ibs或对照的预测能力。外部验证为10倍交叉验证。内部验证为10倍交叉验证,重复10次。[0209]性能汇总及特征细节如表13所示。由lasso选择的系数小于零的特征与ibs相关,而正系数与对照相关。总体而言,对于十倍,rocauc平均值为0.686(±0.132)。灵敏性及特异性分别为0.737(±0.181)及0.476(±0.122)。观察到准确度为0.622±0.095。[0210]还使用proc程序包(1.15.0版本)及youdenj评分对分类临限进行优化,以达成最大灵敏性及特异性。获得的灵敏性及特异性的经优化的值分别为0.55及0.794。还对临限进行优化,以使特异性>=0.9。在等于0.689的临限下,灵敏性及特异性的因此获得的经优化的值分别为0.288及0.905。[0211]分析鉴别了158种预测ibs的代谢物,这些代谢物列于表13。re特征重要性最高的代谢物包括l-苯丙氨酸、腺苷及mg(20:3(8z,11z,14z)/0:0/0:0)。与健康对照小鼠相比,在ibs小鼠的粪便提取物中发现参与苯丙氨酸的关键代谢途径的苯乙胺的水平增加(47),表明粪便苯丙氨酸水平与ibs之间存在联系,这与本发明研究结果一致。预测ibs的其他代谢物包括氨基酸l-丙氨酸、l-精氨酸、酪氨酸及肌苷,肌苷先前被报道为ibs的生物标志物(连同腺苷)。经鉴别的代谢物还包括十二烷二酸,如实施例3中所论述,其为脂肪酸氧化缺陷的指示剂(32)。[0212]讨论[0213]在此显示,患有ibs的患者的粪便代谢组概况与对照不同。所述观察与使用不同的机器学习管线获得的结果-致,如实施例3中所述。[0214]实施例5-用替代性机器学习管线的基因家族的共丰度分析[0215]材料和方法[0216]如实施例1中所述进行个体招募及样品收集。[0217]共丰度分群:使用基因家族丰度鉴别了代表宏基因组定义的种变数的共丰富基因(cag)聚类。实施例1中详细描述了基因家族丰度的生产,但是为了完整性,下面也进行了详细描述。[0218]微生物组定量分析及宏基因组学:使用brown等人(26)所述的方法从冷冻粪便样品(0.25g)中提取基因组dna且扩增。[0219]微生物组定量分析及宏基因组学-散弹枪测序:基因组dna提取如上所述。对于散弹枪测序,将各样品的1μg(浓度>5ng/μl)高分子量dna送至德国gatcbiotech,以用于使用2×250bp双端化学在illuminahiseq平台(hiseq2500)上测序。这返回了2,714,158,144个原始读长(2,612,201,598个经处理的读长(read)),其中45.6%经映射至每个样品平均222,945个基因家族,平均计数值为每个样品8,924,302±2,569,353。[0220]生物信息学分析(16s扩增子测序):返回了144位个体的miseq16s测序数据。由于从测序返回的读长数太少而无法进行分析,因此移除3个样品(2个ibs及1个对照)生成的数据,留下141个样品(对照:n=63,ibsn=78)。合并原始扩增子序列数据且使用快速方法学(27)修剪读长。使用usearch管线生成otu表(28)。使用uparse算法以在97%相似度下将序列分群为otu(29)。uchime嵌合体移除算法与chimeraslayer一起使用以移除嵌合序列(30)。使用核糖体数据库项目(rdp)分类学分类器为代表性otu序列分配分类(28),且生成了微生物群组成(丰度及多样性)信息。[0221]生物信息学分析(散弹枪宏基因组测序):对于散弹枪宏基因组学,由于数据未通过qc或无可用样品,未对6份对照样品进行测序(对照:n=59;ibsn=80)。测序后获得的原始读长对的数量从5,247,013到21,280,723变化(平均值=9,763,159±2,408,048)。根据人类微生物组计划(hmp)联盟的标准操作程序对读长进行处理(31)。使用humann2管线生成宏基因组组成及功能概况(32)。对于各样品,获得了多个概况,其包括:演化支特有的基因信息的微生物组成概况(使用metaphlan2)、基因家族丰度、途径覆盖率及丰度。[0222]在使用humann2管线自基因家族丰度鉴别出代表宏基因组定义的种变数的共丰富基因聚类之后,使用经改进的冠层聚类算法对基因家族进行了共丰富分析(nielsenetal.,2014)(48)。使用通过使用humann2方法的种分层的1,706,571个基因家族(uniref90数据库)的相对丰度,对139个样品(ibs(80个样品)或对照(59个样品))以默认参数运行冠层聚类算法(franzosaetal.,2018)(32)。[0223]过滤所得基因家族聚类以保留至少90%的聚类信号来自多于三种样品且含有多于两个基因家族的聚类。如nielsen等人,2014(48)所建议,此举为了移除由异常值引起或值太少的聚类。过滤后剩余的聚类称为共丰富群或cag。[0224]cag的主度指数:通过奇异值分解(svd),如在主成分分析(pca)中使用带有默认参数的dudi.pca命令(r中的ade4程序包,r版本3.5.1)所实施来生成cag的丰度指数。提取第一个主成分作为索引,且使用cag内所有值的spearman相关性将索引与cag基因丰度中位数进行比较,从而用索引校正方向性。返回负相关性的cag通过反转所述cag的主成分值进行校正。然后通过自各cag值中减去cag的最小值来缩放主成分值。[0225]分配cag分类:由于各cag由多个基因家族组成,因此通过报告cag中与基因家族相关的最常见的属及种连同其组成的cag的百分比,分配cag分类。对于属或种代表了大于60%的基因家族的cag,分配了分类。[0226]cag结果:在每个cag过滤至少3个基因家族之后,散弹枪数据集中的菌株水平信息(以cag表示)由总共955个cag组成。cag具有平均41.09个基因家族,且最多3,174个基因家族。样品间cag的分布稀疏,每个样品的cag平均数量为31.86(占所有955个cag的3.34%),且在任何样品中观测到的cag的最大数量为80(占cag的8.38%)。所获得的cag聚类概况用于基于肯德尔相关计算样品间相关距离。基于此β多样性度量的主坐标分析显示,ibs与对照之间有显著分裂(图2,pmanovap值<0.001,vegan文库),如图10所示。在ibs亚型之间未观察到显著分裂(pmanovap值=0.919)。[0227]机器学习:在初步多变数分析之后,将实施例4中所述的内部机器学习管线应用于cag概况。[0228]结果[0229]cag聚类概况预测ibs(ibs相对于对照)[0230]在增加生物信号同时降低宏基因组学数据复杂性的信息充足的方法为将读长组装成共丰富基因群或cag,代表菌株水平变数,且通常被称为宏基因组种。研究了使用cag聚类概况作为输入数据生成的经优化的随机森林分类器将样品分类为ibs或对照的预测能力。外部验证为10倍cv,而优化的内部验证为10倍cv重复10次。[0231]对这些菌株水平变数的分析显著地区分ibs与对照,如图17所示。[0232]表14中描述了性能汇总及特征细节。由lasso选择的系数小于零的特征与ibs相关而正系数与对照相关。[0233]将机器学习应用于宏基因组种(cag)数据集产生了基于136个预测性特征的ibs预测模型(表14)。总体而言,对于十倍,rocauc平均值为0.814(±0.134)。灵敏性及特异性分别为0.875(±0.102)及0.497(±0217)。观察到准确度为0.713±0.134。[0234]使用proc程序包及youdenj评分对分类临限进行优化,以达成最大灵敏性及特异性。获得的灵敏性及特异性的经优化的值分别为0.75及0.797。还对临限进行优化,以使特异性等于或大于(>=)0.9。在等于0.791的临限下,灵敏性及特异性的因此获得的经优化的值分别为0.3875及0.915。[0235]因此,分析鉴别了136个预测ibs的cag(表14)。cag的分类分配为稀疏的,大多数特征尚未分类,但是经分配的特征与物种水平分析广泛一致。经分配分类的cag包括与埃希氏杆菌属、梭菌属及链球菌属等相关cag。在种水平下,预测性cag包括与大肠杆菌、咽峡炎链球菌、约氏副拟杆菌、格氏链球菌、鲍氏梭菌、血苏黎士存菌及xylaniphila副普雷沃菌等相关cag。还鉴别了多个与个体菌株相关的cag,包括梭菌目细菌1_7_47faa、真杆菌属3_1_31、毛螺菌科细菌5_1_57faa及梭菌科细菌jc118。[0236]讨论[0237]在此显示,患有ibs的患者的微生物组与对照的微生物组不同,且机器学习可应用于基因的共丰度分群以可靠地检测ibs。[0238]鉴别了包含136个宏基因组种的ibs的菌株水平微生物组识别标志。通过无监督分析,ibs与对照的微生物群之间的间隔超过了先前报道(10,12)的间隔。16s扩增子数据集的局限性以及相对温和疾病症状可能导致无法在一份报告中鉴别微生物组识别标志(12)。此外,微生物组改变与医师诊断的ibs显著相关,但与自我报告的罗马准则ibs则不那么相关(36)。[0239]实施例6-使用非监督学习的ibs亚型的分层[0240]背景[0241]当前基于占优症状将患者分层为临床亚型的方法具有显著局限性。本实施例使用微生物组定量分析将ibs患者分层为亚组。[0242]材料和方法[0243]个体招募:总计142个样品用于分析。透过科克大学医院的肠胃科诊所,在医院、gp时间及购物中心的广告,以及向大学职员发送电子邮件来招募患者。选择80名符合罗马iii/iv标准且符合纳入/排除标准的ibs患者及65名健康对照。由于样品特定数据集的可用性不同,因此不是每次分析均使用所有样品(表15)。例如,来自3个样品的测序数据质量太差,以致于不能与其余142个样品的数据一起包括,因此将其从分析中移除。[0244]微生物组定量分析:如实施例1中所述,使用16srrna扩增子测序对样品进行测序。所得表显示了所有142个样品中各分类群的丰度量度。若otu存在于30%或更少的样品中,则将它们从表中过滤掉。[0245]机器学习:使用无监督学习对样品进行分组。微生物组otu表的热图与使用ward2系统树图及canberra距离测量应用的分层分群一起生成。[0246]结果[0247]样品的描述性分析[0248]在分析的142个样品中,64个样品为健康对照,其余78个样品为ibs。在这78个中,一组29个经诊断为ibs-c亚型,一组20个经诊断为ibs-d亚型,且一组29个经诊断为ibs-m亚型。[0249]亚型的鉴别[0250]分层分群鉴别了4个聚类(图11)。四个聚类显示ibs与健康对照的不均分布。健康与ibs之间以及ibs内部的此种改变的β多样性为鉴别三个ibs亚组(ibs-1、ibs-2、ibs-3)提供了基础。ibs-1及ibs-2亚组分别与聚类1及2相关,而与健康对照(聚类3及4)共通分群的ibs样品经分组为ibs-3亚组。在实施例7-9中,所有健康对照样品被视为单独组。[0251]讨论[0252]在此显示,应用于微生物组数据的分层分群可用于定义ibs群体内表型不同的亚组。[0253]实施例7-ibs亚组的微生物谱定量分极及差异丰度分析(属水平)[0254]材料和方法[0255]受试者:研究与实施例6中相同的个体。表15中显示了本实施例中分析的样品数量。[0256]α多样性分析:使用与实施例6中相同的otu数据。观察到的种(丰富度)为定义为样品中独特otu的数量的多样性的量度。使用anova进行统计分析。[0257]β多样性的分析:使用canberra距离的主成分分析来分析三个ibs亚组中16s数据多样性的差异。使用成对置换manova(adonis函数,r中的vegan文库)进行统计分析。进行以下六组成对比较:[0258]1.ibs-1亚组相对于健康(显著)。[0259]2.ibs-1亚组相对于ibs-2亚组(显著)。[0260]3.ibs-1亚组相对于ibs-3亚组(显著)。[0261]4.ibs-2亚组相对于ibs-3亚组(显著)。[0262]5.ibs-2亚组相对于健康(显著)。[0263]6.ibs-3亚组相对于健康(不显著)。[0264]差异丰度分析:使用deseq2管线进行统计分析(r文库:deseq2)。对于上述六组成对比较,鉴别了在属水平下的差异丰富分类群。[0265]结果[0266]亚组中的α多样性的差异[0267]将实施例1的亚组分层应用于otu表,且使用各组内观察到的种度量分析α多样性显示所有4个组之间有显著差异,如图12所示。[0268]16s数据的β多样性的主坐标分析[0269]使用canberra距离的主坐标分析在属水平下对三个ibs亚组进行的β多样性分析,其结果如图13所示,再次显示了在分群分析中观察到的各组的明显分开(实施例1)。所有组的成对置换manova测试表明,在6组成对比较中,5组显著不同,ibs-3亚组相对于健康组不显著,表明健康组与ibs-3亚组之间没有明显分裂。[0270]结果表明,ibs-3亚组可以声称具有类正常微生物群组成,如通过与健康对照没有分开所证明。[0271]表16汇总了实施例7-9的主坐标分析结果。[0272]差异丰度分析-属水平[0273]表17显示了本研究中鉴别的差异丰富的属。对于ibs-1亚组与健康组的比较,总共有23个显著分类群,其中6个丰度增加(经调整的p值<0.05)。在ibs-2亚组相对于健康组的情况下,有13个显著分类群,其中6个丰度增加(经调整的p值<0.05),且与健康组相比,ibs-3亚组鉴别出仅1个显著分类群(经调整的p值<0.05),其丰度增加(表17)。值得注意的是,观察到在两个改变的ibs组(ibs-1及ibs-2亚组)中,布劳特氏菌属及埃格特菌属均增加。两个改变的ibs组中的丁酸球菌属、粪球菌属及普雷沃菌属减少。范永氏球菌属(veillonella)为类正常ibs组(ibs-3亚组)中唯一增加的属。[0274]还将ibs-1及ibs-2亚组与类正常ibs-3亚组进行了比较。结果显示于表18中。如所预期的,ibs-1及ibs-2亚组与ibs-3亚组相比的属水平变化与ibs-1及ibs-2亚组与健康对照相比的属水平变化相似(表17)。与健康组相比相似,布劳特氏菌属及埃格特菌属的丰度均增加,而普雷沃菌属的丰度下降。与类正常ibs组(ibs-3)相比,两个改变的ibs组中黄杆菌属的丰度也增加,而与健康组相比则不为这种情况。[0275]讨论[0276]在此显示,实施例6中鉴别的ibs亚组具有不同的微生物组概况。鉴别出多个差异丰富属,其在特定的亚组中增加或减少。这可对于未来的分层为信息充足的。[0277]实施例8-ibs亚组的宏基因组定量分析及差异丰度分析((种水平)[0278]材料和方法[0279]受试者:研究与实施例6及实施例7中相同的个体。表15中显示了本实施例中分析的样品数量。[0280]宏基因组定量分析:如实施例1中所述,使用散弹枪测序对样品进行测序。使用fastqc及multiqc进行读长的质量评估。使用humann2管线(其包括metaphlan2)以确定在种水平下分类群的丰度量度。简而言的,将显示各分类法的相对丰度的humann2管线的输出文件合并到所有样品中各分类法的相对丰度值的单个表中。可以通过将各相对丰度值乘以含有各相对丰度值的样品中读长的总数,并取结果值的整数部分来推断与各相对丰度值关联的计数数量。然后,最终输出为所有142个样品中种水平分类群的计数表。同样,若分类群存在于30%或更少的样品中,则将它们从表中移除。[0281]β多样性的分析:如实施例6中所述进行主坐标分析。[0282]差异丰度分析:如实施例7中所述进行统计分析。对于相同的六组成对比较,鉴别了在种水平下的差异丰富代谢物。[0283]结果[0284]宏基因组数据的β多样性的主坐标分析[0285]如图14中所示,保留来自实施例6的分群用于宏基因组数据集。在与微生物组分析(实施例7)相同的成对比较中进行的置换manova测试显示,分层样品的宏基因组β多样性与微生物组β多样性在显著性差异方面相同(表16)。[0286]差异丰度分析-种水平[0287]与实施例7一样,使用交叉矩阵来描述组间丰度增加或减少的分类群(表19)。矩阵容易捕获所有ibs组之间的差异,从而显示各ibs组与健康组之间相对于在种丰度的显著性的异同。在交叉矩阵的类正常列中不存在任何种的情况下,反映出类正常ibs组在种丰度方面与健康组基本相同的事实(表19)。对于改变的ibs组,ibs-1及ibs-2亚组中活泼瘤胃球菌的丰度都增加。与健康组相比,两个改变的ibs组中梭菌属的三个不同种的丰度也增加。[0288]使用相同的交叉矩阵方法,还研究了与类正常ibs组(ibs-3)相比,在改变的ibs组(ibs-2及ibs-3)中哪些种为显著差异丰富的。结果显示于表20中。观察到显著的差异。首先,在ibs-1亚组与ibs-3亚组之间没有发现显著差异丰富的种。其次,与ibs-3亚组相比,在ibs-2亚组中仅有4个显著差异丰富的物种。其中,活泼瘤胃球菌及梭菌属的丰度显著增加。两个改变的ibs组之间的比较也显示数量极少的显著差异丰富的种。[0289]讨论[0290]值得注意的是,此处观察到的改变的ibs组(ibs-1及ibs-2)与类正常(ibs-3)及健康个体的分开(图14)与微生物组分析(实施例7,图13)所观察到的极为相似。[0291]这项研究还表明,ibs亚组中有多个显著差异丰富的种,而ibs-3组与健康个体之间却没有。[0292]总之,所述研究表明,实施例6中鉴别的ibs亚组具有不同的宏基因组学概况,这可对于未来的分层为信息充足的。[0293]实施例9-ibs亚组的代谢组学定量分析及差异丰度分析[0294]材料和方法[0295]受试者:研究与实施例6-8中相同的个体。表15中显示了本实施例中分析的样品数量。[0296]代谢组定量分析:如实施例2及3中分别所述,除未进行sfca分析之外,使用lc/gc-ms测量各样品中尿液及粪便代谢物的代谢组数量。输出测量值为雷射强度,且可以信号形式视为光谱仪上的峰。将所有样品的结果整理为在所有142个样品中检测的各代谢物的峰值矩阵。将尿液峰值归一化为肌酸酐值。将粪便峰值归一化为样品干重(lc)或样品湿重(gc)。[0297]β多样性的分析:如实施例6中所述进行主坐标分析。[0298]结果[0299]粪便及尿液代谢组学数据的β多样性分析的主坐标分析[0300]使用来自代谢组学结果的经归一化的峰值数据以及来自实施例6-8的分层,确定了改变的ibs组、类正常ibs组与健康组之间的β多样性。粪便及尿液代谢组学数据的主坐标分析结果分别显示在图15及图16中。就粪便代谢组学样品而言,所有六个成对比较的置换manova测试显示,各组之间的分开的显著性与先前针对微生物组样品及宏基因组样品发现的完全相同(表16)。然而,就尿液代谢组学样品而言,β多样性分析显示出各组之间的分开的显著性与其他概况相比不同。尿液代谢组学成对比较的各组的分开的置换manova结果显示,ibs组(ibs-1、ibs-2及ibs-3)与健康组仅3个成对比较的分开具有显著性(表16)。值得注意的是,在尿液代谢组学数据集中,类正常ibs-3组与健康组之间有显著分开(图16);然而,未显著分开的ibs-3亚组及健康个体的相反结果为微生物组、宏基因组(实施例7及8)及粪便代谢组学(图15)数据集的特征。[0301]讨论[0302]在此显示,实施例6中鉴别的ibs亚组具有不同的粪便代谢组学概况。针对尿液代谢组学数据获得的结果不同于针对微生物组、宏基因组学及粪便代谢组学数据获得的结果。这可对于未来的分层为信息充足的。[0303]实施例10-用替代性机器学习管线的ibs患者及对照的尿液代谢组定量分析[0304]材料和方法[0305]如实施例1中所述进行个体招募及样品收集。[0306]尿液faims:使用自arasaradnam等人(37)的方法修改的方案进行faims分析,且在下文描述。所属领域中已知用于检测代谢物的任何其他合适的方法可以用于本发明的方法中。将冷冻的(-80℃)尿液样品在4℃下解冻隔夜,将5ml各尿液样品等分到20ml玻璃小瓶中,且放入附接至lonestarfaims仪器(owlstone,uk)的atlas取样器(owlstone,uk)中。将样品加热至40℃且依次运行3次。[0307]各样品运行的流速超过500ml/min洁净干燥空气的样品。再添加补充空气以产生2.5l/min的总流速。在51个步骤中从0到99%的分散场,在512个步骤中从′+6v到-6v补偿电压扫描faims,且检测正离子及负离子以产生各样品的非靶向挥发性有机物(voc)概况。使用savitzky-golay滤波器(窗口大小=9,度=3)将各样品在各df下的信号平滑化。基于针对正模式输出为0.007的优化截止值及针对负模式输出为-0.007的优化截止值对信号进行修剪,以获得感兴趣的区域且降低基线噪声。使用交叉相关将各df下的信号与经修剪的信号对齐,使用平均信号作为参考使它们具有可比性。由于faims信号的初始df及较高df没有提供信息,因此考虑了对应于正模式及负模式的第17个df至第42个df的信号。这些预处理步骤使用具有相关程序包(scipy1.1版及numpy1.15.2版)的python2.7.11版中开发的定制制程序执行。为了进一步降低复杂度且保留信息充足的数据,对各特征向量执行峰度常态性检验,考虑原始p值>0.1的特征,且生成各种统计分析的最终概况。[0308]尿液代谢组数据的生物信息学分析(faims):使用faims分析的各尿液样品产生具有约52,224个数据点的概况。生成各样品的含有这些数据点的合并概况以进行预处理,以减少数据的噪声、大小及复杂性。[0309]尿液gc/lcms:将5ml冷冻尿液样品在干冰上送至德国波茨坦(potsdam,germany)的metabolomicdiscoveries(现在为metabolon)。使用液相色谱法(lc)及固相微萃取(spme)气相色谱法(gc)进行非靶向代谢组学分析,且使用电洒游离质谱(esi-ms)鉴别代谢物。还通过lc串联式质谱法进行了短链脂肪酸(scfa)分析。[0310]对于尿液代谢组学,参考各样品中的尿液肌酸酐水平对代谢物的值进行归一化。[0311]尿液代谢组数据的生物信息学分析(ms):返回所有ibs个体(n=80)及除2个对照以外的所有对照(n=63)的尿液ms代谢组学数据,因为这2个对照未通过qc或没有可用样品。从非靶向尿液代谢组学分析返回共计2,887种代谢物,其中594种经鉴别。仅考虑峰值通过尿液中的肌酸酐水平(mg/dl)经归一化的经鉴别的特征用于进一步分析。[0312]机器学习:将内部机器学习管线应用于尿液代谢组学数据。本实施例中使用的机器学习管线与实施例1至3中使用的机器学习管线相似,但包含额外优化及验证步骤,在十倍交叉验证中使用两步法。在各验证倍数中,进行最小绝对紧缩与选择算子(lasso)特征选择,然后进行随机森林(rf)建模,且针对在交叉验证训练子集之外的交叉验证测试数据验证经优化的模型。[0313]将经分类的尿液代谢组样品概况进行log10转换,之后在机器学习管线中进行分析。然后使用经转换的概况将样品分类为ibs(80个样品)或对照(63个样品)。然后在机器学习管线中分析经分类的样品。[0314]图9示出了本实施例中使用的机器学习管线。首先将经分类的粪便代谢组样品概况分为训练集及测试集。然后将训练集用于生成最优λ范围,以供lasso算法使用。使用先前所述的交叉验证lasso且使用glmnet程序包(2.0-18版)生成最优λ范围。最优λ范围的预先确定减少了运行管线的计算时间,且无需使用者手动指定范围。[0315]确定λ范围后,基于其类别机率为样品分配权重。在此步骤中分配给训练样品的权重用于所有后续适用步骤中。[0316]然后将实质上如实施例1至3中所述的lasso算法应用于加权训练样品。在本实施例中,lasso算法使用了先前计算的最优λ范围,且使用了caret(在本实施例中为6.0-84版)及glmnet(在本实施例中为2.0-18版)程序包,使用10倍内部交叉验证,重复10次来计算rocauc(接受者操作特征,曲线下面积)度量。提取通过经优化的lasso算法所鉴别的特征系数,且选择具有非零系数的特征进行进一步分析。在图9中,n表示lasso算法返回的特征数。若lasso选择的特征数少于5,则所有特征(lasso之前)都将用于生成随机森林,即随机森林生成器忽略lasso过滤。若lasso选择的特征数大于或等于5,则仅lasso选择的特征用于生成随机森林(下游分类器生成);否则,考虑所有特征用于分类器生成步骤。[0317]使用lasso进行特征选择后,使用如n所确定的选定特征或所有特征生成经优化的随机森林分类器(具有1500棵树)。此经优化的随机森林分类器可用于预测外部测试倍数。通过调谐“mtry”参数以最大化rocauc度量,使用caret(6.0-84版)及内部交叉验证进行随机森林生成。针对调谐,若所选特征的数量大于或等于5,则mtry范围为1至所选特征数的平方根,否则范围为1至6。然后将经优化的随机森林分类器应用于测试集,且经由auc、灵敏性及特异性度量来计算分类器的性能。[0318]lasso特征选择及rf建模均在10倍交叉验证(cv)内进行,其生成了内部10倍预测模型,从而预测样品的ibs或对照分类。将此10倍交叉验证程序重复十次,且报告平均auc、灵敏性及特异性。然后,将经优化的模型用于预测交叉验证测试子集,且由十倍交叉验证(auc、灵敏性及特异性)计算最终分类器性能度量。[0319]结果[0320]将代谢组学分析延伸至其于所有个体的应用,最初聚焦于尿液作为非侵入性测试样品。比较了两种方法:挥发性有机物的faims分析以及联合gc-ms/lc-ms。faims技术不直接鉴别辨识性代谢物,而是通过离子化代谢物的特征性羽流(plume)来分开样品/个体。在无监督的分析中,faims易于鉴别出对照及ibs的尿液样品(图4a),但不能区分ibs临床亚型(图5)。尿液代谢组的gc/lc-ms分析还将ibs患者与对照分开(图4b),且其准确度大于faims(图6a及6b)。[0321]机器学习鉴别了预测ibs的尿液代谢组学特征(auc1.000;灵敏性:1.000,特异性:0.97,参见表21a及21b)。为高度预测的特征包括饮食组分诸如表儿茶素硫酸盐及苜蓿酸3-o-b-d-葡糖苷酸,但还包括酰基甘氨酸(n-十一酰基甘氨酸)及酰基肉碱(癸酰基肉碱)(表21a及21b)。对照及ibs尿液代谢组的成对比较鉴别了127种差异丰富的特征(表6)。ibs个体中89种尿液代谢物显著较不丰富,包括许多氨基酸诸如l-精氨酸,其为一氧化氮的生物合成前体,一氧化氮与粘膜防御以及可能ibs病理生理学相关。ibs中另外38种代谢物以显著较高水平存在,包括酰基甘氨酸(n-十一酰基甘氨酸)及酰基肉碱(癸酰基肉碱)。这些data″.philostransrsoclondbbiolsci.360(1462):1935-43.[0380][0381][0382][0383][0384][0385][0386][0387][0388][0389][0390][0391][0392][0393][0394][0395][0396][0397][0398][0399][0400][0401][0402][0403][0404][0405][0406][0407][0408][0409][0410][0411][0412][0413][0414][0415][0416][0417][0418][0419][0420][0421][0422][0423][0424][0425][0426][0427][0428][0429][0430][0431][0432][0433][0434][0435][0436][0437][0438][0439][0440][0441][0442][0443][0444][0445][0446][0447][0448][0449][0450][0451][0452][0453][0454][0455][0456][0457][0458][0459][0460][0461][0462][0463][0464][0465]表17-ibs亚组及健康受试者之间的差异丰富属(各条目显示显著发现丰度增加(浅灰色)或减少(深灰色)的[0466][0467][0468][0469][0470][0471][0472][0473][0474]当前第1页12当前第1页12