1.本技术涉及计算机技术领域,尤其涉及一种数据处理方法及其装置。
背景技术:2.随着互联网技术的发展,用户在出现身体不适或拿到体检报告单后,通常会利用网络自行诊断所患疾病。
3.但是,同样的病症对于不同的用户可能是不同的疾病所致。举例来说,用户根据体检报告中的“左侧推动脉血流速度增快”进行在线检索时,可能会出现“脑缺氧脑血液供应不足”、“脑血管痉挛”、“颈椎病腿动脉痉挛”、“左侧椎动脉斑块”等多种诊断结果。面对这么多种诊断结果,用户无法准确判断出其所患的疾病类型。可以看出,以上的诊断方式不仅浪费用户的时间及精力,而且无法给出准确地诊断结果。
技术实现要素:4.本技术实施例提供一种数据处理方法及其装置,用于至少解决以上提及的问题。
5.本技术实施例还提供一种数据处理方法,所述方法包括:获取用户的社会属性和/或体征属性;确定由与所述用户的所述社会属性和/或体征属性相似的训练用户构成的用户群体;利用所述用户群体的群体数据对诊断模型组件进行训练,获取训练完成的诊断模型组件,其中,所述诊断模型组件用于对用户的健康状况进行诊断。
6.本技术实施例还提供一种数据处理方法,所述方法利用上述方法训练完成的医疗诊断模型执行医疗诊断的方法,包括:将所述社会属性和/或体征属性输入到训练完成的医疗诊断模型,获取所述用户的诊断信息。
7.本技术实施例还提供一种数据处理方法,所述方法接收用户输入的医疗服务请求,其中,所述医疗服务请求包括所述用户的医疗诊断单;从所述医疗诊断单中识别出所述用户的属性信息;确定由与所述用户的属性信息类似的训练用户构成的用户群体。
8.本技术实施例还提供一种数据处理方法,所述方法包括获取用户的学力属性和/或学历属性;确定由与所述用户的所述学力属性和/或学历属性相似的培训用户构成的用户群体;利用所述用户群体的群体数据培训推荐模型组件进行训练,获取训练完成的培训推荐模型组件,其中,所述培训推荐模型组件用于向用户推荐培训课程。
9.本技术实施例还提供一种数据处理方法,所述方法利用上述方法训练完成的培训推荐模型组件,包括将所述学力属性和/或学历属性输入到训练完成的培训推荐模型组件,获取所述用户的培训推荐信息。
10.本技术实施例还提供一种数据处理装置,包括:一个或多个处理器;存储器;以及一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行前述方法的指令。
11.根据本发明的一个方面,提供一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行前
述方法。
12.本技术实施例采用的上述至少一个技术方案能够达到以下有益效果:
13.根据本技术的示例性实施例的数据处理方法可利用用户的社会属性和/或体征属性确定用户所属的用户群体,利用用户群体确定所述用户的诊断信息,使得诊断信息更有依据并且更准确。
附图说明
14.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
15.图1是示出根据本技术的示例性实施例的医疗诊断系统的示图;
16.图2是示出根据本技术的示例性实施例的数据处理方法的步骤流程图;
17.图3是示出根据本技术的示例性实施例的数据处理方法的框图;
18.图4是示出根据本技术的示例性实施例的数据处理装置的框图。
具体实施方式
19.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术具体实施例及相应的附图对本技术技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
20.以下结合附图,详细说明本技术各实施例提供的技术方案。
21.图1是示出根据本技术的示例性实施例的医疗诊断系统的示图。
22.如图1所示,所述医疗诊断系统包括安装有应用程序的电子装置110以及为所述应用提供服务的应用服务器120,其中,所述应用程序是指具有医疗检索功能的应用程序,例如,医疗相关应用、检索应用。此外,所述应用程序还可以提供诊断、购买、咨询等服务。
23.在实施方式中,所述电子装置110可以是具有显示单元的电子装置,包括但不限于是以下任意设备:个人计算机(pc)、移动装置(诸如,蜂窝电话、个人数字助理(pda)、数码相机、便携式游戏控制台、mp3播放器、便携式/个人多媒体播放器(pmp)、手持电子书、平板pc、便携式膝上型pc和全球定位系统(gps)导航仪)、智能tv等。
24.用户在出现身体不适或拿到医疗诊断单后,通常会利用网络自行诊断所患疾病。具体来说,用户可利用电子装置110运行具有医疗检索功能的应用,随后,可在这些应用上输入自己的体征属性,例如,头疼、发烧39度、喉咙痛。为了提高准确度,通常会同时输入其他属性,例如,性别、年龄、职业等。这些应用可利用这些组合属性信息进行诊断。
25.此外,用户可在进行各项身体检查后,利用体检报告单上的具体指标数据进行检索。例如,用户可输入体检报告单中的血红蛋白偏高。更进一步地,可将以上的属性信息与体检报告单中的指标数据一起进行检索,例如,用户可在医疗相关应用中输入39岁、男子、血红蛋白偏高等多个检索词并在输入完成后,向应用服务器120发出医疗服务请求。
26.应用服务器120在接收到所述医疗服务请求后,按照图2所示的方法确定用户的诊断信息,并将该诊断信息发送到电子装置110,电子装置110接收并显示该诊断信息,此外,应用服务器120还可根据确定的诊断信息向用户提供健康方案。
27.以下将参照图2对根据本技术的示例性实施例的数据处理方法进行详细描述。在实施中,本技术的示例性实施例的数据处理方法可以是与各个应用对应的应用服务器执行的方法,还可以是与该服务器耦合的独立模块执行的方法,也就是说,所述数据处理装置可以是内嵌在应用服务器中的模块也可以是外置在应用服务器中的模块,本技术对此不设限制。
28.图2是示出根据本技术的示例性实施例的数据处理方法的步骤流程图。
29.在步骤s210,获取用户的社会属性和/或体征属性。根据本技术的示例性实施例,所述社会属性包括影响用户健康的社会身份和/活动的信息,例如,所述社会属性可以是用户的职业(例如,建筑工人、教师、程序员等)、所在地区(例如,山区、平原、高原等)又或者作息习惯(包括作息正常、经常熬夜)、运动习惯(例如,不运动、偶尔运动、经常运动)等。
30.所述体征属性包括表征所述用户的身体状况的信息,例如,所述体征属性可包括用户的性别、年龄、身高、体重或者通过执行身体检查获得的表征所述用户的各个器官的信息,例如,可通过血常规的检测确定表征血液的信息(诸如,血红蛋白、白细胞、红细胞),又例如,可通过肝功能检测确定表征肝部的信息(诸如,丙氨酸氨基转移酶(alt)、天门冬氨酸氨基转移酶(ast))。
31.在实施中,用户可通过如图1所示的电子装置110的页面上显示的指示信息输入用户的社会属性和/或体征属性。根据本技术的示例性实施例,用户可根据指示上传用户的医疗信息单,其中,所述医疗信息单可包括用户的基本信息(例如,用户的姓名、年龄、性别、所在区域)、给用户治疗的医生信息(例如,医生的姓名、级别)、科室信息、诊断时间、药品的属性信息(例如,药品的通用名称、商品名称、规格、厂家等)、药品的购买数量、药品的注意事项,例如,每日服用剂量,服用时间。应注意,所述医疗信息单根据医院的不同可采用不同的模板,甚至可能是由医生手写而成的。
32.此外,所述医疗信息单还包括针对用户的身体进行健康检查后获取的体检报告单,其中,所述体检报告单可包括用户的不同组织的检查数据,例如,针对血液的血常规检查单、针对肝功能的肝功能检查单、针对肺部的肺功能检查单。
33.此外,所述社会属性和/或体征属性还可以是图1中的应用服务器120中已经存储的历史信息,也就是说,应用服务器120将用户与用户信息(包括社会属性和/或体征属性)对应存储,其中,所述用户信息包括该用户已输入的病历信息或上传的医疗信息单。
34.在电子装置110获取到以上提到的医疗信息单后,可识别所述医疗信息单上的文本数据,作为示例,用户可利用电子装置110的图像获取装置(例如,相机)获取医疗诊断单的图像,并利用图像识别方法识别出图像中的文本数据。作为示例,利用ocr(光学字符识别,optical character recognition)技术,将图像中的文字内容转换为可编辑文本,并从中识别出用户的社会属性和/或体征属性。
35.在步骤s220,确定由与所述用户的所述社会属性和/或体征属性相似的训练用户构成的用户群体。
36.具体来说,所述方法可向所述社会属性与所述体征属性按照预设规则分配对应的权重值。在实施中,可预先确定所述社会属性与所述体征属性的重要级并根据重要级确定分配的权重值,其中,所述重要级通常与该属性对健康的影响程度成正比,也就是说,对健康影响越大的属性其所分配的权重值越大。
37.根据本技术的示例性实施例,为了更精准地确定该用户所属的用户群体,可从这些社会属性与体征属性中挑选预设数量的属性,例如,可从这些社会属性与体征属性中确定十个属性作为分类标准,然后将这十个属性按照重要级别分配权重值。
38.随后,可确定这些属性的取值范围,对于没有量化的属性执行离散化取值,举例来说,在确定用户的年龄被确定为分类标准后,可将年龄划分为不同的年龄段,并且不同的年龄段对应的取值不同。例如,14岁的少年可被划分在10岁到20岁的年龄区间内并且对应的取值为2。
39.在已经确定了这些社会属性和/或体征属性的取值规则后,可从训练用户集中选出与用户相似的训练用户并利用这些训练用户组成用户群体。具体来说,可针对训练用户集中的每个训练用户分别计算该训练用户的社会属性值和体征属性值,然后利用这些社会属性值和体征属性值以及对应的权重值,计算该训练用户的最终数值。在实施中,可将最终数值超过预定阈值的训练用户归类到同一用户群体。
40.在步骤s230,利用所述用户群体的群体数据诊断模型组件进行训练,获取训练完成的诊断模型组件。
41.具体来说,可从所述社会属性和所述体征属性中确定对于所述诊断信息有影响的属性作为特征属性。也就是说,所述社会属性和所述体征属性可用于更好地确定用户所述的用户群体,比如,可确定用户群体为身体肥胖的中年男程序员,但这些属性并不适合对用户进行诊断。优选地,可更多地将从所述体征属性中获取的属性,特别是从体检报告单中获取的各项指标(即,属性)作为特征属性。
42.随后,可利用所述用户群体相对于所述特征属性的特征属性值以及对应的患病信息,对所述诊断模型组件进行训练,获取训练完成的诊断模型组件,其中,所述诊断模型组件用于对用户的健康状况进行诊断。
43.在实施中,可先根据所述特征属性的取值规则,确定所述用户群体中的每个群体用户相对于所述特征属性的特征属性值。
44.举例来说,假设所述特征属性包括职业、年龄、性别、身体质量指数(bmi)、区域、血压以及血糖,则在所述特征属性包括用户的职业的情况下,所述职业可划分为软件开发、医生以及测试人员;在所述特征属性是年龄的情况下,所述年龄可划分为小于14岁、14岁到30岁以及30岁到50岁;在所述特征属性是性别的情况下,所述特征属性可划分为男性、女性;在所述特征属性是bmi的情况下,所述特征属性可划分为偏瘦、正常、过重、肥胖;在所述特征属性是区域的情况下,所述特征属性可划分为北京、上海、湖北、湖南;在所述特征属性是血压的情况下,所述特征属性可被划分为过高、正常、过低;在所述特征属性是血糖的情况下,所述特征属性可被划分为过高、正常、过低。
45.基于以上的取值规则,可分别确定用户群体中的每个群体用户相对于以上各个特征属性的特征属性值。
46.随后,构建所述诊断模型组件,其中,所述诊断模型组件包括决策树模型组件,其中,所述决策树模型可基于实例的归纳学习方法,从无序的训练样本中提取出树型的分类模型。树型结构的每个非叶子节点记录了使用哪个特征来进行类别的判断,每个叶子节点则代表了最后判断的类别。根节点到每个叶子节点均形成一条分类的路径规则。
47.在本技术中,可利用所述特征属性值以及对应的患病信息,对所述决策树模型组
件进行训练,直至确定所述决策树模型中作为根节点和叶节点的根特征属性和叶特征属性。
48.具体来说,利用每个特征属性对应的特征属性值以及患病信息,计算所述用户群体在每个特征属性下的信息增益,其中,所述信息增益用于衡量预期的信息熵的减少,其中,所述信息熵是用于衡量消息来源不确定性的指标,也就是说,信息熵可用于衡量用户群体的无组织程度。
49.将信息增益最大的特征属性确定为所述决策树模型中的根特征属性。随后,可利用所述根特征属性的取值范围,将所述用户群体分类为至少一个用户子集。例如,在用户性别确定为根特征属性的情况下,可将用户群体分类为男性用户子集以及女性用户子集。
50.针对每个用户子集,通过计算所述用户子集在除根特征属性外的其它特征属性下的信息增益,确定所述根特征属性下的中间特征属性(即,中间节点)。并将每层中间特征属性看作根特征属性,按照如上方式确定每层中间特征属性的直接下层中间特征属性,直至最后一层的中间特征属性对应的用户子集仅包括单个特征属性,则该层中间特征属性被视为叶特征属性。
51.此外,在实施中,所述用户可能同时属于不同的用户群体,也就是说,按照不同的预设规则确定用户所述的用户群体,例如,同一用户可同时属于高龄产后妈妈群体以及中年肥胖女子团体。在此情况下,可按照不同的用户群体训练各自的诊断模型组件,获取到训练完成的各个诊断模型组件。
52.此外,根据本技术的示例性实施例,还可利用训练完成的诊断模型组件确定用户的诊断信息。
53.具体来说,可将用户的社会属性和/或体征属性输入到训练完成的医疗诊断模型,获取所述用户的诊断信息。此外,还可从所述社会属性和/或所述体征属性中确定对于所述诊断信息有影响的属性作为特征属性,然后将所述特征属性输入到训练完成的医疗诊断模型,获取所述用户的诊断信息。
54.可选地,所述方法在步骤s230获取到用户的诊断信息后,可根据所述诊断信息向用户推荐与所述诊断信息相关联的健康方案。所述健康方案可包括饮食方案、作息方案、运动方案以及服药方案中的一个或两个以上的组合方案。
55.举例来说,在所述诊断信息是中重度脂肪肝的情况下,所述健康方案可包括用户的饮食方案(诸如,少油少盐少糖少摄入肝脏类)、作息方案(诸如,每日保证八小时睡眠时间)、运动方案(诸如,每日有氧运动半小时)以及服药方案(诸如,服用还原型谷胱甘肽)。
56.此外,所述方法还可确定所述用户群体的群体患病信息,其中,所述群体患病信息包括所述用户群体的当前患病信息和/或远期易感患病信息,其中,当前患病信息是指该用户群体当前普遍具有的患病状况,远期易感患病信息是指该用户群体在未来一段时间的患病趋势。
57.例如,对于肥胖的中年程序员男子群体的当前患病信息包括颈椎病,而该中年男子群体的易感肝病信息可包括脂肪肝、脱发以及高血糖。这样,所述方法可向该用户提供该群体的当前患病信息和/或远期易感患病信息。
58.此外,所述方法还可根据所述用户群体中具有各类型疾病的比例作为患病概率提供给用户。例如,所述方法可以以图示方式向用户展示该用户群体的患病类型以及各患病
类型的概率。更进一步地,可根据所述群体患病信息向所述用户推荐相关联的健康方案。
59.此外,在所述用户同时属于不同的用户群体并按照不同的用户群体训练各自的诊断模型组件并获取到训练完成的各个诊断模型组件的情况下,可将用户的特征属性值输入到训练完成的各个诊断模型组件,确定至少一个诊断信息。
60.综上可述,根据本技术的示例性实施例的数据处理方法可利用用户的社会属性和/或体征属性确定用户所属的用户群体,利用用户群体确定所述用户的诊断信息,使得诊断信息更有依据并且更准确。在此基础上,可从用户上传的医疗信息单上获取用户的这些属性,使得这些属性更能表征用户。更进一步地,利用社会属性和/或体征属性确定用户所属的用户群体,从而能够找到与用户情况类似的用户群体。更进一步地,向不同的属性分配不同的权重值,从而能够找到更符合用户情况的用户群体。更进一步地,利用确定的用户群体对诊断模型组件进行训练,使得训练完成的诊断模型组件能够更准确地获取用户的诊断信息。更进一步地,可根据用户的诊断信息,向用户推荐健康方案,提高了用户体验。更进一步地,可根据用户所述的用户群体,警告用户需要注意的方向,从而更符合用户情况并且更能说服用户。更进一步地,可根据用户的各个属性确定用户所述的不同用户群体,并利用不同用户群体训练的诊断模型组件,获取到各个诊断信息,使得诊断信息更准确且覆盖面更广。
61.为了更形象地描述本技术的示例性实施例,以下将参照图3进一步描述。图3是示出根据本技术的示例性实施例的数据处理方法的框图。
62.如图3所示,用户在接收到医疗信息单后,可运行电子装置上运行的相关应用,并利用电子装置的图像获取单元(例如,相机)拍摄并上传所述医疗信息单。
63.随后,所述相关应用对应的服务器可提取出所述医疗信息单上的各个属性,包括用户的社会属性和/或体征属性。在实施中,所述服务器还可根据用户的标识信息(例如,用户的姓名、身份标识号等)查找用户的历史健康档案,从所述历史健康档案中抽取用户的社会属性和/或体征属性。
64.随后,利用这些社会属性和/或体征属性确定用户所述的用户群体,在实施中,可根据预设的规则对这些社会属性和/或体征属性设置不同的权重值,例如,性别的权重值可被设置为最大的,并将出勤方式的权重值设置为最小的。可选地,还可从提取出的社会属性和/或体征属性中选择预定数量的属性。
65.随后,可利用这些用户群体中的各个用户数据对诊断模型组件进行训练,如图3所述,所述诊断模型组件可以是决策树模型组件,由于以上已对此进行详细论述,在此将不再赘述。最后,将选择的特征属性输入到所述诊断模型组件,可输出用户的诊断信息。
66.此外,本技术还可应用于教育领域。具体来说,所述方法可获取用户的学力属性和/或学历属性,其中,所述学力属性包括所述用户在学习能力方面的信息,包括所述用户的智商、学习能力(例如,专注度)、动手能力和知识水平等。所述学历属性包括所述用户在学习经历方面的信息,包括所述用户的教育背景(例如,某省级奥数比赛获奖者)、当前教育水平(例如,就读于某小学四年级)等。
67.作为示例,所述方法可通过学力测试单获取到以上信息。具体来说,所述方法可接收用户上传的学力测试单;识别所述学力测试单上的文本数据;从所述文本数据中获取所述学历属性和/或所述学力属性。
68.然后,所述方法可确定由与所述用户的所述学力属性和/或学历属性相似的培训用户构成的用户群体。具体来说,可向所述学力属性和/或与所述学历属性按照预设规则分配对应的权重值;通过计算训练用户集中的每个训练用户的学力属性值和/或所述学历属性值以及对应的权重值,确定与所述用户相似的训练用户并获取由所述训练用户构成的所述用户群体。最后,利用所述用户群体的群体数据培训推荐模型组件进行训练,获取训练完成的培训推荐模型组件,其中,所述培训推荐模型组件用于向用户推荐培训课程。
69.此外,所述方法可将用户的所述学力属性和/或学历属性输入到训练完成的培训推荐模型组件,获取所述用户的培训推荐信息。其中,所述培训推荐信息包括适合于所述用户教育培训课程。
70.图4示出本技术的示例性实施例的数据处理装置的框图。参考图4,在硬件层面,该装置包括处理器、内部总线和计算机可读存储介质,其中,所述计算机可读存储介质包括易失性存储器和非易失性存储器。处理器从非易失性存储器中读取对应的计算机程序然后运行。当然,除了软件实现方式之外,本技术并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
71.具体来说,所述处理器执行以下操作:获取用户的社会属性和/或体征属性;确定由与所述用户的所述社会属性和/或体征属性相似的训练用户构成的用户群体;利用所述用户群体的群体数据对诊断模型组件进行训练,获取训练完成的诊断模型组件,其中,所述诊断模型组件用于对用户的健康状况进行诊断。
72.可选地,所述处理器在实现步骤获取用户的社会属性和/或体征属性包括:接收用户上传的医疗信息单;识别所述医疗信息单上的文本数据;从所述文本数据中获取所述社会属性和/或所述体征属性。
73.可选地,所述社会属性包括影响用户健康的社会身份和/活动的信息;所述体征属性包括表征所述用户的身体状况的信息。
74.可选地,所述处理器在实现步骤确定由与所述用户的所述社会属性和/或体征属性相似的训练用户构成的用户群体包括:向所述社会属性和/或所述体征属性按照预设规则分配对应的权重值;通过计算训练用户集中的每个训练用户的社会属性值和/或体征属性值以及对应的权重值,确定与所述用户相似的训练用户并获取由所述训练用户构成的所述用户群体。
75.可选地,所述处理器在实现步骤利用所述用户群体的群体数据诊断模型组件进行训练获取训练完成的诊断模型组件包括:从所述社会属性和/或所述体征属性中确定对于所述诊断信息有影响的属性作为特征属性;利用所述用户群体相对于所述特征属性的特征属性值以及对应的患病信息,对所述诊断模型组件进行训练,获取训练完成的诊断模型组件。
76.可选地,所述处理器在实现步骤利用所述用户群体相对于所述特征属性的特征属性值以及对应的患病信息对所述诊断模型组件进行训练获取训练完成的诊断模型组件包括:根据所述特征属性的取值规则,确定所述用户群体中的每个群体用户相对于所述特征属性的特征属性值;构建所述诊断模型组件,其中,所述诊断模型组件包括决策树模型组件;利用所述特征属性值以及对应的患病信息,对所述决策树模型组件进行训练,直至确定
所述决策树模型中作为根节点和叶节点的根特征属性和叶特征属性。所述处理器在实现步骤利用所述特征属性值以及对应的患病信息对所述决策树模型组件进行训练直至确定所述决策树模型中作为根节点和叶节点的根特征属性和叶特征属性。
77.可选地,所述处理器在实现步骤利用所述特征属性值以及对应的患病信息对所述决策树模型组件进行训练直至确定所述决策树模型中作为根节点和叶节点的根特征属性和叶特征属性包括:利用每个特征属性对应的特征属性值以及患病信息,计算所述用户群体在每个特征属性下的信息增益;将信息增益最大的特征属性确定为所述决策树模型中的根特征属性;利用所述根特征属性的取值范围,将所述用户群体分类为至少一个用户子集;针对每个用户子集,通过计算所述用户子集在除根特征属性外的其它特征属性下的信息增益,确定所述根特征属性下的中间特征属性;将每层中间特征属性看作根特征属性,按照如上方式确定每层中间特征属性的直接下层中间特征属性,直至底层的叶特征属性对应的用户子集仅包括单个特征属性。
78.可选地,利用所述用户群体的群体数据诊断模型组件进行训练获取训练完成的诊断模型组件包括:按照预设的群体分类方式,将所述用户群体分类为至少一个子群体;利用所述至少一个子群体的子群体数据对所述诊断模型组件进行训练,获取训练完成的至少一个诊断模型组件。
79.根据本技术的示例性实施例的处理器还可利用以上处理器执行医疗诊断,包括:将所述社会属性和/或体征属性输入到训练完成的医疗诊断模型,获取所述用户的诊断信息。
80.可选地,所述处理器执行步骤将所述社会属性和/或体征属性输入到训练完成的医疗诊断模型获取所述用户的诊断信息包括:从所述社会属性和/或所述体征属性中确定对于所述诊断信息有影响的属性作为特征属性;将所述特征属性输入到训练完成的医疗诊断模型,获取所述用户的诊断信息。
81.所述处理器还可执行以下步骤:向所述用户推荐与所述诊断信息相关联的健康方案。
82.所述处理器还可实现以下步骤:确定所述用户群体的群体患病信息,其中,所述群体患病信息包括所述用户群体的当前患病信息和/或远期易感患病信息;根据所述群体患病信息,向所述用户推荐相关联的健康方案。
83.此外,根据本技术的示例性实施例,所述处理器可执行以下步骤:接收用户输入的医疗服务请求,其中,所述医疗服务请求包括所述用户的医疗诊断单;从所述医疗诊断单中识别出所述用户的属性信息;确定由与所述用户的属性信息类似的训练用户构成的用户群体。
84.可选地,所述处理器还可执行以下步骤:根据所述用户群体的群体患病信息,确定所述用户的诊断信息。
85.可选地,所述处理器在实现步骤根据所述用户群体的患病信息确定所述用户的诊断信息包括:通过所述用户群体的属性信息与群体患病信息之间的对应关系,对诊断模型组件进行训练;将所述用户的属性信息输入到训练完成的诊断模型组件,获取所述用户的诊断信息。
86.此外,根据本技术的示例性实施例,所述处理器还可执行以下步骤:获取用户的学
力属性和/或学历属性;确定由与所述用户的所述学力属性和/或学历属性相似的培训用户构成的用户群体;利用所述用户群体的群体数据培训推荐模型组件进行训练,获取训练完成的培训推荐模型组件,其中,所述培训推荐模型组件用于向用户推荐培训课程。
87.此外,所述学力属性包括所述用户在学习能力方面的信息;以及所述学历属性包括所述用户在学习经历方面的信息。
88.此外,根据本技术的示例性实施例的处理器可利用以上处理器执行培训推荐,包括:将所述学力属性和/或学历属性输入到训练完成的培训推荐模型组件,获取所述用户的培训推荐信息。
89.综上可述,根据本技术的示例性实施例的数据处理装置可利用用户的社会属性和/或体征属性确定用户所属的用户群体,利用用户群体确定所述用户的诊断信息,使得诊断信息更有依据并且更准确。在此基础上,可从用户上传的医疗信息单上获取用户的这些属性,使得这些属性更能表征用户。更进一步地,利用社会属性和/或体征属性确定用户所属的用户群体,从而能够找到与用户情况类似的用户群体。更进一步地,向不同的属性分配不同的权重值,从而能够找到更符合用户情况的用户群体。更进一步地,利用确定的用户群体对诊断模型组件进行训练,使得训练完成的诊断模型组件能够更准确地获取用户的诊断信息。更进一步地,可根据用户的诊断信息,向用户推荐健康方案,提高了用户体验。更进一步地,可根据用户所述的用户群体,警告用户需要注意的方向,从而更符合用户情况并且更能说服用户。更进一步地,可根据用户的各个属性确定用户所述的不同用户群体,并利用不同用户群体训练的诊断模型组件,获取到各个诊断信息,使得诊断信息更准确且覆盖面更广。
90.需要说明的是,实施例1所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤21和步骤22的执行主体可以为设备1,步骤23的执行主体可以为设备2;又比如,步骤21的执行主体可以为设备1,步骤22和步骤23的执行主体可以为设备2;等等。
91.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
92.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
93.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
94.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
95.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
96.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
97.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
98.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
99.本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
100.以上所述仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。