首页 > 乐器声学 专利正文
基于信息重组的语音控制方法、装置、终端及存储介质与流程

时间:2022-02-18 阅读: 作者:专利查询

基于信息重组的语音控制方法、装置、终端及存储介质与流程

1.本发明涉及终端控制技术领域,特别涉及一种基于信息重组的语音控制方法、装置、终端及计算机可读存储介质。


背景技术:

2.智能语音在各种终端上的应用越来越广泛,但是目前的语音控制只限定于一些简单的操作,例如开关机、搜索等,对于存在大量内容的网页,目前的语音控制方法无法实现用户通过语音控制就能快速获取到想要的信息。
3.因此,现有技术还有待改进和提高。


技术实现要素:

4.本发明实施例提供了一种基于信息重组的语音控制方法、装置、终端及存储介质,旨在解决现有技术中无法实现用户通过语音控制就可以从存在大量内容的网页快速获取到想要的信息的问题。
5.第一方面,本发明实施例提供了一种基于信息重组的语音控制方法,包括:
6.确定目标页面,对所述目标页面中的信息进行提取,获取多条提取信息,以及每条所述提取信息对应的链接;
7.对所述多条提取信息中的至少一条所述提取信息按照预设标准进行组合,得到至少一个信息组,每个所述信息组中包括至少一条所述提取信息,其中,每个所述信息组对应有组别标识,每个所述信息组中的每条所述提取信息对应有信息标识;
8.生成新页面并显示,所述新页面中包括至少一个所述信息组;
9.接收目标语音指令,提取所述目标语音指令中的目标组别标识和目标信息标识,根据所述目标组别标识和所述目标信息标识确定目标提取信息,打开所述目标提取信息对应的链接。
10.所述的基于信息重组的语音控制方法,其中,所述对所述多条提取信息中的至少一条所述提取信息按照预设标准进行组合之前,包括:
11.接收触发语音指令,根据所述触发语音指令确定搜索词;
12.根据所述搜索词在所述多条提取信息中确定用于组合的至少一条所述提取信息。
13.所述的基于信息重组的语音控制方法,其中,所述对所述多条提取信息中的至少一条所述提取信息按照预设标准进行组合,得到至少一个信息组,包括:
14.对所述多条提取信息中的至少一条所述提取信息进行分类,按照分类结果对所述多条提取信息中的至少一条所述提取信息进行组合,其中,每个所述信息组中的所述提取信息属于同一类。
15.所述的基于信息重组的语音控制方法,其中,所述对所述多条提取信息中的至少一条所述提取信息按照预设标准进行组合,得到至少一个信息组之后,包括:
16.按照预设规则对同一信息组中的所述提取信息进行排序。
17.所述的基于信息重组的语音控制方法,其中,所述信息组中的所述提取信息对应的所述信息标识为对所述提取信息进行排序后的序号。
18.所述的基于信息重组的语音控制方法,其中,所述按照预设规则对同一信息组中的所述提取信息进行排序,包括:
19.获取所述信息组中每条所述提取信息对应的链接的点击量;
20.根据所述点击量对同一信息组中的所述提取信息进行排序。
21.所述的基于信息重组的语音控制方法,其中,所述按照预设规则对同一信息组中的所述提取信息进行排序,包括:
22.获取历史页面记录,根据所述历史页面记录确定用户行为习惯特征;
23.根据所述用户行为习惯特征对同一信息组中的所述提取信息进行排序。
24.第二方面,本发明实施例提供了一种基于信息重组的语音控制装置,包括:
25.信息提取模块,所述信息提取模块用于确定目标页面,对所述目标页面中的信息进行提取,获取多条提取信息,以及每条所述提取信息对应的链接;
26.信息重组模块,所述信息重组模块用于对所述多条提取信息中的至少一条所述提取信息按照预设标准进行组合,得到至少一个信息组,每个所述信息组中包括至少一条所述提取信息,其中,每个所述信息组对应有组别标识,每个所述信息组中的每条所述提取信息对应有信息标识;
27.页面生成模块,所述页面生成模块用于生成新页面并显示,所述新页面中包括至少一个所述信息组;
28.链接跳转模块,所述链接跳转模块用于接收目标语音指令,提取所述目标语音指令中的目标组别标识和目标信息标识,根据所述目标组别标识和所述目标信息标识确定目标提取信息,打开所述目标提取信息对应的链接。
29.第三方面,本发明实施例提供了一种终端,终端包括存储器、处理器和存储在存储器中并可在处理器上运行的基于信息重组的语音控制程序,处理器执行基于信息重组的语音控制程序时,实现上述的方法的步骤。
30.第四方面,本发明实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有基于信息重组的语音控制程序,基于信息重组的语音控制程序被处理器执行时,实现上述的方法的步骤。
31.有益效果:与现有技术相比,本发明提供了一种基于信息重组的语音控制方法、装置、终端及存储介质,本发明提供的基于信息重组的语音控制方法中,对于目标页面进行信息提取,并将提取出的提取信息重新组合成信息组,每个信息组对应有组别标识,每个信息组内的提取信息对应有信息标识,将组合结果显示为新的页面,当接收到包括目标组别标识和目标信息标识的目标语音指令时,根据目标组别标识和目标信息标识确定目标提取信息,打开目标提取信息对应的链接,这样只需要用户说出带有组别标识和信息标识的语音,就可以跳转到自己需要打开的链接,实现了用户只需要语音控制就可以从存在大量内容的网页中打开自己需要的链接,获取对应的信息的效果。
附图说明
32.图1为本发明提供的基于信息重组的语音控制方法的实施例的流程图;
33.图2为本发明提供的基于信息重组的语音控制方法的实施例中信息组的示意图;
34.图3为本发明提供的基于信息重组的语音控制装置的功能模块示意图;
35.图4为本发明提供的终端的实施例的原理图。
具体实施方式
36.为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
37.实施例一
38.本发明提供的基于信息重组的语音控制方法,可以是由终端执行,终端可以但不限于是各种计算机、移动终端、智能家电、可穿戴式设备等。
39.请参照图1,图1为本发明提供的基于信息重组的语音控制方法的一个实施例的流程图。本实施例提供的基于信息重组的语音控制方法包括步骤:
40.s100、确定目标页面,对所述目标页面中的信息进行提取,获取多条提取信息,以及每条所述提取信息对应的链接。
41.所述目标页面可以是当前终端上正在显示的页面,或者是终端上最新打开的页面,具体地,用户在通过访问页面获取信息时,是通过点击终端上显示的链接打开一个页面,终端可以将打开的该页面作为所述目标页面。
42.所述目标页面上可能存在以文字、图片、视频等多种形式的内容,用户可以通过点击对应的内容来打开这些内容对应的链接,来访问新的页面获取更多的内容,一般来说,由于页面上存在的内容众多(例如,在用户进行搜索时,搜索结果页面上会存在大量的相关内容),用户需要进一步地点击自己感兴趣的内容来进一步获取信息,然而对于内容众多的页面来说,很难通过语音控制的方式来快速定位到自己感兴趣的内容。本实施例提供的基于信息重组的语音控制方法,在确定所述目标页面后,对所述目标页面中的信息进行提取,获取多条提取信息,具体地,提取所述目标页面的信息可以是提取所述目标页面中的各个链接的文字内容以及图片,可以通过ocr(optical character recognition)的方式来实现信息提取。在一种可能的实现方式中,对于图片内容,可以是识别图片中的文字作为一条信息,或者也可以是提取图片的标题作为一条信息,对于视频内容,可以是提取视频的标题作为一条信息,或者是提取视频的简介作为一条信息。在对所述目标页面中的信息进行提取,获取多条提取信息的同时,还获取每条所述提取信息对应的链接。
43.对所述目标页面中的信息进行提取得到所述多条提取信息后,可以将所述多条提取信息存储到一个列表中,该列表可以不显示,也就是说,信息提取过程在后台进行,是用户无感的。
44.s200、对所述多条提取信息中的至少一条所述提取信息按照预设标准进行组合,得到至少一个信息组,每个所述信息组中包括至少一条所述提取信息,其中,每个所述信息组对应有组别标识,每个所述信息组中的每条所述提取信息对应有信息标识。
45.为了方便用户通过语音指令快速定位到自己需要的信息,在本实施例中,对所述目标页面中提取的所述多条提取信息中的至少一条所述提取信息进行重组,具体地,用户可以通过语音指令来触发重组,对于一个页面中的众多内容,用户可能只需要某个方面的
内容,用户可以通过说出一个搜索词,终端根据所述搜索词从所述多条提取信息中选取至少一条所述提取信息进行组合。即所述对所述多条提取信息中的至少一条所述提取信息按照预设标准进行组合之前,本实施例提供的基于信息重组的语音控制方法,还包括步骤:
46.接收触发语音指令,根据所述触发语音指令确定搜索词;
47.根据所述搜索词在所述多条提取信息中确定用于组合的至少一条所述提取信息。
48.例如,用户想要查找“科技”方面的内容,则可以说出“科技”,或者“查找科技内容”、“查找科技信息”等语音作为所述触发语音指令,终端根据所述触发语音指令确定所述搜索词为:“科技”,并在所述多条提取信息中确定与所述搜索词相关的至少一条所述提取信息作为用于组合的信息,再对确定的至少一条所述提取信息进行组合。
49.所述对所述多条提取信息中的至少一条所述提取信息按照预设标准进行组合,得到至少一个信息组,包括:
50.对所述多条提取信息中的至少一条所述提取信息进行分类,按照分类结果对所述多条提取信息中的至少一条所述提取信息进行组合,其中,每个所述信息组中的所述提取信息属于同一类。
51.具体地,在确定用于组合的至少一条所述提取信息后,可以按照信息在页面上的排列顺序对所述提取信息进行组合,得到至少一个信息组,而在本实施例中,为了方便用户能够快速查找到自己需要的内容,对用于组合的至少一条所述提取信息进行分类,将属于同一类的所述提取信息组合为同一个信息组。具体地,分类规则可以是后台运营配置或接受用户的选择指令进行配置,例如,可以按照信息的展现形式(例如文档、图片、视频、智库等)来进行分类,也可以按照信息的时间进行分类等。在对所述提取信息进行组合时,对于同一条所述提取信息,可以重复分组或不重复分组,重复分组即同一条所述提取信息可以同时存在于不同的所述信息组,不重复分组即同一条所述提取信息只会存在于一个所述信息组,在实际应用中,可能存在同一条所述提取信息同时属于不同的分类的情况,那么可以根据该提取信息与不同类别之间的相关性归入其他一个类别对应的所述信息组,也可以将该提取信息同时归入属于的所有类别对应的所述信息组。
52.在对所述多条提取信息中的至少一条所述提取信息按照预设标准进行组合后,得到至少一个信息组后,所述方法还包括:
53.按照预设规则对同一信息组中的所述提取信息进行排序。
54.在一种可能的实现方式中,对同一信息组中的所述提取信息进行排序的预设规则可以是按照所述提取信息的热门程度进行排序,所述按照预设规则对同一信息组中的所述提取信息进行排序,包括:
55.获取所述信息组中每条所述提取信息对应的链接的点击量;
56.根据所述点击量对同一信息组中的所述提取信息进行排序。
57.信息对应的链接的点击量反映了该条信息内容的热门程度,可以根据热门程度来对同一信息组中的所述提取信息进行排序。
58.在另一种可能的实现方式中,对同一信息组中的所述提取信息进行排序的预设规则可以是按照信息与用户行为习惯的匹配度进行排序,具体地,所述按照预设规则对同一信息组中的所述提取信息进行排序,包括:
59.获取历史页面记录,根据所述历史页面记录确定用户行为习惯特征;
60.根据所述用户行为习惯特征对同一信息组中的所述提取信息进行排序。
61.具体地,历史页面记录可以是终端中访问过的页面的记录,根据历史页面记录可以确定用户行为习惯特征,所述用户行为习惯特征包括用户感兴趣的内容的类别、关键词以及呈现形式等,根据所述用户行为习惯特征对同一信息组中的所述提取信息进行排序,例如,用户对芯片的相关内容比较感兴趣,那么,可以设置关键词为“芯片”或者其他与芯片有关的关键词,根据所述提取信息中的词与设置的关键词之间的相关程度来对同一信息组中的所述提取信息进行排序。
62.对同一信息组中的所述提取信息进行排序的所述预设规则可以是后台配置或者接收用户的设置指令进行设置。具体地,在一些可能的实现方式中,可以显示排序规则设置菜单,接收用户的设置指令(可以为语音指令)选择设置排序规则设置菜单中的选项来选择所述预设规则或者在排序后显示所述至少一个信息组后显示所述排序规则设置菜单,接收用户的设置指令(可以为语音指令)来更改当前的所述预设规则,以修改同一信息组中的所述提取信息的排序结果。
63.对同一信息组中的所述提取信息进行排序后,可以设置同一信息组中的每条所述提取信息的信息标识为信息的序号。
64.通过上述步骤,可以得到至少一个信息组,每个信息组对应有组别标识,信息组对应的组别标识可以是序号或者是信息组所述的类别的名称,每个信息组中的每条所述提取信息对应有信息标识,同一信息组中的每条所述提取信息的信息标识不重复,属于不同信息组的所述提取信息对应的信息标识可以重复,这样,只需要组别标识+信息标识就可以定位到一条所述提取信息。
65.请再次参阅图1,本实施例提供的基于信息重组的语音控制方法,还包括步骤:
66.s300、生成新页面并显示,所述新页面中包括至少一个所述信息组。
67.在得到所述至少一个信息组后,根据得到的所述至少一个信息组生成新页面,如图2所示,所述新页面中包括至少一个所述信息组,显示所述新页面,所述新页面中的至少一个所述信息组中显示每个信息组的组别标识和每个所述提取信息的信息标识,以使得用户可以查看到所有信息组内的所述提取信息。
68.s400、接收目标语音指令,提取所述目标语音指令中的目标组别标识和目标信息标识,根据所述目标组别标识和所述目标信息标识确定目标提取信息,打开所述目标提取信息对应的链接。
69.当终端显示所述新页面后,用户可以查看到至少一个所述信息组,知晓显示的每个所述信息组的组别标识和显示的所述信息组中每条所述提取信息的信息标识,用户可以说出自己感兴趣的信息的信息标识以及信息所在信息组的组别标识,即发出包括目标组别标识和目标信息标识的所述目标语音指令,终端接收到后,对所述目标语音指令进行解析,提取得到所述目标组别标识和目标信息标识,根据所述目标组别标识和所述目标信息标识确定目标提取信息,打开所述目标提取信息对应的链接跳转至相应的网页。
70.例如,针对图2中展示的所述新页面,用户可以发出“第一个新闻”的语音指令,则终端自动执行点击“新闻”信息组中的第一条信息对应的链接。
71.从前面的说明不难看出,在本发明提供的语音控制方法中,对目标页面中的众多内容进行了信息提取并重组,这样,展示给用户是多个信息组,每个信息组中包括多条提取
信息,用户可以很方便地用语音描述出自己感兴趣的信息,从而实现通过语音控制快速在存在大量内容的网页中快速获取到自己想要的信息的效果。
72.综上所述,本发明提供一种基于信息重组的语音控制方法,对于目标页面进行信息提取,并将提取出的提取信息重新组合成信息组,每个信息组对应有组别标识,每个信息组内的提取信息对应有信息标识,将组合结果显示为新的页面,当接收到包括目标组别标识和目标信息标识的目标语音指令时,根据目标组别标识和目标信息标识确定目标提取信息,打开目标提取信息对应的链接,这样只需要用户说出带有组别标识和信息标识的语音,就可以跳转到自己需要打开的链接,实现了用户只需要语音控制就可以从存在大量内容的网页中打开自己需要的链接,获取对应的信息的效果。
73.应该理解的是,虽然本发明说明书附图中给出的的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
74.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、和存储器总线动态ram(rdram)等。
75.实施例二
76.基于上述实施例,本发明还提供了一种基于信息重组的语音控制装置,其功能模块示意图如图3所示,该基于信息重组的语音控制装置包括:
77.信息提取模块,所述信息提取模块用于确定目标页面,对所述目标页面中的信息进行提取,获取获取多条提取信息,以及每条所述提取信息对应的链接,具体如实施例一中所述;
78.信息重组模块,所述信息重组模块用于对所述多条提取信息中的至少一条所述提取信息按照预设标准进行组合,得到至少一个信息组,每个所述信息组中包括至少一条所述提取信息,其中,每个所述信息组对应有组别标识,每个所述信息组中的每条所述提取信息对应有信息标识,具体如实施例一中所述;
79.页面生成模块,所述页面生成模块用于生成新页面并显示,所述新页面中包括至少一个所述信息组,具体如实施例一中所述;
80.链接跳转模块,所述链接跳转模块用于接收目标语音指令,提取所述目标语音指
令中的目标组别标识和目标信息标识,根据所述目标组别标识和所述目标信息标识确定目标提取信息,打开所述目标提取信息对应的链接,具体如实施例一中所述。
81.实施例三
82.基于上述实施例,本发明还提供了一种终端,其原理框图可以如图4所示。该终端包括处理器10和存储器20,存储器20中存储有可在处理器10运行的基于信息重组的语音控制程序,该处理器10执行该基于信息重组的语音控制程序时至少可以实现以下步骤:
83.确定目标页面,对所述目标页面中的信息进行提取,获取多条提取信息,以及每条所述提取信息对应的链接;
84.对所述多条提取信息中的至少一条所述提取信息按照预设标准进行组合,得到至少一个信息组,每个所述信息组中包括至少一条所述提取信息,其中,每个所述信息组对应有组别标识,每个所述信息组中的每条所述提取信息对应有信息标识;
85.生成新页面并显示,所述新页面中包括至少一个所述信息组;
86.接收目标语音指令,提取所述目标语音指令中的目标组别标识和目标信息标识,根据所述目标组别标识和所述目标信息标识确定目标提取信息,打开所述目标提取信息对应的链接。
87.其中,所所述对所述多条提取信息中的至少一条所述提取信息按照预设标准进行组合之前之前,包括:
88.接收触发语音指令,根据所述触发语音指令确定搜索词;
89.根据所述搜索词在所述多条提取信息中确定用于组合的至少一条所述提取信息。
90.其中,所述对所述多条提取信息中的至少一条所述提取信息按照预设标准进行组合,得到至少一个信息组,包括:
91.对所述多条提取信息中的至少一条所述提取信息进行分类,按照分类结果对所述多条提取信息中的至少一条所述提取信息进行组合,其中,每个所述信息组中的所述提取信息属于同一类。
92.其中,所述对所述多条提取信息中的至少一条所述提取信息按照预设标准进行组合,得到至少一个信息组之后,包括:
93.按照预设规则对同一信息组中的所述提取信息进行排序。
94.其中,所述信息组中的所述提取信息对应的所述信息标识为对所述提取信息进行排序后的序号。
95.其中,所述按照预设规则对同一信息组中的所述提取信息进行排序,包括:
96.获取所述信息组中每条所述提取信息对应的链接的点击量;
97.根据所述点击量对同一信息组中的所述提取信息进行排序。
98.其中,所述按照预设规则对同一信息组中的所述提取信息进行排序,包括:
99.获取历史页面记录,根据所述历史页面记录确定用户行为习惯特征;
100.根据所述用户行为习惯特征对同一信息组中的所述提取信息进行排序。
101.实施例四
102.本发明还提供了一种计算机可读存储介质,该计算机可读存储介质存储有基于信息重组的语音控制程序,该基于信息重组的语音控制程序被处理器执行时,实现上述实施例一的方法的步骤。
103.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。