首页 > 乐器声学 专利正文
一种基于语音识别模块实现大屏切换方法及装置与流程

时间:2022-02-13 阅读: 作者:专利查询

一种基于语音识别模块实现大屏切换方法及装置与流程

1.本技术涉及信息技术领域,涉及到语音识别领域,提供了一种基于语音识别模块实现大屏切换方法及装置。


背景技术:

2.随着我行业务扩展与实力增长,与我行的交流活动也日益增多。其中,作为能够展示我行科技力量的各种大屏也是交流活动中的重要一环。
3.在现今的参观展示模式中,展示的内容是由4张大屏平铺在10块拼接的屏幕之上的。该展示模式有以下缺陷:1、屏幕展示重心不足,由于是多个大屏平铺,所有的信息会同时展露在眼前,若非相关人员的可以引导,参观者无法抓住展示者想要展示的重点;2、展示内容可扩展性低,由于屏幕大小数量因为空间、美观、成本及上述第一点原因,展示的内容只有较少的几张大屏;3、展示大屏替换繁琐,基于第二点原因,若想替换展示内容,需要提前在后台机器上调整大屏的位置,并且需要调试大屏在屏幕上的展示效果。


技术实现要素:

4.本发明主要解决了目前参观过程中展示重点不明,展示内容扩展性低的问题。
5.为了达到上述目的,本发明采用如下技术方案:
6.本发明提供了一种基于语音识别模块实现大屏切换方,包括以下步骤:
7.步骤s1:新增配置文件,配置语音指令包含的关键字与大屏的标题对应关系。
8.步骤s2:配置切换大屏模块,根据输入的大屏标题,该模块会最大化的该大屏,其他的大屏会切换到最小化。
9.步骤s3:增加语音处理模块,通过该模块,将输入的语音识别为文字命令。
10.步骤s4:将语音处理模块识别得到的文字指令与步骤s1中的关键字比对,得到比对结果。若文字指令中包含步骤s1的关键字,则会调用s2的切换大屏模块,切换到对应的大屏,若是不匹配或者识别语音有误,则会调用发送语音“无法识别该指令,请再说一遍!”,重新在接受语音输入,直至识别到正确的语音指令并完成屏幕切换为止。
11.上述技术方案中:所述步骤s1包括以下步骤:
12.步骤1.1:新增一个配置文件,作为关键字和大屏标题的配置,供语音处理模块和屏幕切换模块解析出关键字和大屏切换的标题,为后续步骤得到的语音指令比对和大屏切换的动作起到关联作用。
13.步骤1.2:配置采用.ini文件,对.ini文件添加参数信息。属性名采用key0=value0,key1=value1,key2=value2这种key

value形式配置。key为关键字,在后续步骤中解析出来与语音模块处理得到的语音指令进行比较,value是大屏标题,该参数是大屏切换的唯一标识,再屏幕切换模块中输入解析出来的该参数实现屏幕切换。
14.上述技术方案中:所述步骤s2包括以下步骤:
15.步骤2.1:新建大屏切换模块类,在大屏切换模块引入win32gui模块,该模块可以
根据windows程序的句柄来操作当前运行的程序。而大屏的句柄可以根据浏览器的标题来确认。通过s1中的配置文件得到唯一标题,作为参数传入该模块,可以实现屏幕的最大化及最小化。
16.例如:s1的配置文件配置项为“众易贷=贷款运行大屏_百度搜索

google chrome”。解析出的value为“贷款运行大屏_百度搜索

google chrome”,通过win32gui的findwindow(“贷款运行大屏_百度搜索

google chrome”)函数,可以找到众易贷大屏的句柄,然后调用showwindow方法,实现屏幕的最大化及最小化。
17.上述技术方案中:所述步骤s3包括以下步骤:
18.步骤3.1:新建语音模块,初始化语音模块所需的appid、apikey、apisecret等参数。
19.步骤3.2:创建语音收录类,将输入的语音保存为一个语音文件,名称按时间戳+.wav方式命名。
20.步骤3.3.:新建语音处理模块,将3.2生成的语音文件逐帧发送给云服务处理,返回json格式的报文。
21.步骤3.4:解析3.4返回的json报文,提取报文中的语音文字,得到文字命令。
22.上述技术方案中:所述步骤s4包括以下步骤:
23.步骤4.1:将由步骤s1得到关键字,和步骤s3得到的文字指令进行比对,得到比对结果。
24.步骤4.2:若步骤4.1得到的文字指令包含关键字,则程序会调用大屏切换模块,根据步骤s1配置的关键字与大屏标题的key

value关系,找到对应的大屏标题,作为参数输入大屏切换模块,对应的大屏会最大化显示。
25.步骤4.3:若是步骤4.1的文字指令不包含关键字,则程序会反馈给用户“无法识别该指令,请再说一遍!”,然后再次调用步骤s3中的语音识别模块,识别出新的文字指令再次比对,直至得到包含关键字的正确指令,执行步骤4.2。
26.一种基于语音识别模块实现大屏切换装置,包括以下步骤:
27.配置文件模块:新增配置文件,配置语音指令包含的关键字与大屏的标题对应关系;
28.切换大屏模块:根据输入的大屏标题,该切换大屏会最大化的该大屏,其他的大屏会切换到最小化;
29.语音处理模块:将用户输入的语音识别为文字命令;
30.比对模块:将语音处理模块识别得到的文字指令与配置文件模块中的关键字比对,得到比对结果,若文字指令中包含配置文件模块的关键字,则会调用切换大屏模块,切换到对应的大屏,若是不匹配或者识别语音有误,则会调用发送语音“无法识别该指令,请再说一遍!”,重新在接受语音输入,直至识别到正确的语音指令并完成屏幕切换为止。
31.上述技术方案中配置文件模块实现包括以下步骤:
32.步骤1.1:新增一个配置文件,作为关键字和大屏标题的配置,供语音处理模块和屏幕切换模块解析出关键字和大屏切换的标题,为后续步骤得到的语音指令比对和大屏切换的动作起到关联作用;
33.步骤1.2:配置采用.ini文件,对.ini文件添加参数信息,属性名采用key

value形
式配置,key为关键字,在后续步骤中解析出来与语音模块处理得到的语音指令进行比较,value是大屏标题,该参数是大屏切换的唯一标识,再屏幕切换模块中输入解析出来的该参数实现屏幕切换。
34.上述技术方案中切换大屏模块的实现,包括以下步骤:
35.步骤2.1:新建大屏切换模块类,在大屏切换模块引入win32gui模块,win32gui模块可以根据windows程序的句柄来操作当前运行的程序,而大屏的句柄可以根据浏览器的标题来确认,通过配置文件模块中的配置文件得到唯一标题,作为参数传入该模块,实现屏幕的最大化及最小化。
36.上述技术方案中语音处理模块的实现包括以下步骤:
37.步骤3.1:新建语音模块,初始化语音模块所需的appid、apikey、apisecret参数;
38.步骤3.2:创建语音收录类,将输入的语音保存为一个语音文件,名称按时间戳+.wav方式命名;
39.步骤3.3.:新建语音处理模块,将3.2生成的语音文件逐帧发送给云服务处理,返回json格式的报文;
40.步骤3.4:解析3.4返回的json报文,提取报文中的语音文字,得到文字命令。
41.上述技术方案中比对模块的实现包括以下步骤:
42.步骤4.1:将由步骤s1得到关键字,和语音处理模块得到的文字指令进行比对,得到比对结果;
43.步骤4.2:若步骤4.1得到的文字指令包含关键字,则程序会调用大屏切换模块,根据步骤s1配置的关键字与大屏标题的key

value关系,找到对应的大屏标题,作为参数输入大屏切换模块,对应的大屏会最大化显示;
44.步骤4.3:若是步骤4.1的文字指令不包含关键字,则程序会反馈给用户“无法识别该指令,请再说一遍!”,然后再次调用语音处理模块中的语音识别模块,识别出新的文字指令再次比对,直至得到包含关键字的正确指令,执行步骤4.2。
45.因为本发明采用上述技术方案,因此具备以下有益效果:
46.本技术适用于屏幕演示场景,与ppt演示不同的是,ppt的内容都是固定的,提前编写好的。而大屏场景,数据都是实时的,动态的,当有多个大屏需要顺次展示讲解时,本技术可以实现通过特定的语音指令来切换大屏。
47.本发明通过配置文件,定义了关键字跟大屏标题的关系。通过语音识别出来的文字指令跟关键字的比对结果,找到对应的大屏。可以实现屏幕只展现一个大屏的功能,同时可以根据不同的配置来实现过个大屏的切换。不但可以节约大屏显示的成本,也可以在参观展示的过程中更好的聚焦目标,为对外展示我行有着积极作用。
附图说明
48.图1为本发明流程示意图。
具体实施方式
49.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限
定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
50.本发明提供了一种基于语音识别模块实现大屏切换方,包括以下步骤:
51.步骤s1:新增配置文件,配置语音指令包含的关键字与大屏的标题对应关系。
52.步骤s2:配置切换大屏模块,根据输入的大屏标题,该模块会最大化的该大屏,其他的大屏会切换到最小化。
53.步骤s3:增加语音处理模块,通过该模块,将输入的语音识别为文字命令。
54.步骤s4:将语音处理模块识别得到的文字指令与步骤s1中的关键字比对,得到比对结果。若文字指令中包含步骤s1的关键字,则会调用s2的切换大屏模块,切换到对应的大屏,若是不匹配或者识别语音有误,则会调用发送语音“无法识别该指令,请再说一遍!”,重新在接受语音输入,直至识别到正确的语音指令并完成屏幕切换为止。
55.上述技术方案中:所述步骤s1包括以下步骤:
56.步骤1.1:新增一个配置文件,作为关键字和大屏标题的配置,供语音处理模块和屏幕切换模块解析出关键字和大屏切换的标题,为后续步骤得到的语音指令比对和大屏切换的动作起到关联作用。
57.步骤1.2:配置采用.ini文件,对.ini文件添加参数信息。属性名采用key0=value0,key1=value1,key2=value2这种key

value形式配置。key为关键字,在后续步骤中解析出来与语音模块处理得到的语音指令进行比较,value是大屏标题,该参数是大屏切换的唯一标识,再屏幕切换模块中输入解析出来的该参数实现屏幕切换。
58.上述技术方案中:所述步骤s2包括以下步骤:
59.步骤2.1:新建大屏切换模块类,在大屏切换模块引入win32gui模块,该模块可以根据windows程序的句柄来操作当前运行的程序。而大屏的句柄可以根据浏览器的标题来确认。通过s1中的配置文件得到唯一标题,作为参数传入该模块,可以实现屏幕的最大化及最小化。
60.例如:s1的配置文件配置项为“众易贷=贷款运行大屏_百度搜索

google chrome”。解析出的value为“贷款运行大屏_百度搜索

google chrome”,通过win32gui的findwindow(“贷款运行大屏_百度搜索

google chrome”)函数,可以找到众易贷大屏的句柄,然后调用showwindow方法,实现屏幕的最大化及最小化。
61.上述技术方案中:所述步骤s3包括以下步骤:
62.步骤3.1:新建语音模块,初始化语音模块所需的appid、apikey、apisecret等参数。
63.步骤3.2:创建语音收录类,将输入的语音保存为一个语音文件,名称按时间戳+.wav方式命名。
64.步骤3.3.:新建语音处理模块,将3.2生成的语音文件逐帧发送给云服务处理,返回json格式的报文。
65.步骤3.4:解析3.4返回的json报文,提取报文中的语音文字,得到文字命令。
66.上述技术方案中:所述步骤s4包括以下步骤:
67.步骤4.1:将由步骤s1得到关键字,和步骤s3得到的文字指令进行比对,得到比对结果。
68.步骤4.2:若步骤4.1得到的文字指令包含关键字,则程序会调用大屏切换模块,根
据步骤s1配置的关键字与大屏标题的key

value关系,找到对应的大屏标题,作为参数输入大屏切换模块,对应的大屏会最大化显示。
69.步骤4.3:若是步骤4.1的文字指令不包含关键字,则程序会反馈给用户“无法识别该指令,请再说一遍!”,然后再次调用步骤s3中的语音识别模块,识别出新的文字指令再次比对,直至得到包含关键字的正确指令,执行步骤4.2。
70.本发明还提供了一种基于语音识别模块实现大屏切换装置,包括以下步骤:
71.配置文件模块:新增配置文件,配置语音指令包含的关键字与大屏的标题对应关系;
72.切换大屏模块:根据输入的大屏标题,该切换大屏会最大化的该大屏,其他的大屏会切换到最小化;
73.语音处理模块:将用户输入的语音识别为文字命令;
74.比对模块:将语音处理模块识别得到的文字指令与配置文件模块中的关键字比对,得到比对结果,若文字指令中包含配置文件模块的关键字,则会调用切换大屏模块,切换到对应的大屏,若是不匹配或者识别语音有误,则会调用发送语音“无法识别该指令,请再说一遍!”,重新在接受语音输入,直至识别到正确的语音指令并完成屏幕切换为止。
75.上述技术方案中配置文件模块实现包括以下步骤:
76.步骤1.1:新增一个配置文件,作为关键字和大屏标题的配置,供语音处理模块和屏幕切换模块解析出关键字和大屏切换的标题,为后续步骤得到的语音指令比对和大屏切换的动作起到关联作用;
77.步骤1.2:配置采用.ini文件,对.ini文件添加参数信息,属性名采用key

value形式配置,key为关键字,在后续步骤中解析出来与语音模块处理得到的语音指令进行比较,value是大屏标题,该参数是大屏切换的唯一标识,再屏幕切换模块中输入解析出来的该参数实现屏幕切换。
78.上述技术方案中切换大屏模块的实现,包括以下步骤:
79.步骤2.1:新建大屏切换模块类,在大屏切换模块引入win32gui模块,win32gui模块可以根据windows程序的句柄来操作当前运行的程序,而大屏的句柄可以根据浏览器的标题来确认,通过配置文件模块中的配置文件得到唯一标题,作为参数传入该模块,实现屏幕的最大化及最小化。
80.上述技术方案中语音处理模块的实现包括以下步骤:
81.步骤3.1:新建语音模块,初始化语音模块所需的appid、apikey、apisecret参数;
82.步骤3.2:创建语音收录类,将输入的语音保存为一个语音文件,名称按时间戳+.wav方式命名;
83.步骤3.3.:新建语音处理模块,将3.2生成的语音文件逐帧发送给云服务处理,返回json格式的报文;
84.步骤3.4:解析3.4返回的json报文,提取报文中的语音文字,得到文字命令。
85.上述技术方案中比对模块的实现包括以下步骤:
86.步骤4.1:将由步骤s1得到关键字,和语音处理模块得到的文字指令进行比对,得到比对结果;
87.步骤4.2:若步骤4.1得到的文字指令包含关键字,则程序会调用大屏切换模块,根
据步骤s1配置的关键字与大屏标题的key

value关系,找到对应的大屏标题,作为参数输入大屏切换模块,对应的大屏会最大化显示;
88.步骤4.3:若是步骤4.1的文字指令不包含关键字,则程序会反馈给用户“无法识别该指令,请再说一遍!”,然后再次调用语音处理模块中的语音识别模块,识别出新的文字指令再次比对,直至得到包含关键字的正确指令,执行步骤4.2。