首页 > 乐器声学 专利正文
一种基于命令词识别的交通信号语音交互控制方法与流程

时间:2022-02-15 阅读: 作者:专利查询

一种基于命令词识别的交通信号语音交互控制方法与流程

1.本发明涉及交通信号控制领域,尤其是涉及一种基于命令词识别的交通信号语音交互控制方法。


背景技术:

2.交通信号控制是城市交通中必不可少的重要的控制手段,各城市的交通指挥中心均部署有交通信号控制平台,管控着辖区内越来越多路口的交通信号控制机;在指挥中心,通过交通信号控制平台控制路口的交通信号灯,已成为交警最重要的交通疏导方式,特别是早、晚高峰,操作尤其较多;因此,除了稳定和可靠之外,交通信号控制平台的易用性也显得尤为重要。
3.交通信号控制平台的操作一般鼠标与键盘按键结合的方式,辅助文字或图形交互的方式,供用户进行相关控制的操作;基于该种方式,有些平台的操作按钮隐藏较深、有些平台的操作较容易误操作、有些平台的更新较快等这些都为用户的操作带来了一定的学习成本和不便。
4.例如,一种在中国专利文献上公开的“一种智能化语音交互操作平台及交互方法”,其公告号cn110600009a,包括语音唤醒识别模块、语音识别模块以及交互操作平台,所述语音唤醒识别模块用于获取唤醒语音信号,识别判断唤醒语所对应的语音识别库,激活对应的语音识别库;所述的语音识别模块用于获取用户语音信号,提取信号特征信息,并根据对应的语音识别库比对信号特征信息,输出语音识别结果;所述的交互操作平台用于对用户提供对应的接口,针对不同场景、不同地点信息进行不同方式的对接,实现语音交互最终的控制;上述技术方案唤醒方式为语音唤醒,这种方式在实际运用中,由于外界的干扰,存在一定机率的误识别或误唤醒,甚至误操作;语音的识别采用全语音分析,再提取和比对信号特征信息或语音文字信息,这样不但会增加识别的运算量,而且外界不必要的噪音或用户操作之外语音也无法过滤,增加误识别的概率,进而增加不确定性,而交通信号控制是一个涉及到路口安全的较严肃的系统,且操作的环境存在一定的用户与用户之间的交流干扰及外界噪音,语音的准确识别就变得更加困难。


技术实现要素:

5.本发明的目的在于克服现有技术受外界噪音干扰大、用户的学习成本高、语音识别的准确率低的问题,提供了一种基于命令词识别的交通信号语音交互控制方法,可以减少用户的学习成本和按键操作,便于用户的操作,采用确定的命令词语音进行命令词识别,提高了识别的准确率。
6.为了实现上述目的,本发明采用以下技术方案:一种基于命令词识别的交通信号语音交互控制方法,包括以下步骤:s1:配置系统的唤醒、操作、执行和休眠命令词;s2:客户机通过连接的麦克风接收语音,同时订阅服务器的反馈信息;
s3:客户机采用命令词语音识别技术,识别出命令文字;s4:客户机将命令文字进行加密,将信息发送给服务器;s5:服务器接收到信息后解密,然后对解密后的命令文字进行判断是否为执行命令词,如果是,转入s6,否则转到s7;s6:服务器根据时间顺序组合接收到的命令词,根据命令词的内容,执行相应的监视、控制、分析和取消等处理操作,并进行记录;s7:服务器根据接收到的唤醒、休眠、操作、执行命令词,以及执行操作的结果信息进行处理并反馈加密信息给客户机;s8:客户机根据服务器反馈的信息解密,并结合实时的路口运行信息,进行相应的文字图形显示,反馈命令词信息以及具体操作的执行过程和结果,辅助用户交互。
7.本发明针对交通信号控制,提出了一种命令词设计和处理方案,采用命令词识别的语音识别,可以与确定的命令词进行比对,减少了识别的任意性,可提高语音识别的准确率;并且,在基于语音交互的基础上,辅助键盘按键,可以有效减少干扰,进一步提高语音识别的准确率,减少误操作,增加平台操作的安全性,进而提高用户的体验,在用户成功登录控制平台后,基于命令词识别技术,用户可以对着麦克风通过边按功能键边语音的方式,首先说出唤醒命令词,控制平台对人机交互语音助手进行唤醒,然后在提示的方式下,说出操作的相关命令词,控制平台对相关命令词进行组装、展现,最后再说出执行命令词确认是否执行,如果执行,则控制平台即可根据操作的命令词,自动执行相关的控制操作和展示。如果说出休眠命令词,则人机交互语音助手将会退出。
8.作为优选,所述步骤s3中命令词语音识别技术基于bayes法则,根据特征帧序列o={o1,o2,

,o
t
},穷举所有可能的token序列w,获取后验概率最大的序列w
*
={w1,w2,

,w
n
},即:式中,w
*
表示验概率最大的序列,w表示字序列,o表示帧序列,ω表示所有可能的token序列;根据bayes公式,而求最优w过程与p(o)无关,因此有:式中,w
*
表示验概率最大的序列,w表示字序列,o表示帧序列,ω表示所有可能的token序列,p(o|w)表示声学模型,p(w)表示先验概率语音模型;为了让语音识别更加模块化,进一步细化建模单元为音节,增加词典模型p(v|w),即:式中,w
*
表示验概率最大的序列,w表示字序列,o表示帧序列,ω表示所有可能的token序列,p(v|w)为词典模型,v表示音节,r(w)表示字序列w所有可能发音序列。
9.作为优选,所述步骤s2具体包括以下步骤:
s21:如果客户机按下功能键,用户对着麦克风发出命令词指令,转到s22;s22:客户机开始接收语音,并采集用户发出的命令词指令语音;s23:如果客户机功能键弹起,则转到s24,否则继续s22;s24:客户机停止接收语音,将采集的声音片段传给s3进行命令词语音识别。
10.作为优选,所述步骤s7具体包括以下步骤:s71:如果为唤醒命令词,则操作命令词标识置为有效,并发布加密后的唤醒反馈信息;s72:如果为操作命令词,且操作命令词标识有效,则组装操作命令词,并发布加密后的收到的信息内容及后续内容的提示的反馈信息;s73:如果为开始执行命令词,且操作命令词标识有效,则清空操作命令词,并发布加密后的执行的结果信息及后续内容的提示的反馈信息;s74:如果为取消执行命令词,且操作命令词标识有效,则清空操作命令词,并发布加密后的后续内容的提示的反馈信息;s75:如果为休眠命令词,且操作命令词标识有效,则操作命令词标识置为无效,清空操作命令词,并发布加密后的休眠反馈信息;s76:如果操作命令词标识有效,且收到有效命令词的时间间隔超时,则操作命令词标识置为无效,并发布加密后的休眠反馈信息。
11.作为优选,所述唤醒命令词为语音识别功能的入口,并触发后续的语音识别功能。
12.作为优选,所述操作命令词包括监视、控制的操作命令,操作命令长的操作命令词采用分段设计。
13.作为优选,所述功能键被按住时,系统接收语音,弹起该功能键时停止接收语音。
14.因此,本发明有如下有益效果:1.采用确定的命令词语音,进行命令词识别,可提高识别的准确率;2.通过边按键边语音、结合交互提示的方式,可以有效防止用户的误操作;3.基于语音交互,可以减少用户的学习成本和按键操作,便于用户的操作。
附图说明
15.图1是语音信号交互控制平台处理流程;
13.图2是语音信号采集流程。
具体实施方式
16.下面结合附图与具体实施方式对本实施例做进一步的描述。
17.图1为语音信号交互控制平台处理流程,包括以下步骤:s1:配置系统的唤醒、操作、执行和休眠命令词;s2:客户机通过连接的麦克风接收语音,同时订阅服务器的反馈信息;s3:客户机采用命令词语音识别技术,识别出命令文字;s4:客户机将命令文字进行加密,将信息发送给服务器;s5:服务器接收到信息后解密,然后对解密后的命令文字进行判断是否为执行命令词,如果是,转入s6,否则转到s7;
s6:服务器根据时间顺序组合接收到的命令词,根据命令词的内容,执行相应的监视、控制、分析和取消等处理操作,并进行记录;s7:服务器根据接收到的唤醒、休眠、操作、执行命令词,以及执行操作的结果信息进行处理并反馈加密信息给客户机;s8:客户机根据服务器反馈的信息解密,并结合实时的路口运行信息,进行相应的文字图形显示,反馈命令词信息以及具体操作的执行过程和结果,辅助用户交互。
18.图2为语音信号采集流程,即上述语音信号交互控制平台处理流程中的步骤s2,具体包括以下步骤:s21:如果客户机按下功能键,用户对着麦克风发出命令词指令,转到s22;s22:客户机开始接收语音,并采集用户发出的命令词指令语音;s23:如果客户机功能键弹起,则转到s24;否则继续s22;s24:客户机停止接收语音,将采集的声音片段传给s3进行命令词语音识别。
19.所述步骤s7具体包括以下步骤:s71:如果为唤醒命令词,则操作命令词标识置为有效,并发布加密后的唤醒反馈信息;s72:如果为操作命令词,且操作命令词标识有效,则组装操作命令词,并发布加密后的收到的信息内容及后续内容的提示的反馈信息;s73:如果为开始执行命令词,且操作命令词标识有效,则清空操作命令词,并发布加密后的执行的结果信息及后续内容的提示的反馈信息;s74:如果为取消执行命令词,且操作命令词标识有效,则清空操作命令词,并发布加密后的后续内容的提示的反馈信息;s75:如果为休眠命令词,且操作命令词标识有效,则操作命令词标识置为无效,清空操作命令词,并发布加密后的休眠反馈信息;s76:如果操作命令词标识有效,且收到有效命令词的时间间隔超时,则操作命令词标识置为无效,并发布加密后的休眠反馈信息。
20.对于各类命令词,需要设计简洁,具体定义如下:唤醒命令词:作为语音识别功能的入口,用于触发后续的语音识别功能;操作命令词:具体的用于监视、控制、分析等的操作命令,如果有些操作命令较长,可以分段设计;执行命令词:操作命令词完成后,用户可以通过该命令词进行操作的执行或取消;休眠命令词:用于关闭语音识别功能;语音接收功能键:可以采用键盘的某个不常用的按键,当按住该按键时,系统接收语音,弹起该按键时停止接收语音。
21.交通信号控制是城市交通中必不可少的重要的控制手段,交通信号控制系统是一个涉及安全的控制系统。针对信号的控制操作,一般比较固定,比较适合基于命令词的语音交互控制。结合用户实际的操作,可以对命令词进行如下设计:唤醒:xx,你好或xx,xx休眠:xx,再见操作和执行的命令词,以用户常用操作为例设计如表格1所示:
表格1
人机交互全流程如下:s01:用户按下功能键并对准麦克风说出唤醒命令词,说完后,弹起功能键,控制平台跳出人机交互语音助手功能界面(以下简称:语音助手),并进行后续操作提示;s02:控制平台侦听功能键是否按下,如果未按下,转到步骤s03;s03:人机交互语音助手判断是否超时,如果超时,转到步骤s011;否则,转到步骤s02;s04:用户按下功能键并对准麦克风说出操作命令词,然后控制平台对操作或执行命令词进行判断;s05:如果是监视操作命令词手动干预列表,则控制平台打开所有处于手动状态下的路口,并在语音助手进行后续操作提示。用户可以查看所有处于手动状态下的路口,让用户做到心中有数。用户可以对该列表中处于手动状态下的路口进行操作;s06:如果是监视操作命令词<路口名称>,则控制平台打开路口监视窗口,直观呈现路口的实时运行状态,以及路口的交通流、交通评价、交通控制评价、交通趋势、方案推荐等分析信息,并在语音助手进行后续操作提示;用户可以基于该路口进行该路口的控制操作;s07:如果是控制操作命令词,则控制平台组装各控制子命令词为控制命令词,并在语音助手进行后续操作提示;s08:如果是执行命令词开始执行,则平台判断控制命令词是否完整,如果不完整,则清空控制命令词并在语音助手进行后续操作提示,转到步骤s04;如果完整,则平台执行命令,并在语音助手进行反馈提示;s09:如果是执行命令词取消执行,则平台清空控制命令词,并在语音助手进行后续操作提示;s010:如果是休眠命令词,则转到s011;s011:语音助手退出。
22.命令词语音识别技术基于bayes法则,根据特征帧序列o={o1,o2,

,o
t
},穷举所有可能的token序列w,获取后验概率最大的序列w
*
={w1,w2,

,w
n
},即:
式中,w
*
表示验概率最大的序列,w表示字序列,o表示帧序列,ω表示所有可能的token序列;根据bayes公式,而求最优w过程与p(o)无关,因此有:式中,w
*
表示验概率最大的序列,w表示字序列,o表示帧序列,ω表示所有可能的token序列,p(o|w)表示声学模型,p(w)表示先验概率语音模型;为了让语音识别更加模块化,进一步细化建模单元为音节,增加词典模型p(v|w),即:式中,w
*
表示验概率最大的序列,w表示字序列,o表示帧序列,ω表示所有可能的token序列,p(||w)为词典模型,v表示音节,r(w)表示字序列w所有可能发音序列。
23.在命令词语音识别技术的实现上,我们采用最大概率的一个发音序列来近似上式,并取log,即:对于每个序列w,根据语音模型求p(w),然后根据命令词求最大概率的序列v的得分p(v|w),再声学模型得到该发音序列v的声学得分p(o|v),汇总得分后取得分最高的一个序列即为w
*
17.本发明的工作过程如下:在用户成功登录控制平台后,基于命令词识别技术,用户可以对着麦克风通过边按功能键边语音的方式,首先说出唤醒命令词,控制平台对人机交互语音助手进行唤醒,然后在提示的方式下,说出操作的相关命令词,控制平台对相关命令词进行组装、展现,最后再说出执行命令词确认是否执行,如果执行,则控制平台即可根据操作的命令词,自动执行相关的控制操作和展示。如果说出休眠命令词,则人机交互语音助手将会退出。
24.本发明并不限于上文描述的实施方式,以上所述仅是本发明的较佳实施例,并不用以限制本发明。凡是依据本发明的技术实质所作的任何修改、等同变换、改进等,均属于本发明所要求的保护范围。