首页 > 乐器声学 专利正文
基于人工智能语音识别的配电网调度人机交互方法与流程

时间:2022-01-19 阅读: 作者:专利查询

基于人工智能语音识别的配电网调度人机交互方法与流程

1.本发明属于电力系统配电自动化领域,具体涉及一种基于人工智能语音识别的配电网调度人机交互方法。


背景技术:

2.目前,配电网的调控工作主要是靠人工触控交互实现的。推广智能语音技术在配网调控日常业务的应用,实现智能语音交互、语音文本转换、语音语义分析、语音操作控制等功能,可以提升智能配电网调度系统的智能化水平,提升人机交互效率,增强地区电网的实时调控能力和日常业务处置效率。


技术实现要素:

3.本发明的目的在于提供一种基于人工智能语音识别的配电网调度人机交互方法,该方法有利于提高配网调度处置效率。
4.为实现上述目的,本发明采用的技术方案是:一种基于人工智能语音识别的配电网调度人机交互方法,包括如下步骤:用户端设备采集用户语音请求,并通过解析处理模块进行解析处理;对解析的语音信息进行协议组装,通过接入层输出给智能语音引擎;智能语音引擎将用户的请求进行归一化处理、差异化输出,解析用户请求的真正意图,并将关键信息传输至处理用户意图的后端服务模块;后端服务模块对用户的意图进行处理,并转化成相对应的电网调度操作。
5.进一步地,所述解析处理环节通过声音信号转变模块和噪声处理模块这两个模块进行处理,所述声音信号转变模块用于将语音转化成计算机可识别的格式文件,所述噪声处理模块用于提高语音采集的精准度,进而提取到用户语音包含的特征参数。
6.进一步地,所述声音信号转变模块提取用户语音的步骤如下:首先,进行预处理,包括对输入语音信号进行采样和自动增益控制;其次,将用户声音的特征参数提取出来,包括声波的共振峰、声音的音调;再者,分别采用算法训练和模式库训练对提取的语音的特征参数进行分类处理,完成语音中的语义输出;通过训练学习包括电网存量设备信息、电网安全规范、调度员术语库、配网调度处置章程的知识;最后,进行模式匹配,主要是对所提取的待测语音与模式库语音进行匹配度测试,最终完成语音中的语义输出。
7.进一步地,采用麦克风阵列技术获取用户的声音;所述麦克风阵列为采用两个及以上麦克风按一定规则排列组合,在设定空间对声音进行获取和处理的录音系统;麦克风阵列通过声源定位、波束形成、噪音抑制、抗混响、回声消除、语音增强,有效拾取声音,以提升人工智能语音识别效果,听清用户的语音。
8.进一步地,所述对解析的语音信息的协议组装,通过连接层应用来完成,所述连接
层应用主要负责设备端和云端服务的通信,定义两者之间的通信协议,所述通信协议主要由指令、事件、端状态三个部分组成。
9.进一步地,所述智能语音引擎,用于将多语音源的输入进行归一化处理、差异化输出,以及准确解析用户语音的意图,并将用户的语音请求关键信息输送至具体处理用户意图的后端服务模块。
10.进一步地,所述通过接入层输出给智能语音引擎,其中的接入层主要负责接入和转发用户的语音请求,并且进行全局流量的调度、数据分析,同时还具备安全防御功能;当海量的用户语音请求发生后,为分担云端服务器的压力,负责对用户的语音请求进行负载分发,分担服务器的压力,以确保服务器在高访问情况下不会造成用户请求丢失、响应不及时问题的发生。
11.进一步地,所述后端服务模块主要是电网系统功能的调度模块,用于根据用户语音中的语义需求,结合对电网设备及状态的感知、用户习惯及交互上下文,智能决策调用相关配电网系统完成响应操作。
12.相较于现有技术,本发明具有以下有益效果:将人工智能语音技术引入配网调度日常人机交互场景中,有利于提高智能配电网调度系统的智能化水平,提升日常业务处置效率。通过机器学习与智能交互,实现电网调度全场景协同,将电网设备化繁为简,通过配电主站的海量采集数据获知电网运行态势,加上对用户电网调度的学习记忆,根据调度用户语音请求,预测用户潜在的设备控制需求,适时主动为用户作出提醒与建议,选取一个或多个最优指令作出响应,更好地满足电网调度需求。
附图说明
13.图1是本发明实施例的方法实现流程图。
14.图2是本发明实施例中语音打开线路图的实现流程图。
15.图3是本发明实施例中语音关闭线路图的实现流程图。
16.图4是本发明实施例中语音设备定位的实现流程图图5是本发明实施例中语音设备挂牌的实现流程图。
17.图6是本发明实施例中语音置入业务的实现流程图。
18.图7是本发明实施例中语音开关遥控的实现流程图。
19.图8是本发明实施例中语音设备召测的实现流程图。
20.图9是本发明实施例中语音统计查询的实现流程图。
具体实施方式
21.下面结合附图及实施例对本发明做进一步说明。
22.应该指出,以下详细说明都是示例性的,旨在对本技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本技术所属技术领域的普通技术人员通常理解的相同含义。
23.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包
括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
24.如图1所示,本实施例提供了一种基于人工智能语音识别的配电网调度人机交互方法,包括如下步骤:1、用户端设备采集用户语音请求,并通过解析处理模块进行解析处理。
25.所述解析处理环节通过声音信号转变模块和噪声处理模块这两个模块进行处理,所述声音信号转变模块用于将语音转化成计算机可识别的格式文件,所述噪声处理模块用于提高语音采集的精准度,进而提取到用户语音包含的特征参数。
26.所述声音信号转变模块提取用户语音的步骤如下:首先,进行预处理,包括对输入语音信号进行采样和自动增益控制;其次,将用户声音的特征参数提取出来,包括声波的共振峰、声音的音调等;再者,分别采用算法训练和模式库训练对提取的语音的特征参数进行分类处理,完成语音中的语义输出;根据语音信息中的特征数据:对象、操作描述,不同对象与不同的操作描述组合,分类处理实现不同的操作目的,最终转化成计算机语言;通过训练学习包括电网存量设备信息、电网安全规范、调度员术语库、配网调度处置章程的知识;最后,进行模式匹配,主要是对所提取的待测语音与模式库语音进行匹配度测试,最终完成语音中的语义输出。
27.本发明采用麦克风阵列技术获取用户的声音;所述麦克风阵列为采用两个及以上麦克风按一定规则排列组合,在设定空间对声音进行获取和处理的录音系统;麦克风阵列通过声源定位、波束形成、噪音抑制、抗混响、回声消除、语音增强等算法,有效拾取声音,以提升人工智能语音识别效果,听清用户的语音。
28.2、对解析的语音信息进行协议组装,通过接入层输出给智能语音引擎。
29.所述对解析的语音信息的协议组装,通过连接层应用来完成,主要负责设备端和云端服务的通信,定义两者之间的通信协议,所述通信协议主要由指令、事件、端状态三个部分组成。
30.3、智能语音引擎将用户的请求进行归一化处理、差异化输出,解析用户请求的真正意图,并将关键信息传输至处理用户意图的后端服务模块。
31.所述智能语音引擎,用于将多语音源的输入进行归一化处理、差异化输出,以及准确解析用户语音的意图,并将用户的语音请求关键信息输送至具体处理用户意图的后端服务模块。
32.所述通过接入层输出给智能语音引擎,其中的接入层主要负责接入和转发用户的语音请求,并且进行全局流量的调度、数据分析,同时还具备安全防御功能;当海量的用户语音请求发生后,为分担云端服务器的压力,负责对用户的语音请求进行负载分发,分担服务器的压力,以确保服务器在高访问情况下不会造成用户请求丢失、响应不及时等问题的发生。
33.4、后端服务模块对用户的意图进行处理,并转化成相对应的电网调度操作。
34.所述后端服务模块主要是电网系统功能的调度模块,用于根据用户语音中的语义需求,结合对电网设备及状态的感知、用户习惯及交互上下文,智能决策调用相关配电网系统完成响应操作。
35.本发明基于人工智能语音识别的配电网调度人机交互方法,其具体实施过程如
下:1.人工智能语音识别、语音合成支持语音文本转换功能,采用人工智能领域的机器学习技术,通过对用户口语发音的学习,掌握用户的发音习惯、方言特点、专业领域词汇等信息,将用户说出的一段话(音频)转换成一段文本。
36.(1)语音基本功能,人工智能语音识别支持地市通用语言+专业术语的人工智能语音识别,语音合成。支持智能降噪。用户通过麦克风输入,过滤嘈杂噪音,检测采音距离。支持一次唤醒,连续识别。支持设置唤醒词触发开启语音识别,唤醒后可连续进行多次说话,一段时间不用后语音自动休眠。
37.(2)语音输入法支持语音代替键盘打字,支持语音即时转写,支持语音写文档。
38.(3)语音合成,文字转换语音支持按照当地的语言习惯,将一段文本文字以用户习惯的方式,以音频的形式播放出来。
39.2.语音模型训练采用人工智能领域的机器学习技术,通过对用户口语发音的学习,掌握用户的发音习惯、方言特点,并构建九地市专业模型+语音通用模型识别库,提高常用指令识别准确度,提高各地市设备识别准确度。
40.语音模型训练内容主要包括:1)变电站名称训练2)线路名称训练3)设备名称训练4)设备编号名训练5)操作牌名称训练6)操作意图训练,包括打开(查看、浏览等)图形、关闭图形、设备定位、挂牌、摘牌、置位、解除、遥控、控分、控合、由运行转冷备用等操作票指令、继续操作、撤销操作、结束操作、召测、查询、统计等。操作意图训练旨在识别各个操作意图的关键字段,在实际交互过程中若发现意图识别效果不佳,则可人工再添加语料对模型进行更新,语料的越丰富,则意图就能适应更加多变的语言环境,识别的准确率更高。
41.3.语义解析(1)支持基于语义分析技术,构建语音命令结构化模型,通过分词、关键词检索等处理,将用户的一段话分解成计算机可以理解的语音。
42.(2)多轮对话。语音交互的过程,与用户进行多轮次交互,构建回话情景,一步步获取用户输入的信息,确定用户的操作意图。
43.4.语音转操作功能(1)语音调图支持将音频设备输入的画面调阅语音,主动解析为包含的动作指令和操作内容的语音指令,并转换为画面调阅指令,实现画面调阅业务的语音交互,包括正常调阅图形和关闭图形。
44.本实施例中语音打开线路图的实现流程如图2所示。
45.本实施例中语音关闭线路图的实现流程如图3所示。
46.(2)语音设备定位支持将音频设备输入的设备定位命令,主动解析为包含的动作指令和操作内容的语音指令,并应支持按照设备类型和设备名称匹配的方式,转换为设备定位和打开图形的指令,实现设备定位业务的语音交互,定位设备类型应包括站房、母线、开关、刀闸、配电变压器、表箱等,有多个匹配结果时应支持用户选择。
47.本实施例中语音设备定位的实现流程如图4所示。
[0048] (3) 语音挂牌支持将音频设备输入的设备挂牌语音,主动解析为包含的动作指令和操作内容的语音指令,并转换为挂牌指令,实现挂牌业务的语音交互,包括设备的挂牌和摘牌。
[0049]
本实施例中语音设备挂牌的实现流程如图5所示。
[0050]
(4)语音置位支持将音频设备输入的置入业务语音,主动解析为包含的动作指令和操作内容的语音指令,并转换为置入指令,实现置入业务的语音交互,包括遥信置分、遥信置合、遥测置数等。
[0051]
本实施例中语音置入业务的实现流程如图6所示。
[0052]
(5)语音遥控支持将音频设备输入的开关遥控语音,主动解析为包含的动作指令和操作内容的语音指令,并转换为开关遥控指令,实现开关遥控业务的语音交互,包括对指定开关进行遥控校验、遥控执行等操作。
[0053]
本实施例中语音开关遥控的实现流程如图7所示。
[0054]
(6)语音低压设备召测支持将音频设备输入的统计查询语音,主动解析为包含的动作指令和操作内容的语音指令,并转换为低压设备召测指令,实现设备运行数据召测业务的语音交互,召测命令包括低压开关状态、电表当前电压等。
[0055]
本实施例中语音设备召测的实现流程如图8所示。
[0056]
(7)语音统计查询支持将音频设备输入的统计查询语音,主动解析为包含的动作指令和操作内容的语音指令,并转换为统计查询指令,实现统计查询业务的语音交互,包括打开统计查询总界面、打开统计查询制定界面等操作。
[0057]
本实施例中语音统计查询的实现流程如图9所示。
[0058]
5.语音播报提醒支持通过语音平台将自由组织的文本内容转换成音频文件进行播放。
[0059]
(1)智能闹钟,定时语音提醒,重点信息主动播报,如计划申请“六个时间节点”管控提醒,语音播报引导操作步骤,文档朗读等功能。
[0060]
(2)语音电话下令、合解环操作提醒、应具备知识学习功能,构建电网实时库,将规程、典型操作票导入知识库后,一旦指令票出现误操作具备提醒功能。
[0061]
(3)故障异常信号提醒功能,在故障通知、异常判断、通知巡视、异常处置、进行提
醒。
[0062]
6.语音拟定操作票支持将音频设备输入的拟定操作票命令,主动解析为包含操作步骤、操作设备和操作内容的操作文本,并应支持将操作文本在线发送到智能指令票开票系统。
[0063]
支持根据语音主动识别操作设备,定位设备台账信息有多个识别结果应支持人工选择,操作票最终文本应支持人工编辑。
[0064]
在不影响当前的智能成票系统业务逻辑,以及成熟的网络化下令流程,实现《语音拟定指令项》功能,其目的是为了减轻在智能成票系统中,人工填写指令项的复杂程度,提高操作设备与操作步骤的准确性。
[0065]
7.语音智能交接班支持通过语音录入交接班录音并存储,通过指纹方式识别交接班人员信息并记录在系统,自动生成交接班记录。
[0066]
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。