一种对讲机控制方法及对讲机、存储介质与流程

1.本发明实施例涉及通信领域，特别涉及一种对讲机控制方法及对讲机、存储介质。

背景技术：

2.对讲机是最早被人类使用的无线移动通信设备，早在20世纪30年代就开始得到应用。经过近一个世纪的发展，对讲机的功能已十分完善，对讲机已具有不受网络限制、支持一对一或一对多的通话方式、通话成本低等优点。
3.目前常用的对讲机采用的是半双工通讯方式，即一方讲话时，其他方进行收听。在具体实现上，可通过在对讲机上设置对讲按键完成。即话权人在讲话的时候，按住对讲按键，当话权人结束通话时，再释放该对讲按键即可。对讲按键释放后，其他人也能以同样的方式申请话权并进行讲话。
4.发明人发现现有技术中至少存在如下问题：话权人在讲话时，需要占用一只手来持续操作对讲按键，这对于需要双手作业的操作人员来说使用不方便，甚至会产生安全隐患。

技术实现要素：

5.本发明实施方式的目的在于提供一种对讲机控制方法及对讲机、存储介质，解放使用者的双手，为使用者的人身安全增加保障。
6.为解决上述技术问题，本发明的实施方式提供了一种对讲机控制方法，包括以下步骤：采集语音信息；对语音信息进行语音识别；根据语音信息的语音识别结果，控制对讲机进行对应业务操作；其中，根据语音信息的语音识别结果，控制对讲机进行对应业务操作至少包括：若语音信息的语音识别结果为呼叫，则控制对讲机建立通信并抢占话权。
7.本发明的实施方式还提供了一种对讲机，包括：采集模块，用于采集语音信息；语音识别模块，用于对语音信息进行语音识别；控制模块，用于根据语音信息的语音识别结果，控制对讲机进行对应业务操作；其中，根据语音信息的语音识别结果，控制对讲机进行对应业务操作至少包括：若语音信息的语音识别结果为呼叫，则控制对讲机建立通信并抢占话权。
8.本发明的实施方式还提供了一种对讲机，包括：至少一个处理器；以及，与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行上述的对讲机控制方法。
9.本发明的实施方式还提供了一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时实现上述的对讲机控制方法。
10.本发明实施方式相对于现有技术而言，通过采集语音信息，可以获取用户的语音，通过对采集到的语音信息进行语音识别，可以确定用户发出的到底是什么指令，再根据对该语音信息的识别结果，控制对讲机进行对应业务操作；当语音识别结果为呼叫时，控制对讲机建立通信并抢占话权；使得用户无需手动按键即可直接与被呼叫方通信，从而达到用
户使用语音直接控制对讲机进行对讲业务的效果，解放了用户双手，大大降低了用户在特殊工作场景使用对讲机的人身安全风险。
11.另外，在采集语音信息之前，还包括：获取语音样本数据，其中，语音样本数据用于建立语音识别模型；对语音信息进行语音识别，具体包括：通过语音识别模型对语音信息进行语音识别。本实施方式提供了一种对采集到的语音信息进行语音识别的具体方法，通过语音样本数据的采集和语音识别模型的建立来对当前语音信息进行语音识别，使得语音识别的可信赖程度高，保证了语音识别结果的准确性。
12.另外，上述语音样本数据，至少包括：嘈杂环境语音样本数据、方言语音样本数据。语音样本采集来源包括各种环境，主要是为了模仿用户的实时使用环境，使得在对讲机在各种复杂环境下仍然能够准确收集用户声音。
13.另外，上述通过语音识别模型对语音信息进行语音识别，具体包括：若语音信息与语音识别模型中的预设关键词的匹配程度达到预设阈值，则认为语音信息的识别结果为预设关键词。设定一个预设阈值，只有匹配程度达到预设阈值时才认为语音识别结果为预设关键词，有效把控语音识别模型的准确性。
14.另外，上述根据语音信息的语音识别结果，控制对讲机进行对应业务操作，还包括：若语音信息的识别结果为预设指令，则根据预设指令对应的动作，控制对讲机进行对应业务操作；若语音信息的识别结果为非预设指令，则丢弃语音信息。当语音识别结果为非预设指令时，则说明当前语音信息并不重要，将其丢弃可减少资源浪费。
15.另外，语音信息的频谱在人声频谱范围内。只采集频率在人声范围内的音频，完成了声音信号的第一步过滤，可减轻处理器的数据处理负担。
16.另外，在采集语音信息之前，还包括：判断对讲机是否处于语音控制模式，若是，则再执行采集语音信息。只有在语音控制模式下，对讲机才会去采集语音信息，其他模式下不采集语音信息，可以帮助用户减少不必要的电量损耗。
附图说明
17.一个或多个实施例通过与之对应的附图中的图片进行示例性说明，这些示例性说明并不构成对实施例的限定，附图中具有相同参考数字标号的元件表示为类似的元件，除非有特别申明，附图中的图不构成比例限制。
18.图1是根据本发明第一实施方式提供的对讲机控制方法流程图；
19.图2是根据本发明第二实施方式提供的对讲机控制方法流程图；
20.图3是根据本发明第三实施方式提供的对讲机结构示意图；
21.图4是根据本发明第四实施方式提供的对讲机结构示意图。
具体实施方式
22.为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的各实施方式进行详细的阐述。然而，本领域的普通技术人员可以理解，在本发明各实施方式中，为了使读者更好地理解本技术而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施方式的种种变化和修改，也可以实现本技术所要求保护的技术方案。
23.本发明的第一实施方式涉及一种对讲机控制方法。本实施方式的核心在于采集语
音信息；对语音信息进行语音识别；根据语音信息的语音识别结果，控制对讲机进行对应业务操作。通过采集语音信息，可以获取用户的语音，通过对采集到的语音信息进行语音识别，可以确定用户发出的到底是什么指令，再根据对该语音信息的识别结果，控制对讲机进行对应业务操作，从而达到用户使用语音直接控制对讲机进行对讲业务的效果，解放了用户双手，且大大降低了用户在特殊工作场景使用对讲机的人身安全风险。下面对本实施方式的对讲机控制方法的实现细节进行具体的说明，以下内容仅为方便理解提供的实现细节，并非实施本方案的必须。
24.本实施方式中的对讲机控制方法流程图如图1所示，具体包括以下步骤：
25.步骤101：采集语音信息。
26.具体而言，对讲机中设置有嵌入式语音芯片，语音芯片可对语音信号进行采样、反混叠滤波、语音增强等处理，进而完成语音信息的采集。值得一提的是，本实施例对讲机采集的语音信息，其频谱在人声频谱范围内，也就是说，对讲机采集的音频的频率，通常在500
‑
2000hz(赫兹)之间。本实施例只采集频率在人声范围内的音频，完成了声音信号的第一步过滤，可减轻处理器的数据处理负担。
27.在具体实施中，采集语音信息之前，对讲机还需先判断自身是否处于语音控制模式，若是，则再执行语音信息的采集。只有在语音控制模式下，对讲机才会去采集语音信息，其他模式下不采集语音信息，这样可以进一步减轻处理器的数据处理负担，同时帮助用户减少不必要的电量损耗。在实际实施中，还可设置一个预设时间，若对讲机检测到用户不说话的时间超过了这个预设时间，则释放话权，进一步提高用户体验。
28.步骤102：对语音信息进行语音识别。
29.具体而言，对讲机中可配置语音识别芯片来完成语音识别，在实际实施中，可预先存储一些操作口令，当对讲机检测到用户发出的语音跟某个操作口令相匹配时，则认为用户发出的口令即该操作口令。例如，预先存储“单呼”“组呼”“全呼”这几个操作口令，对讲机中的语音识别芯片可将采集到的语音信息进行解析，并与预先存储的操作口令逐字对比，进而得到与用户发出的语音信息相匹配的操作口令。
30.步骤103：根据语音信息的语音识别结果，控制对讲机进行对应业务操作。
31.具体而言，每个操作口令都有对应的动作，当对讲机得到语音识别结果后，可根据语音识别的结果来确定用户发送的操作口令，再根据该操作口令产生相应的动作。在实际实施中，根据语音信息的语音识别结果，控制对讲机进行对应业务操作至少包括：若语音信息的语音识别结果为呼叫，则控制对讲机建立通信并抢占话权。例如，语音信息的识别结果为“呼叫张三”，对讲机就主动建立呼叫，与张三所使用的对讲机建立通信并抢占话权。
32.在实际实施中，可预先设置一些关键词，若语音信息的识别结果为预设指令(例如，预设指令有“呼叫”“结束”等)，则根据预设指令对应的动作，控制对讲机进行对应业务操作；若语音信息的识别结果为非预设指令，则丢弃语音信息。当语音识别结果为非预设指令时，则说明当前语音信息并不重要，将其丢弃可减少资源浪费。
33.此外，在本实施方式中，采集到的语音信息会被实时扫描并进行语音识别，即用户说一个字就会扫描一个字，而不是等用户发出完整指令后再扫描，实时扫描能够更快得到语音识别结果，提高用户体验。
34.本实施方式相对现有技术而言，通过采集语音信息，可以获取用户的语音，通过对
采集到的语音信息进行语音识别，可以确定用户发出的到底是什么指令，再根据对该语音信息的识别结果，控制对讲机进行对应业务操作，从而达到用户使用语音直接控制对讲机进行对讲业务的效果，解放了用户双手，且大大降低了用户在特殊工作场景使用对讲机的人身安全风险。同时还可提高用户的作业效率。
35.本发明的第二实施方式涉及一种对讲机控制方法。第二实施方式提供了一种具体的对语音信息进行语音识别的方法，本实施方式中的对讲机控制方法流程图如图2所示，具体包括以下步骤：
36.步骤201：获取语音样本数据。
37.具体而言，本实施方式中的对讲机在正式投入使用之前，需要工作人员去各种不同环境中实地采集语音样本数据，这些样本数据至少包括：嘈杂环境语音样本数据、方言语音样本数据。例如，要包括大卡车司机、出租车司机、电力高空作业人员、各种维修人员等的语音样本数据，还要收集四川话、广东话等各地方言的语音样本数据，采集的语音样本数据越丰富，语音识别效果越好。对讲机在获取这些语音样本数据后，即可通过智能语音识别算法，对这些语音样本数据进行训练，进而得到稳健的语音识别模型。本实施例中语音样本采集来源包括各种环境，主要是为了模仿用户的实时使用环境，使得在对讲机在各种复杂环境下仍然能够准确收集用户声音。
38.步骤202：采集语音信息。
39.步骤202与第一实施方式中的步骤101大致相同，为避免重复，这里不再赘述。
40.步骤203：通过语音识别模型对语音信息进行语音识别。
41.具体而言，对讲机对采集到的语音信息进行实时扫描；若语音信息与语音识别模型中的预设关键词的匹配程度达到预设阈值(例如90％)，则认为语音信息的识别结果为预设关键词。设定一个预设阈值，只有匹配程度达到预设阈值时才认为语音识别结果为预设关键词，可有效把控语音识别模型的准确性。
42.步骤204：根据语音信息的语音识别结果，控制对讲机进行对应业务操作。
43.步骤204与第一实施方式中的步骤103大致相同，为避免重复，这里不再赘述。
44.本实施方式与第一实施方式相比，提供了一种对采集到的语音信息进行语音识别的具体方法，通过语音样本数据的采集和语音识别模型的建立来对当前语音信息进行语音识别，使得语音识别的可信赖程度高，保证了语音识别结果的准确性。
45.上面各种方法的步骤划分，只是为了描述清楚，实现时可以合并为一个步骤或者对某些步骤进行拆分，分解为多个步骤，只要包括相同的逻辑关系，都在本专利的保护范围内；对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计，但不改变其算法和流程的核心设计都在该专利的保护范围内。
46.本发明第三实施方式涉及一种对讲机，如图3所示，包括：
47.采集模块301，用于采集语音信息；语音识别模块302，用于对语音信息进行语音识别；控制模块，用于根据语音信息的语音识别结果，控制对讲机进行对应业务操作，其中，根据语音信息的语音识别结果，控制对讲机进行对应业务操作至少包括：若语音信息的语音识别结果为呼叫，则控制对讲机建立通信并抢占话权。。
48.在一个例子中，语音识别模块302还用于获取语音样本数据，其中，语音样本数据用于建立语音识别模型；对语音信息进行语音识别，具体包括：通过语音识别模型对语音信
息进行语音识别。
49.在一个例子中，上述语音样本数据，至少包括：嘈杂环境语音样本数据、方言语音样本数据。
50.在一个例子中，上述通过语音识别模型对语音信息进行语音识别，包括：若语音信息与语音识别模型中的预设关键词的匹配程度达到预设阈值，则认为语音信息的识别结果为预设关键词。
51.在一个例子中，上述根据语音信息的语音识别结果，控制对讲机进行对应业务操作，还包括：若语音信息的识别结果为预设指令，则根据预设指令对应的动作，控制对讲机进行对应业务操作；若语音信息的识别结果为非预设指令，则丢弃语音信息。
52.在一个例子中，语音信息的频谱在人声频谱范围内。
53.在一个例子中，在采集语音信息之前，还包括：判断对讲机是否处于语音控制模式，若是，则再执行采集语音信息。
54.不难发现，本实施方式为与第一实施方式或第二实施方式相对应的系统实施例，本实施方式可与第一实施方式或第二实施方式互相配合实施。第一实施方式或第二实施方式中提到的相关技术细节在本实施方式中依然有效，为了减少重复，这里不再赘述。相应地，本实施方式中提到的相关技术细节也可应用在第一实施方式或第二实施方式中。
55.值得一提的是，本实施方式中所涉及到的各模块均为逻辑模块，在实际应用中，一个逻辑单元可以是一个物理单元，也可以是一个物理单元的一部分，还可以以多个物理单元的组合实现。此外，为了突出本发明的创新部分，本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入，但这并不表明本实施方式中不存在其它的单元。
56.本发明第四实施方式涉及一种对讲机，如图4所示，包括至少一个处理器401；以及，与至少一个处理器401通信连接的存储器器402；其中，存储器器402存储有可被至少一个处理器401执行的指令，指令被至少一个处理器401执行，以使至少一个处理器401能够执行上述的对讲机控制方法。
57.其中，存储器器402和处理器401采用总线方式连接，总线可以包括任意数量的互联的总线和桥，总线将一个或多个处理器401和存储器器402的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件，也可以是多个元件，比如多个接收器和发送器，提供用于在传输介质上与各种其他装置通信的单元。经处理器401处理的数据通过天线在无线介质上进行传输，进一步，天线还接收数据并将数据传送给处理器401。
58.处理器401负责管理总线和通常的处理，还可以提供各种功能，包括定时，外围接口，电压调节、电源管理以及其他控制功能。而存储器器402可以被用于存储处理器401在执行操作时所使用的数据。
59.本发明第五实施方式涉及一种计算机可读存储介质，存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
60.即，本领域技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使
得一个设备(可以是单片机，芯片等)或处理器(processor)执行本技术各个实施例方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read
‑
only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
61.本领域的普通技术人员可以理解，上述各实施方式是实现本发明的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本发明的精神和范围。