一种音频数据的加密方法及装置与流程

1.本技术涉及音频数据处理技术领域，具体而言，涉及一种音频数据的加密方法及装置。

背景技术：

2.音频数据的应用领域较多，因而，在基于音频采集设备采集到音频数据之后，可以将音频数据传输给需要的设备加以应用。但是，经发明人研究发现，在现有技术中，存在音频数据的安全性不高的问题。

技术实现要素：

3.有鉴于此，本技术的目的在于提供一种音频数据的加密方法及装置，以改善现有技术中存在的音频数据的安全性不高的问题。
4.为实现上述目的，本技术实施例采用如下技术方案：
5.一种音频数据的加密方法，对获取的待处理音频数据进行处理得到对应的目标音频帧，其中，所述待处理音频数据包括多帧待处理音频帧，且所述待处理音频帧基于通信连接的音频采集设备对目标区域具有的声源进行信息采集得到；
6.确定是否需要对所述目标音频帧进行加密处理；
7.若确定需要对所述目标音频帧进行加密处理，则基于目标加密规则对所述目标音频帧进行加密处理，得到对应的加密音频帧。
8.在一种可能的实施例中，在上述音频数据的加密方法中，所述确定是否需要对所述目标音频帧进行加密处理的步骤，包括：
9.获取所述音频采集设备的设备身份，得到对应的设备身份信息，并获取所述目标区域的区域标识，得到对应的区域标识信息，其中，所述设备身份信息和所述区域标识信息基于所述音频数据处理设备在得到所述目标音频帧之后，请求所述音频采集设备发送得到；
10.确定所述设备身份信息是否属于预先配置的目标设备身份信息，并确定所述区域标识信息是否属于预先配置的目标区域标识信息，其中，所述目标设备身份信息至少为一个，所述目标区域标识信息至少为一个；
11.若确定所述设备身份信息不属于所述目标设备身份信息，且确定所述区域标识信息不属于所述目标区域标识信息，则确定不需要对所述目标音频帧进行加密处理。
12.在一种可能的实施例中，在上述音频数据的加密方法中，所述确定是否需要对所述目标音频帧进行加密处理的步骤，还包括：
13.若确定所述设备身份信息属于所述目标设备身份信息，和/或，确定所述区域标识信息属于所述目标区域标识信息，则基于预先训练得到的语音文本转换模块对所述目标音频帧进行转换处理，得到对应的目标文本，其中，所述语音文本转换模块基于样本数据对神经网络模型进行训练得到；
14.对所述目标文本进行关键词识别处理，以确定所述目标文本中是否包含有至少一个预先配置的目标关键词；
15.若所述目标文本中包含有至少一个所述目标关键词，则确定需要对所述目标音频帧进行加密处理；
16.若所述目标文本中未包含有至少一个所述目标关键词，则确定所述目标文本中是否包含有所述目标关键词的关联词语；
17.若所述目标文本中未包含有所述关联词语，则确定不需要对所述目标音频帧进行加密处理；
18.若所述目标文本中包含有所述关联词语，则统计所述关联词语的数量，得到对应的第一词语数量，并确定所述第一词语数量在所述目标文本中的词语占比，得到对应的第一词语占比信息；
19.确定所述第一词语占比信息与预先配置的词语占比阈值信息之间的大小关系，并在所述第一词语占比信息大于所述词语占比阈值信息时，确定需要对所述目标音频帧进行加密处理，在所述第一词语占比信息小于或等于所述词语占比阈值信息时，确定不需要对所述目标音频帧进行加密处理。
20.在一种可能的实施例中，在上述音频数据的加密方法中，所述若确定需要对所述目标音频帧进行加密处理，则基于目标加密规则对所述目标音频帧进行加密处理，得到对应的加密音频帧的步骤，包括：
21.若确定需要对所述目标音频帧进行加密处理，则确定所述目标音频帧的安全程度，得到对应的第一安全程度等级信息；
22.基于所述第一安全程度等级信息在预先确定的多种加密规则中确定出目标加密规则，其中，不同所述加密规则对应的解密难度不同；
23.基于确定的所述目标加密规则对所述目标音频帧进行加密处理，得到对应的加密音频帧。
24.在一种可能的实施例中，在上述音频数据的加密方法中，述若确定需要对所述目标音频帧进行加密处理，则确定所述目标音频帧的安全程度，得到对应的第一安全程度等级信息的步骤，包括：
25.若确定需要对所述目标音频帧进行加密处理，则获取所述音频采集设备的设备身份，得到对应的设备身份信息，并获取所述目标区域的区域标识，得到对应的区域标识信息，其中，所述设备身份信息和所述区域标识信息基于所述音频数据处理设备在得到所述目标音频帧之后，请求所述音频采集设备发送得到；
26.基于所述设备身份信息和所述区域标识信息确定所述目标音频帧的安全程度，得到对应的第一安全程度等级信息。
27.在一种可能的实施例中，在上述音频数据的加密方法中，所述若确定需要对所述目标音频帧进行加密处理，则确定所述目标音频帧的安全程度，得到对应的第一安全程度等级信息的步骤，包括：
28.若确定需要对所述目标音频帧进行加密处理，则基于预先训练得到的语音文本转换模块对所述目标音频帧进行转换处理，得到对应的目标文本，其中，所述语音文本转换模块基于样本数据对神经网络模型进行训练得到；
29.对所述目标文本进行关键词识别处理，以确定所述目标文本中包含的目标关键词的数量占比；
30.基于所述数量占比确定所述目标音频帧的安全程度，得到对应的第一安全程度等级信息，其中，所述数量占比与所述第一安全程度等级信息之间具有正相关关系。
31.在一种可能的实施例中，在上述音频数据的加密方法中，所述基于确定的所述目标加密规则对所述目标音频帧进行加密处理，得到对应的加密音频帧的步骤，包括：
32.确定所述目标加密规则中包括的至少一个加密设备的设备数量和每一个所述加密设备的加密设备地址信息，其中，每一个所述加密设备分别与所述音频数据处理设备通信连接；
33.基于所述设备数量将所述目标音频帧分割为对应数量的音频帧部分，得到至少一个所述音频帧部分；
34.分别基于每一个所述加密设备的加密设备地址信息，将每一个所述音频帧部分发送给其中一个所述加密设备进行加密处理，并分别获取加密后的音频帧部分，以得到加密音频帧。
35.本技术还提供一种音频数据的加密装置，应用于音频数据处理设备，所述音频数据的加密装置包括：
36.音频帧处理模块，用于对获取的待处理音频数据进行处理得到对应的目标音频帧，其中，所述待处理音频数据包括多帧待处理音频帧，且所述待处理音频帧基于通信连接的音频采集设备对目标区域具有的声源进行信息采集得到；
37.加密确定模块，用于确定是否需要对所述目标音频帧进行加密处理；
38.音频帧加密模块，用于若确定需要对所述目标音频帧进行加密处理，则基于目标加密规则对所述目标音频帧进行加密处理，得到对应的加密音频帧。
39.在一种可能的实施例中，在上述音频数据的加密装置中，所述加密确定模块具体用于：
40.获取所述音频采集设备的设备身份，得到对应的设备身份信息，并获取所述目标区域的区域标识，得到对应的区域标识信息，其中，所述设备身份信息和所述区域标识信息基于所述音频数据处理设备在得到所述目标音频帧之后，请求所述音频采集设备发送得到；
41.确定所述设备身份信息是否属于预先配置的目标设备身份信息，并确定所述区域标识信息是否属于预先配置的目标区域标识信息，其中，所述目标设备身份信息至少为一个，所述目标区域标识信息至少为一个；
42.若确定所述设备身份信息不属于所述目标设备身份信息，且确定所述区域标识信息不属于所述目标区域标识信息，则确定不需要对所述目标音频帧进行加密处理。
43.在一种可能的实施例中，在上述音频数据的加密装置中，所述音频帧加密模块具体用于：
44.若确定需要对所述目标音频帧进行加密处理，则确定所述目标音频帧的安全程度，得到对应的第一安全程度等级信息；
45.基于所述第一安全程度等级信息在预先确定的多种加密规则中确定出目标加密规则，其中，不同所述加密规则对应的解密难度不同；
46.基于确定的所述目标加密规则对所述目标音频帧进行加密处理，得到对应的加密音频帧。
47.本技术提供的一种音频数据的加密方法及装置，在得到目标音频帧之后，可以先确定是否需要对目标音频帧进行加密处理，以在需要进行加密处理时，基于目标加密规则对目标音频帧进行加密处理，使得相较于不对音频帧进行加密处理就进行存储、传输的常规技术方案，可以具有更高的安全性，从而改善现有技术中存在的音频数据的安全性不高的问题。
48.为使本技术的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。
附图说明
49.图1为本技术实施例提供的音频数据的加密方法包括的各步骤的流程示意图。
50.图2为图1中步骤130包括的各步骤的流程示意图。
具体实施方式
51.为使本技术实施例的目的、技术方案和优点更加清楚，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例只是本技术的一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
52.因此，以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围，而是仅仅表示本技术的选定实施例。基于本技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
53.本技术实施例提供了一种音频数据处理设备。其中，所述音频数据处理设备可以包括存储器和处理器。
54.详细地，所述存储器和处理器之间直接或间接地电性连接，以实现数据的传输或交互。例如，相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述存储器中可以存储有至少一个可以以软件或固件(firmware)的形式，存在的软件功能模块(计算机程序)。所述处理器可以用于执行所述存储器中存储的可执行的计算机程序，从而实现本技术实施例(如后文所述)提供的音频数据的加密方法。
55.可选地，所述存储器可以是，但不限于，随机存取存储器(random access memory，ram)，只读存储器(read only memory，rom)，可编程只读存储器(programmable read
‑
only memory，prom)，可擦除只读存储器(erasable programmable read
‑
only memory，eprom)，电可擦除只读存储器(electric erasable programmable read
‑
only memory，eeprom)等。所述处理器可以是一种通用处理器，包括中央处理器(central processing unit，cpu)、网络处理器(network processor，np)、片上系统(system on chip，soc)等；还可以是数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
56.可以理解的是，在一种可以替代的示例中，所述音频数据处理设备可以是一种具
备数据处理能力的服务器。例如，在一种可以替代的示例中，所述音频数据处理设备可以用于：
57.对获取的待处理音频数据进行处理得到对应的目标音频帧，其中，所述待处理音频数据包括多帧待处理音频帧，且所述待处理音频帧基于通信连接的音频采集设备对目标区域具有的声源进行信息采集得到；确定是否需要对所述目标音频帧进行加密处理；若确定需要对所述目标音频帧进行加密处理，则基于目标加密规则对所述目标音频帧进行加密处理，得到对应的加密音频帧。
58.如图1所示，本技术实施例还提供一种音频数据的加密方法，可应用于上述音频数据处理设备。其中，所述音频数据的加密方法有关的流程所定义的方法步骤，可以由所述音频数据处理设备实现。
59.下面将对图1所示的具体流程，进行详细阐述。
60.步骤110，对获取的待处理音频数据进行处理得到对应的目标音频帧。
61.在本实施例中，所述音频数据处理设备可以先对获取的待处理音频数据进行处理得到对应的目标音频帧。
62.其中，所述待处理音频数据可以包括多帧待处理音频帧，且所述待处理音频帧可以基于通信连接的音频采集设备对目标区域具有的声源进行信息采集得到。
63.步骤120，确定是否需要对所述目标音频帧进行加密处理。
64.在本实施例中，在基于步骤110得到所述目标音频帧之后，所述音频数据处理设备可以确定是否需要对所述目标音频帧进行加密处理。
65.其中，若确定需要对所述目标音频帧进行加密处理，可以执行步骤130。如确定不需要对所述目标音频帧进行加密处理，可以直接执行后续的步骤，如保存或传输等。
66.步骤130，基于目标加密规则对所述目标音频帧进行加密处理，得到对应的加密音频帧。
67.在本实施例中，在基于步骤120确定需要对所述目标音频帧进行加密处理之后，所述音频数据处理设备可以基于目标加密规则对所述目标音频帧进行加密处理，得到对应的加密音频帧。
68.基于上述方法，在得到目标音频帧之后，可以先确定是否需要对目标音频帧进行加密处理，以在需要进行加密处理时，基于目标加密规则对目标音频帧进行加密处理，使得相较于不对音频帧进行加密处理就进行存储、传输的常规技术方案，可以具有更高的安全性，从而改善现有技术中存在的音频数据的安全性不高的问题。
69.第一方面，对于步骤110需要说明的是，执行步骤110时，可以基于以下步骤(步骤111、步骤112和步骤113)以得到目标音频帧。
70.步骤111，获取通信连接的音频采集设备发送的待处理音频数据。
71.在本实施例中，所述音频数据处理设备可以先获取通信连接的音频采集设备发送的待处理音频数据。
72.其中，所述待处理音频数据可以包括多帧待处理音频帧，所述音频采集设备可以部署于目标区域，用于对所述目标区域具有的声源(人、物或器件等)进行信息采集得到所述待处理音频帧。
73.步骤112，基于预先确定的判断规则确定是否需要对所述待处理音频数据包括的
所述多帧待处理音频帧进行筛选处理。
74.在本实施例中，在基于步骤111获取到所述待处理音频数据之后，所述音频数据处理设备可以基于预先确定的判断规则确定是否需要对所述待处理音频数据包括的所述多帧待处理音频帧进行筛选处理。
75.其中，若确定需要对所述待处理音频数据包括的所述多帧待处理音频帧进行筛选处理，可以执行步骤113。若确定不需要对所述待处理音频数据包括的所述多帧待处理音频帧进行筛选处理，可以将所述多帧待处理音频帧都作为目标音频帧。
76.步骤113，基于预先配置的筛选规则对所述多帧待处理音频帧进行筛选处理，得到对应的目标音频帧。
77.在本实施例中，在基于步骤112确定需要对所述待处理音频数据包括的所述多帧待处理音频帧进行筛选处理之后，所述音频数据处理设备可以基于预先配置的筛选规则对所述多帧待处理音频帧进行筛选处理，如此，可以得到对应的目标音频帧。
78.基于上述步骤，在获取到通信连接的音频采集设备发送的待处理音频数据之后，先基于预先确定的判断规则确定是否需要对待处理音频数据进行筛选处理，且在确定需要对待处理音频数据进行筛选处理，再基于预先配置的筛选规则对待处理音频数据进行筛选处理，得到对应的目标音频帧，使得相较不进行筛选处理或直接进行筛选处理的常规技术方案，由于增加了筛选处理是否进行的判断机制，从而改善现有技术中因不进行筛选处理而导致音频数据处理的效果不佳(如数据量过多)的问题，或直接进行筛选处理而在一定程度上会导致数据出现较大失真。
79.可以理解的是，在一种可以替代的示例中，执行步骤111时，可以基于以下步骤以获取通信连接的音频采集设备发送的待处理音频数据：
80.第一步，判断是否接收到通信连接的音频采集设备发送的原始音频数据，其中，所述原始音频数据基于所述音频采集设备对所述目标区域具有的声源进行信息采集得到，且包括多帧原始音频帧；
81.第二步，若接收到所述音频采集设备发送的所述原始音频数据，则对所述原始音频数据进行校验处理，以确定所述原始音频数据的合法性；
82.第三步，若所述原始音频数据的合法性不满足预先配置的合法条件，则丢弃所述原始音频数据；
83.第四步，若所述原始音频数据的合法性满足预先配置的合法条件，则将所述原始音频数据确定为待处理音频数据，且将所述原始音频数据包括的每一帧所述原始音频帧作为待处理音频帧。
84.可以理解的是，在一种可以替代的示例中，可以基于以下步骤以对所述原始音频数据进行校验处理，以确定所述原始音频数据的合法性：
85.首先，若接收到所述音频采集设备发送的所述原始音频数据，则判断包括所述原始音频数据的音频数据包是否携带有目标标识信息(也就是说，在一种合法的处理中，所述音频采集设备可以将所述原始音频数据和一目标标识信息一起打包形成所述音频数据包，且合法的音频采集设备可以预先获取或配置有正确的目标标识信息)；
86.其次，若所述音频数据包未携带有所述目标标识信息，则确定所述原始音频数据的合法性不满足预先配置的合法条件；
87.然后，若所述音频数据包携带有所述目标标识信息，则对所述目标标识信息进行识别处理，得到所述音频采集设备的设备身份信息(所述设备身份信息可以是设备指纹等唯一性信息)；
88.最后，基于所述设备身份信息和预先确定的合法设备身份集合，对所述原始音频数据进行校验处理，其中，若所述设备身份信息属于所述合法设备身份集合，则确定所述原始音频数据的合法性满足预先配置的合法条件，若所述设备身份信息不属于所述合法设备身份集合，则确定所述原始音频数据的合法性不满足预先配置的合法条件
89.可以理解的是，在另一种可以替代的示例中，也可以基于以下步骤以对所述原始音频数据进行校验处理，以确定所述原始音频数据的合法性：
90.首先，若接收到所述音频采集设备发送的所述原始音频数据，则对所述原始音频数据进行数据量统计处理，得到对应的音频数据量；
91.其次，确定所述音频数据量与预先确定的数据量阈值区间之间的大小关系，其中，所述数据量阈值区间基于所述音频数据处理设备响应对应用户进行的数据量阈值配置操作生成，可以理解的是，合法的音频采集设备可以预先获取或配置有正确的所述数据量阈值区间；
92.然后，若所述音频数据量属于所述数据量阈值区间内，则确定所述原始音频数据的合法性满足预先配置的合法条件；
93.最后，若所述音频数据量不属于所述数据量阈值区间内，则确定所述原始音频数据的合法性不满足预先配置的合法条件。
94.可以理解的是，在一种可以替代的示例中，执行步骤112时，可以基于以下步骤以确定是否需要对所述待处理音频数据包括的所述多帧待处理音频帧进行筛选处理：
95.首先，对接收到的所述音频采集设备发送的原始音频数据(如前所述)进行数据量统计处理，得到对应的音频数据量；
96.其次，确定所述音频数据量与预先确定的第一数据量阈值之间的大小关系，其中，所述第一数据量阈值基于所述音频数据处理设备响应对应用户进行的第一数据量阈值配置操作生成；
97.然后，若所述音频数据量大于所述第一数据量阈值，则确定需要对所述待处理音频数据包括的所述多帧待处理音频帧进行筛选处理。
98.可以理解的是，在一种可以替代的示例中，执行步骤112时，还可以基于以下步骤以确定是否需要对所述待处理音频数据包括的所述多帧待处理音频帧进行筛选处理：
99.若所述音频数据量小于或等于所述第一数据量阈值，则确定不需要对所述待处理音频数据包括的所述多帧待处理音频帧进行筛选处理。
100.可以理解的是，在另一种可以替代的示例中，执行步骤112时，还可以基于以下步骤以确定是否需要对所述待处理音频数据包括的所述多帧待处理音频帧进行筛选处理：
101.第一步，若所述音频数据量小于或等于所述第一数据量阈值，则确定所述待处理音频数据包括的所述多帧待处理音频帧的帧数，得到对应的第一帧数，并确定所述多帧待处理音频帧的时间长度(即第一帧待处理音频帧对应的采集时间与最后一帧音频帧对应的采集时间之间的差值)，得到对应的第一时长；
102.第二步，基于所述第一帧数和所述第一时长确定对应的第一采集频率(如所述第
一帧数除以所述第一时长得到所述第一采集频率)；
103.第三步，确定所述第一采集频率与预先确定的采集频率阈值之间的大小关系，其中，所述采集频率阈值基于所述音频数据处理设备响应对应用户进行的采集频率阈值配置操作生成；
104.第四步，若所述第一采集频率小于或等于所述采集频率阈值(表明相邻音频帧之间的重复度可能不高)，则确定不需要对所述待处理音频数据包括的所述多帧待处理音频帧进行筛选处理；
105.第五步，若所述第一采集频率大于所述采集频率阈值(表明相邻音频帧之间的重复度可能较高)，则确定需要对所述待处理音频数据包括的所述多帧待处理音频帧进行筛选处理。
106.可以理解的是，在一种可以替代的示例中，执行步骤113时，可以基于以下步骤以基于预先配置的筛选规则对所述多帧待处理音频帧进行筛选处理，得到对应的目标音频帧：
107.步骤1131，若确定需要对所述待处理音频数据包括的所述多帧待处理音频帧进行筛选处理，则获取在历史上进行筛选处理时被筛除的音频帧，得到对应的历史音频帧；
108.步骤1132，基于所述历史音频帧对所述多帧待处理音频帧进行筛选处理，得到对应的目标音频帧。
109.可以理解的是，在一种可以替代的示例中，在执行步骤1131时，可以基于以下步骤以获取到所述历史音频帧：
110.若确定需要对所述待处理音频数据包括的所述多帧待处理音频帧进行筛选处理，则获取在历史上最近一次在进行筛选处理时被筛除的音频帧，得到对应的历史音频帧(可以是一帧，也可以是多帧)。
111.可以理解的是，在一种可以替代的示例中，在执行步骤1132时，可以基于以下步骤以基于所述历史音频帧对所述多帧待处理音频帧进行筛选处理，得到对应的目标音频帧：
112.首先，基于每一帧所述待处理音频帧的采集时间，对所述多帧待处理音频帧按照时间从早到晚的顺序进行排序处理，得到对应的待处理音频帧序列，也就是说，在所述待处理音频帧序列中，在前的待处理音频帧的采集时间早于在后的待处理音频帧的采集时间；
113.其次，对所述待处理音频帧序列进行分割处理，得到对应的多个待处理音频帧序列片段，并对每一个所述待处理音频帧序列片段包括的待处理音频帧进行去重筛选处理，得到对应的目标音频帧。
114.可以理解的是，在一种可以替代的示例中，可以基于以下步骤以得到所述目标音频帧：
115.第一步，基于所述待处理音频帧之间的音频能量差异对所述待处理音频帧序列进行分割处理，得到对应的多个待处理音频帧序列片段(如将音频能量差值大于一阈值的相邻两帧待处理音频帧分割到两个相邻的待处理音频帧序列片段中，其中，音频能量的计算方法可以参照相关的现有技术)；
116.第二步，分别计算每一个所述待处理音频帧序列片段中的每一帧待处理音频帧与所述历史音频帧之间在多个维度下音频相似度的平均值(可以理解的是，所述多个维度至少可以包括所述音频能量，还可以包括振幅等)；
117.第三步，分别计算每一个所述待处理音频帧序列片段对应的音频相似度的平均值的和值，得到对应的音频相似度代表值，并在所述多个待处理音频帧序列片段中，将音频相似度代表值最大的预先配置的第一数量个待处理音频帧序列片段作为第一音频帧序列片段，如此，可以得到所述第一数量个第一音频帧序列片段；
118.第四步，在所述多个待处理音频帧序列片段中，确定出音频相似度代表值与各所述音频相似度代表值的平均值之间的差值最小的待处理音频帧序列片段，并将该差值最小的待处理音频帧序列片段对应的音频相似度代表值作为目标代表值；
119.第五步，对所述第一数量个第一音频帧序列片段包括的待处理音频帧按照时间从早到晚的顺序进行排序处理，并重新分割处理，得到至少一个第二音频帧序列片段，其中，重新分割的原则为，使得每一个所述第二音频帧序列片段对应的音频相似度代表值大于或等于所述目标代表值；
120.第六步，将所述第一数量个第一音频帧序列片段以外的其它待处理音频帧序列片段作为第三音频帧序列片段；
121.第七步，基于预先配置的目标对应关系，分别确定每一个所述第二音频帧序列片段和每一个所述第三音频帧序列片段的音频相似度代表值对应的第一表征系数，其中，所述音频相似度代表值与所述第一表征系数之间具有正相关关系，且所述第一表征系数小于1，大于0；
122.第八步，分别计算每一个所述第二音频帧序列片段包括的待处理音频帧的音频能量的平均值，得到对应的能量均值，并分别计算每一个所述第三音频帧序列片段包括的待处理音频帧的音频能量的平均值，得到对应的能量均值；
123.第九步，基于所述第一表征系数，对所述能量均值进行乘积计算(如将一个第二音频帧序列片段对应的能量均值和对应的第一表征系数相乘)，并基于得到的乘积确定每一个所述第二音频帧序列片段和每一个所述第三音频帧序列片段对应的筛选比例信息(其中，乘积与筛选比例信息之间具有正相关关系，如乘积越大，筛选比例信息越大)；
124.第十步，确定每一个所述第二音频帧序列片段和每一个所述第三音频帧序列片段中是否存在重复的待处理音频帧；
125.第十一步，对于存在重复的待处理音频帧的每一个所述第二音频帧序列片段和每一个所述第三音频帧序列片段，基于对应的所述筛选比例信息对重复的待处理音频帧进行筛选(如按照重复的待处理音频帧的数量和所述筛选比例信息确定一个筛选数量，然后，确定一个最接近该筛选数量的整数数量，再选择出该整数数量帧待处理音频帧作为目标音频帧，且至少需要选择出一帧待处理音频帧作为目标音频帧)。
126.可以理解的是，对于不存在重复的待处理音频帧的每一个所述第二音频帧序列片段和每一个所述第三音频帧序列片段，以及重复的待处理音频帧以外的待处理音频帧，可以都作为目标音频帧。
127.第二方面，对于步骤120需要说明的是，执行步骤120时，可以基于以下步骤以确定是否需要对所述目标音频帧进行加密处理：
128.首先，获取所述音频采集设备的设备身份，得到对应的设备身份信息，并获取所述目标区域的区域标识，得到对应的区域标识信息，其中，所述设备身份信息和所述区域标识信息基于所述音频数据处理设备在得到所述目标音频帧之后，请求所述音频采集设备发送
得到；
129.其次，确定所述设备身份信息是否属于预先配置的目标设备身份信息，并确定所述区域标识信息是否属于预先配置的目标区域标识信息，其中，所述目标设备身份信息至少为一个，所述目标区域标识信息至少为一个；
130.然后，若确定所述设备身份信息不属于所述目标设备身份信息，且确定所述区域标识信息不属于所述目标区域标识信息，则确定不需要对所述目标音频帧进行加密处理。
131.可以理解的是，在一种可以替代的示例中，执行步骤120时，还可以基于以下步骤以确定是否需要对所述目标音频帧进行加密处理：
132.第一步，若确定所述设备身份信息属于所述目标设备身份信息，和/或，确定所述区域标识信息属于所述目标区域标识信息，则基于预先训练得到的语音文本转换模块对所述目标音频帧进行转换处理，得到对应的目标文本，其中，所述语音文本转换模块可以基于样本数据对神经网络模型进行训练得到，具体的训练方式可以参照相关的现有技术；
133.第二步，对所述目标文本进行关键词识别处理，以确定所述目标文本中是否包含有至少一个预先配置的目标关键词；
134.第三步，若所述目标文本中包含有至少一个所述目标关键词，则确定需要对所述目标音频帧进行加密处理；
135.第四步，若所述目标文本中未包含有至少一个所述目标关键词，则确定所述目标文本中是否包含有所述目标关键词的关联词语(例如，所述关联词语可以为所述目标关键词的近义词)；
136.第五步，若所述目标文本中未包含有所述关联词语，则确定不需要对所述目标音频帧进行加密处理；
137.第六步，若所述目标文本中包含有所述关联词语，则统计所述关联词语的数量，得到对应的第一词语数量，并确定所述第一词语数量在所述目标文本中的词语占比，得到对应的第一词语占比信息；
138.第七步，确定所述第一词语占比信息与预先配置的词语占比阈值信息之间的大小关系，并在所述第一词语占比信息大于所述词语占比阈值信息时，确定需要对所述目标音频帧进行加密处理，在所述第一词语占比信息小于或等于所述词语占比阈值信息时，确定不需要对所述目标音频帧进行加密处理。
139.第三方面，对于步骤130需要说明的是，执行步骤130时，可以基于以下步骤(如图2所示的步骤131、步骤132和步骤133)以基于目标加密规则对所述目标音频帧进行加密处理，得到对应的加密音频帧：
140.步骤131，若确定需要对所述目标音频帧进行加密处理，则确定所述目标音频帧的安全程度，得到对应的第一安全程度等级信息；
141.步骤132，基于所述第一安全程度等级信息在预先确定的多种加密规则中确定出目标加密规则，其中，不同所述加密规则对应的解密难度不同；
142.步骤133，基于确定的所述目标加密规则对所述目标音频帧进行加密处理，得到对应的加密音频帧。
143.可以理解的是，在一种可以替代的示例中，执行步骤131时，可以基于以下步骤以确定所述目标音频帧的安全程度，得到对应的第一安全程度等级信息：
144.首先，若确定需要对所述目标音频帧进行加密处理，则获取所述音频采集设备的设备身份，得到对应的设备身份信息，并获取所述目标区域的区域标识，得到对应的区域标识信息，其中，所述设备身份信息和所述区域标识信息基于所述音频数据处理设备在得到所述目标音频帧之后，请求所述音频采集设备发送得到；
145.其次，基于所述设备身份信息和所述区域标识信息确定所述目标音频帧的安全程度，得到对应的第一安全程度等级信息(如预先基于不同的设备身份确定有不同的安全程度，以及基于不同的区域标识确定有不同的安全程度，然后，可以将两者的乘积或加权和值作为第一安全程度等级信息)。
146.可以理解的是，在另一种可以替代的示例中，执行步骤131时，也可以基于以下步骤以确定所述目标音频帧的安全程度，得到对应的第一安全程度等级信息：
147.首先，若确定需要对所述目标音频帧进行加密处理，则基于预先训练得到的语音文本转换模块对所述目标音频帧进行转换处理，得到对应的目标文本，其中，所述语音文本转换模块基于样本数据对神经网络模型进行训练得到(如前所述)；
148.其次，对所述目标文本进行关键词识别处理，以确定所述目标文本中包含的目标关键词的数量占比；
149.然后，基于所述数量占比确定所述目标音频帧的安全程度，得到对应的第一安全程度等级信息，其中，所述数量占比与所述第一安全程度等级信息之间具有正相关关系，即所述数量占比越大，对应的所述第一安全程度等级信息越高，反之，所述数量占比越小，对应的所述第一安全程度等级信息越低。
150.可以理解的是，在一种可以替代的示例中，执行步骤133时，可以基于以下步骤以基于确定的所述目标加密规则对所述目标音频帧进行加密处理，得到对应的加密音频帧：
151.首先，确定所述目标加密规则中包括的至少一个加密设备的设备数量和每一个所述加密设备的加密设备地址信息，其中，每一个所述加密设备分别与所述音频数据处理设备通信连接；
152.其次，基于所述设备数量将所述目标音频帧分割为对应数量的音频帧部分，得到至少一个所述音频帧部分，其中，每一个所述音频帧部分至少包括一帧所述目标音频帧；
153.然后，分别基于每一个所述加密设备的加密设备地址信息，将每一个所述音频帧部分发送给其中一个所述加密设备进行加密处理(所述音频帧部分和所述加密设备之间具有一对一的关系)，并分别获取加密后的音频帧部分，以得到加密音频帧。
154.本技术实施例还提供一种音频数据的加密装置，可应用于上述音频数据处理设备。其中，所述音频数据的加密装置可以包括：
155.音频帧处理模块，用于对获取的待处理音频数据进行处理得到对应的目标音频帧，其中，所述待处理音频数据包括多帧待处理音频帧，且所述待处理音频帧基于通信连接的音频采集设备对目标区域具有的声源进行信息采集得到；
156.加密确定模块，用于确定是否需要对所述目标音频帧进行加密处理；
157.音频帧加密模块，用于若确定需要对所述目标音频帧进行加密处理，则基于目标加密规则对所述目标音频帧进行加密处理，得到对应的加密音频帧。
158.所述音频帧处理模块、所述加密取得模块和所述音频帧加密模块的具体作用可以参照前文对步骤110、步骤120和步骤130的解释说明。
159.例如，在一种可以替代的示例中，所述加密确定模块具体用于：
160.获取所述音频采集设备的设备身份，得到对应的设备身份信息，并获取所述目标区域的区域标识，得到对应的区域标识信息，其中，所述设备身份信息和所述区域标识信息基于所述音频数据处理设备在得到所述目标音频帧之后，请求所述音频采集设备发送得到；确定所述设备身份信息是否属于预先配置的目标设备身份信息，并确定所述区域标识信息是否属于预先配置的目标区域标识信息，其中，所述目标设备身份信息至少为一个，所述目标区域标识信息至少为一个；若确定所述设备身份信息不属于所述目标设备身份信息，且确定所述区域标识信息不属于所述目标区域标识信息，则确定不需要对所述目标音频帧进行加密处理。
161.例如，在一种可以替代的示例中，所述音频帧加密模块具体用于：
162.若确定需要对所述目标音频帧进行加密处理，则确定所述目标音频帧的安全程度，得到对应的第一安全程度等级信息；基于所述第一安全程度等级信息在预先确定的多种加密规则中确定出目标加密规则，其中，不同所述加密规则对应的解密难度不同；基于确定的所述目标加密规则对所述目标音频帧进行加密处理，得到对应的加密音频帧。
163.综上所述，本技术提供的一种音频数据的加密方法及装置，在得到目标音频帧之后，可以先确定是否需要对目标音频帧进行加密处理，以在需要对目标音频帧进行加密处理时，基于目标加密规则对目标音频帧进行加密处理，使得相较于不对音频帧进行加密处理就进行存储、传输的常规技术方案，可以具有更高的安全性，从而改善现有技术中存在的音频数据的安全性不高的问题。
164.在本技术实施例所提供的几个实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。另外，在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，电子设备，或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read
‑
only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系
列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
165.以上所述仅为本技术的优选实施例而已，并不用于限制本技术，对于本领域的技术人员来说，本技术可以有各种更改和变化。凡在本技术的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本技术的保护范围之内。