1.本发明涉及数据处理技术领域,具体而言,涉及一种基于数据处理的数据推送方法及系统。
背景技术:2.数据处理技术有着诸多应用,如用于进行数据识别或审核等,例如,在一些应用场景中,需要进行监控,如图像监控和音频监控等。其中,音频监控可以是指,对音频数据进行采集,以进行审核识别等。并且,在进行审核识别之后,对于审核未通过的音频数据还可以发送给其它设备再次进行审核,以保障审核精度。但是,经发明人研究发现,在现有技术中,在将审核未通过的音频数据推送给其它设备时,由于音是基于均匀分配的机制将各音频数据推送给其它设备,如此,可能存在推送效果不佳的问题。
技术实现要素:3.有鉴于此,本发明的目的在于提供一种基于数据处理的数据推送方法及系统,以现有技术中对于音频数据的推送效果不佳的问题。
4.为实现上述目的,本发明实施例采用如下技术方案:
5.一种基于数据处理的数据推送方法,应用于音频数据处理服务器,所述音频数据处理服务器通信连接有多个音频采集设备,所述基于数据处理的数据推送方法包括:
6.对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个待处理音频数据确定为目标音频数据,其中,所述多个音频采集设备中每两个音频采集设备之间的音频采集区域不完全相同,且所述多个待处理音频数据中的每一个所述待处理音频数据包括多帧待处理音频帧;
7.将未审核通过的每一个待处理音频数据确定为待审核音频数据,并在所述待审核音频数据为多个时,确定多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息;
8.基于所述多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息对所述多个待审核音频数据分类,得到对应的至少一个音频数据类,并分别将每一个所述音频数据类包括的待审核音频数据发送给对应的目标音频审核设备再次进行审核处理,以基于对应的所述目标音频审核设备确定所述音频数据类包括的待审核音频数据是否通过审核。
9.在一些优选的实施例中,在上述基于数据处理的数据推送方法中,所述将未审核通过的每一个待处理音频数据确定为待审核音频数据,并在所述待审核音频数据为多个时,确定多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息的步骤,包括:
10.将未审核通过的每一个待处理音频数据确定为待审核音频数据,并统计所述待审核音频数据的数量,得到对应的待审核音频统计数量;
11.确定所述待审核音频统计数量与预先配置的音频统计数量阈值之间的相对大小关系,并在所述待审核音频统计数量大于或等于所述音频统计数量阈值时,基于预先配置的音频相关性确定规则确定多个待审核音频数据之间的音频相关性程度信。
12.在一些优选的实施例中,在上述基于数据处理的数据推送方法中,所述确定所述待审核音频统计数量与预先配置的音频统计数量阈值之间的相对大小关系,并在所述待审核音频统计数量大于或等于所述音频统计数量阈值时,基于预先配置的音频相关性确定规则确定多个待审核音频数据之间的音频相关性程度信息的步骤,包括:
13.确定所述待审核音频统计数量与预先配置的音频统计数量阈值之间的相对大小关系,并在所述待审核音频统计数量大于或等于所述音频统计数量阈值时,针对多个待审核音频数据中的每两个待审核音频数据,分别确定该两个待审核音频数据未通过审核处理的未通过原因信息;
14.针对多个待审核音频数据中的每两个待审核音频数据,对该两个待审核音频数据未通过审核处理的未通过原因信息进行解析处理,得到该两个待审核音频数据中分别存在的至少一帧违规音频帧;
15.针对多个待审核音频数据中的每两个待审核音频数据,基于该两个待审核音频数据中分别存在的所述至少一帧违规音频帧,计算得到该两个待审核音频数据之间的违规相关性程度信息;
16.针对多个待审核音频数据中的每两个待审核音频数据,计算该两个待审核音频数据对应的两个音频采集设备的音频采集区域的区域重合面积;
17.针对多个待审核音频数据中的每两个待审核音频数据,基于该两个待审核音频数据对应的两个音频采集设备的音频采集区域的区域重合面积和该两个待审核音频数据对应的两个音频采集设备的音频采集区域的区域面积,计算得到该两个待审核音频数据之间的区域相关性程度信息;
18.针对多个待审核音频数据中的每两个待审核音频数据,对该两个待审核音频数据之间的所述违规相关性程度信息和所述区域相关性程度信息进行融合处理,得到该两个待审核音频数据之间的音频相关性程度信息。
19.在一些优选的实施例中,在上述基于数据处理的数据推送方法中,所述针对多个待审核音频数据中的每两个待审核音频数据,基于该两个待审核音频数据中分别存在的所述至少一帧违规音频帧,计算得到该两个待审核音频数据之间的违规相关性程度信息的步骤,包括:
20.针对多个待审核音频数据中的每两个待审核音频数据,计算该两个待审核音频数据中的其中一个待审核音频数据对应的每一帧违规音频帧与另一个待审核音频数据对应的每一帧违规音频帧之间的音频相似度,并计算该音频相似度的均值,得到该两个待审核音频数据对应的音频相似度均值;
21.针对多个待审核音频数据中的每两个待审核音频数据,该两个待审核音频数据对应的音频相似度均值,确定为该两个待审核音频数据之间的违规相关性程度信息。
22.在一些优选的实施例中,在上述基于数据处理的数据推送方法中,所述针对多个待审核音频数据中的每两个待审核音频数据,基于该两个待审核音频数据对应的两个音频采集设备的音频采集区域的区域重合面积和该两个待审核音频数据对应的两个音频采集
设备的音频采集区域的区域面积,计算得到该两个待审核音频数据之间的区域相关性程度信息的步骤,包括:
23.针对多个待审核音频数据中的每两个待审核音频数据,确定该两个待审核音频数据对应的两个音频采集设备的音频采集区域的区域面积之间的面积平均值,并计算该两个待审核音频数据对应的两个音频采集设备的音频采集区域的区域重合面积与该面积平均值之间的面积比值;
24.针对多个待审核音频数据中的每两个待审核音频数据,将该两个待审核音频数据对应的所述面积比值,确定为该两个待审核音频数据之间的区域相关性程度信息。
25.在一些优选的实施例中,在上述基于数据处理的数据推送方法中,所述针对多个待审核音频数据中的每两个待审核音频数据,对该两个待审核音频数据之间的所述违规相关性程度信息和所述区域相关性程度信息进行融合处理,得到该两个待审核音频数据之间的音频相关性程度信息的步骤,包括:
26.确定所述违规相关性程度信息和所述区域相关性程度信息分别对应的第一权重系数和第二权重系数,其中,所述第一权重系数大于所述第二权重系数,且所述第一权重系数和所述第二权重系数之和为1;
27.针对多个待审核音频数据中的每两个待审核音频数据,基于所述第一权重系数和所述第二权重系数,对该两个待审核音频数据之间的所述违规相关性程度信息和所述区域相关性程度信息进行加权求和计算,得到该两个待审核音频数据之间的音频相关性程度信息。
28.在一些优选的实施例中,在上述基于数据处理的数据推送方法中,所述基于所述多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息对所述多个待审核音频数据分类,得到对应的至少一个音频数据类,并分别将每一个所述音频数据类包括的待审核音频数据发送给对应的目标音频审核设备再次进行审核处理,以基于对应的所述目标音频审核设备确定所述音频数据类包括的待审核音频数据是否通过审核的步骤,包括:
29.基于所述多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息对所述多个待审核音频数据进行聚类处理,得到所述多个待审核音频数据对应的至少一个音频数据类;
30.针对每一个所述音频数据类,计算该音频数据类包括的待审核音频数据与多个音频审核设备中每一个音频审核设备在历史上审核的历史待审核音频数据的历史违规音频帧的相似度均值;
31.针对每一个所述音频数据类,将该音频数据类对应的相似度均值中具有最大值的相似度均值的音频审核设备,确定为该音频数据类对应的目标音频审核设备,并将该音频数据类包括的每一个待审核音频数据发送给该目标音频审核设备再次进行审核处理,以基于该目标音频审核设备确定该音频数据类包括的每一个待审核音频数据是否通过审核。
32.本发明实施例还提供一种基于数据处理的数据推送系统,应用于音频数据处理服务器,所述音频数据处理服务器通信连接有多个音频采集设备,所述基于数据处理的数据推送系统包括:
33.音频数据审核处理模块,用于对获取的多个音频采集设备采集得到的多个待处理
音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个待处理音频数据确定为目标音频数据,其中,所述多个音频采集设备中每两个音频采集设备之间的音频采集区域不完全相同,且所述多个待处理音频数据中的每一个所述待处理音频数据包括多帧待处理音频帧;
34.音频相关性确定模块,用于将未审核通过的每一个待处理音频数据确定为待审核音频数据,并在所述待审核音频数据为多个时,确定多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息;
35.音频数据推送模块,用于基于所述多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息对所述多个待审核音频数据分类,得到对应的至少一个音频数据类,并分别将每一个所述音频数据类包括的待审核音频数据发送给对应的目标音频审核设备再次进行审核处理,以基于对应的所述目标音频审核设备确定所述音频数据类包括的待审核音频数据是否通过审核。
36.在一些优选的实施例中,在上述基于数据处理的数据推送系统中,所述音频相关性确定模块进一步用于:
37.将未审核通过的每一个待处理音频数据确定为待审核音频数据,并统计所述待审核音频数据的数量,得到对应的待审核音频统计数量;
38.确定所述待审核音频统计数量与预先配置的音频统计数量阈值之间的相对大小关系,并在所述待审核音频统计数量大于或等于所述音频统计数量阈值时,基于预先配置的音频相关性确定规则确定多个待审核音频数据之间的音频相关性程度信息。
39.在一些优选的实施例中,在上述基于数据处理的数据推送系统中,所述音频数据推送模块进一步用于:
40.基于所述多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息对所述多个待审核音频数据进行聚类处理,得到所述多个待审核音频数据对应的至少一个音频数据类;
41.针对每一个所述音频数据类,计算该音频数据类包括的待审核音频数据与多个音频审核设备中每一个音频审核设备在历史上审核的历史待审核音频数据的历史违规音频帧的相似度均值;
42.针对每一个所述音频数据类,将该音频数据类对应的相似度均值中具有最大值的相似度均值的音频审核设备,确定为该音频数据类对应的目标音频审核设备,并将该音频数据类包括的每一个待审核音频数据发送给该目标音频审核设备再次进行审核处理,以基于该目标音频审核设备确定该音频数据类包括的每一个待审核音频数据是否通过审核。
43.本发明实施例提供的一种基于数据处理的数据推送方法及系统,在对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理之后,可以将未审核通过的每一个待处理音频数据确定为待审核音频数据,并在待审核音频数据为多个时确定每两个待审核音频数据之间的音频相关性程度信息,使得可以基于每两个待审核音频数据之间的音频相关性程度信息对多个待审核音频数据分类,得到对应的至少一个音频数据类,并分别将每一个音频数据类包括的待审核音频数据发送给对应的目标音频审核设备再次进行审核处理,如此,由于增加了分别推送待审核音频数据的匹配机制,可以保障推送的效果,从而现有技术中对于音频数据的推送效果不佳的问题。
44.为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
45.图1为本发明实施例提供的音频数据处理服务器的结构框图。
46.图2为本发明实施例提供的基于数据处理的数据推送方法包括的各步骤的流程示意图。
47.图3为本发明实施例提供的基于数据处理的数据推送系统包括的各功能模块的模块示意图。
具体实施方式
48.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
49.因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
50.如图1所示,本发明实施例提供了一种音频数据处理服务器。其中,所述音频数据处理服务器可以包括存储器和处理器。
51.详细地,在一些示例性的实施例中,所述存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述存储器中可以存储有至少一个可以以软件或固件(firmware)的形式,存在的软件功能模块(计算机程序)。所述处理器可以用于执行所述存储器中存储的可执行的计算机程序,从而实现本发明实施例提供的基于数据处理的数据推送方法。
52.可选地,在一些示例性的实施例中,所述存储器可以是,但不限于,随机存取存储器(random access memory,ram),只读存储器(read only memory,rom),可编程只读存储器(programmable read-only memory,prom),可擦除只读存储器(erasable programmable read-only memory,eprom),电可擦除只读存储器(electric erasable programmable read-only memory,eeprom)等。所述处理器可以是一种通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)、片上系统(system on chip,soc)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
53.可选地,在一些示例性的实施例中,图1所示的结构仅为示意,所述音频数据处理服务器还可包括比图1中所示更多或者更少的组件,或具有与图1所示不同的配置,例如,可以包括用于与其它设备(如音频采集设备)进行信息交互的通信单元或通信器件等。
54.结合图2,本发明实施例还提供一种基于数据处理的数据推送方法,可应用于上述音频数据处理服务器。其中,所述基于数据处理的数据推送方法有关的流程所定义的方法
步骤,可以由所述音频数据处理服务器实现,所述音频数据处理服务器通信连接有多个音频采集设备。
55.下面将对图2所示的具体流程,进行详细阐述。
56.步骤s100,对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理。
57.在本发明实施例中,所述音频数据处理服务器可以先执行步骤s100,如此,可以对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理。其中,所述多个音频采集设备中每两个音频采集设备之间的音频采集区域不完全相同,且所述多个待处理音频数据中的每一个所述待处理音频数据包括多帧待处理音频帧。
58.步骤s200,将未审核通过的每一个待处理音频数据确定为待审核音频数据,并在所述待审核音频数据为多个时,确定多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息。
59.在本发明实施例中,所述音频数据处理服务器可以再执行步骤s100之后进一步执行步骤s200,如此,可以将未审核通过的每一个待处理音频数据确定为待审核音频数据,并在所述待审核音频数据为多个时,确定多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息。
60.步骤s300,基于所述多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息对所述多个待审核音频数据分类,得到对应的至少一个音频数据类,并分别将每一个所述音频数据类包括的待审核音频数据发送给对应的目标音频审核设备再次进行审核处理。
61.在本发明实施例中,所述音频数据处理服务器可以再执行步骤s200之后进一步执行步骤s300,如此,可以基于所述多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息对所述多个待审核音频数据分类,得到对应的至少一个音频数据类,并分别将每一个所述音频数据类包括的待审核音频数据发送给对应的目标音频审核设备再次进行审核处理,以基于对应的所述目标音频审核设备确定所述音频数据类包括的待审核音频数据是否通过审核。
62.基于上述的数据推送方法,在对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理之后,可以将未审核通过的每一个待处理音频数据确定为待审核音频数据,并在待审核音频数据为多个时确定每两个待审核音频数据之间的音频相关性程度信息,使得可以基于每两个待审核音频数据之间的音频相关性程度信息对多个待审核音频数据分类,得到对应的至少一个音频数据类,并分别将每一个音频数据类包括的待审核音频数据发送给对应的目标音频审核设备再次进行审核处理,如此,由于增加了分别推送待审核音频数据的匹配机制,可以保障推送的效果,从而现有技术中对于音频数据的推送效果不佳的问题。
63.可选地,在一些示例性的实施例中,上述实施例中的步骤s100可以包括以下的步骤s110、步骤s120和步骤s130,以进行审核处理。
64.步骤s110,分别获取多个音频采集设备中的每一个音频采集设备采集得到的待处理音频数据,得到所述多个音频采集设备对应的多个待处理音频数据。
65.在本发明实施例中,所述音频数据处理服务器可以先执行步骤s110,如此,可以分
别获取多个音频采集设备中的每一个音频采集设备采集得到的待处理音频数据,得到所述多个音频采集设备对应的多个待处理音频数据。其中,所述多个音频采集设备中每两个音频采集设备之间的音频采集区域不完全相同,且每一个所述待处理音频数据包括多帧待处理音频帧。
66.步骤s120,对所述多个待处理音频数据进行筛选处理,得到所述多个待处理音频数据对应的多个筛选音频数据。
67.在本发明实施例中,所述音频数据处理服务器可以再执行步骤s110之后进一步执行步骤s120,如此,可以对所述多个待处理音频数据进行筛选处理,得到所述多个待处理音频数据对应的多个筛选音频数据。其中,所述多个筛选音频数据中的每一个筛选音频数据包括多帧待处理音频帧。
68.步骤s130,对所述多个筛选音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个筛选音频数据确定为目标音频数据。
69.在本发明实施例中,所述音频数据处理服务器可以再执行步骤s120之后进一步执行步骤s130,如此,可以对所述多个筛选音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个筛选音频数据确定为目标音频数据,具体的审核内容如下。
70.基于上述的步骤s110、步骤s120和步骤s130,在获取到多个音频采集设备采集的多个待处理音频数据之后,可以先对多个待处理音频数据进行筛选处理得到对应的多个筛选音频数据,然后,再对多个筛选音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个筛选音频数据确定为目标音频数据,如此,由于在进行审核处理之后,增加了筛选机制,可以在一定程度上角度需要进行审核处理的待处理音频帧的数量,从而改善现有技术中对于音频数据的审核存在资源浪费的问题。
71.可选地,在一些示例性的实施例中,上述实施例中的步骤s110可以包括以下步骤,以得到所述多个音频采集设备对应的多个待处理音频数据:
72.首先,判断是否接收到音频审核监控指令;
73.其次,若判定接收到所述音频审核监控指令,则生成所述音频审核监控指令对应的音频审核监控通知信息,并将所述音频审核监控通知信息发送给所述多个音频采集设备,其中,每一个所述音频采集设备用于基于接收到的所述音频审核监控通知信息对所在的音频采集区域进行音频数据采集,得到对应的待处理音频数据;
74.然后,获取每一个所述音频采集设备基于所述音频审核监控通知信息采集的所述待处理音频数据,得到对应的多个待处理音频数据。
75.可选地,在一些示例性的实施例中,所述若判定接收到所述音频审核监控指令,则生成所述音频审核监控指令对应的音频审核监控通知信息,并将所述音频审核监控通知信息发送给所述多个音频采集设备的步骤,可以包括以下步骤:
76.首先,若判定接收到所述音频审核监控指令,则对所述音频审核监控指令进行解析处理,得到所述多个音频采集设备的设备标识信息;
77.其次,若所述设备标识信息为所述音频采集设备的设备身份信息,则基于所述设备身份信息查找到所述多个音频采集设备的网络地址信息,并基于所述网络地址信息将生成的所述音频审核监控通知信息分别发送给所述多个音频采集设备中的每一个音频采集设备;
78.然后,若所述设备标识信息为所述音频采集设备的网络地址信息,则基于所述网络地址信息将生成的所述音频审核监控通知信息分别发送给所述多个音频采集设备中的每一个音频采集设备。
79.可选地,在一些示例性的实施例中,所述获取每一个所述音频采集设备基于所述音频审核监控通知信息采集的所述待处理音频数据,得到对应的多个待处理音频数据的步骤,可以包括以下步骤:
80.首先,获取每一个所述音频采集设备基于所述音频审核监控通知信息采集并发送的待处理音频数据,得到所述多个音频采集设备对应的多个待处理音频数据,其中,所述多个音频采集设备中的每一个所述音频采集设备用于在基于所述音频审核监控通知采集到时长为目标时长的待处理音频数据之后,发送给所述音频数据处理服务,即每间隔目标时长发送一次。
81.可选地,在一些示例性的实施例中,上述实施例中的步骤s120可以包括以下步骤,以得到所述多个待处理音频数据对应的多个筛选音频数据:
82.首先,针对所述多个待处理音频数据中的每一个待处理音频数据,检测该待处理音频数据包括的多帧待处理音频帧中是否存在静音数据;
83.其次,针对所述多个待处理音频数据中的每一个待处理音频数据,若该待处理音频数据包括的多帧待处理音频帧中存在静音数据,则将该待处理音频数据包括的多帧待处理音频帧中的静音数据筛除,得到该待处理音频数据对应的第一筛选音频数据;
84.然后,针对所述多个待处理音频数据中的每一个待处理音频数据,若该待处理音频数据包括的多帧待处理音频帧中不存在静音数据,则将该待处理音频数据确定为对应的第一筛选音频数据;
85.最后,基于所述多个待处理音频数据对应的多个所述第一筛选音频数据,得到所述多个待处理音频数据对应的多个筛选音频数据。
86.可选地,在一些示例性的实施例中,所述针对所述多个待处理音频数据中的每一个待处理音频数据,检测该待处理音频数据包括的多帧待处理音频帧中是否存在静音数据的步骤,可以包括以下步骤:
87.首先,依次对所述多个待处理音频数据中的每一个待处理音频数据进行遍历,以依次确定出当前遍历的待处理音频数据,并针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于短时傅里叶变换算法对该待处理音频帧进行频域变化处理,得到该待处理音频帧对应的待处理音频频域帧;
88.其次,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于预先训练得到音频帧识别模型对该待处理音频帧对应的待处理音频频域帧进行识别处理,以确定该待处理音频频域帧是否属于静音数据,并在该待处理音频频域帧属于静音数据时将该待处理音频帧的静音表征值赋值为第一数值,以及在该待处理音频频域帧不属于静音数据时将该待处理音频帧的静音表征值赋值为第二数值,其中,所述音频帧识别模型基于包括有静音数据和非静音数据的样本音频训练得到;
89.然后,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于该待处理音频帧的所述静音表征值和该待处理音频帧的多帧相邻待处理音频帧的所述静音表征值进行表征值融合处理,得到该待处理音频帧的代表静音表征值;
90.最后,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于该待处理音频帧的所述代表静音表征值与预先配置的静音表征阈值之间的相对大小关系,确定待处理音频帧是否属于静音数据。
91.可选地,在一些示例性的实施例中,所述针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于该待处理音频帧的所述静音表征值和该待处理音频帧的多帧相邻待处理音频帧的所述静音表征值进行表征值融合处理,得到该待处理音频帧的代表静音表征值的步骤,可以包括以下步骤:
92.首先,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于预先确定的目标音频数量,在所述多帧待处理音频帧中确定出该待处理音频帧的所述目标音频数量帧相邻待处理音频帧,并基于每一帧相邻待处理音频帧与该待处理音频帧之间的帧时序关系,确定该待处理音频帧和每一帧相邻待处理音频帧对应的权重系数,其中,该待处理音频帧对应的权重系数最大,每一帧相邻待处理音频帧对应的权重系数与该帧时序关系具有正相关关系,帧时序越近,权重系数越大,并且,全部的权重系数之和为1;
93.其次,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于待处理音频帧和每一帧相邻待处理音频帧对应的权重系数,对该待处理音频帧的所述静音表征值和每一帧相邻待处理音频帧的所述静音表征值进行表征值进行加权求和计算,并将得到的加权求和指确定为该待处理音频帧的代表静音表征值。
94.可选地,在一些示例性的实施例中,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于该待处理音频帧的所述代表静音表征值与预先配置的静音表征阈值之间的相对大小关系,确定待处理音频帧是否属于静音数据的步骤,可以包括以下步骤:
95.首先,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于该待处理音频帧的所述代表静音表征值与预先配置的静音表征阈值之间的相对大小关系,确定待处理音频帧是否属于静音数据(如所述第一数值为1,所述第二数值为-1,所述静音表征阈值可以为0,如此,若所述代表静音表征值大于或等于所述静音表征阈值,可以确定待处理音频帧属于静音数据);
96.其次,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,若基于所述代表静音表征值确定该待处理音频帧不属于静音数据,则确定该待处理音频帧不属于静音数据;
97.然后,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,若基于所述代表静音表征值确定该待处理音频帧属于静音数据,则针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,计算该待处理音频帧的声音信号能量值(可以基于现有的相关能量值计算方式进行计算),并确定该声音信号能量值与预先配置的信号能量阈值之间的相对大小关系;
98.最后,针对当前遍历的待处理音频数据包括的每一帧待处理音频帧,若该待处理音频帧的声音信号能量值大于或等于所述信号能量阈值,则确定该待处理音频帧不属于静音数据,若该待处理音频帧的声音信号能量值小于所述信号能量阈值,则确定该待处理音频帧属于静音数据。
99.可选地,在一些示例性的实施例中,所述基于所述多个待处理音频数据对应的多个所述第一筛选音频数据,得到所述多个待处理音频数据对应的多个筛选音频数据的步骤,可以包括以下步骤:
100.首先,针对所述多个待处理音频数据对应的多个所述第一筛选音频数据中的每两个第一筛选音频数据,确定该两个第一筛选音频数据对应的两个音频采集设备之间的音频采集区域是否存在重合区域;
101.其次,针对所述多个待处理音频数据对应的多个所述第一筛选音频数据中的每两个第一筛选音频数据,若该两个第一筛选音频数据对应的两个音频采集设备之间的音频采集区域存在重合区域,则对该两个第一筛选音频数据进行对比处理,以确定该两个第一筛选音频数据的语音内容是否相同(如分别转换为文本数据,然后,比较文本数据是否相同),并在该两个第一筛选音频数据的语音内容相同时,筛除其中一个第一筛选音频数据,以及将未被筛除的每一个第一筛选音频数据确定为筛选音频数据。
102.可选地,在一些示例性的实施例中,上述实施例中的步骤s130可以包括以下步骤,以对所述筛选音频数据包括的待处理音频帧进行审核处理:
103.首先,针对所述多个筛选音频数据中的每一个筛选音频数据,对该筛选音频数据执行目标音频帧筛选操作,以在该筛选音频数据包括的待处理音频帧中筛选出至少一帧代表音频帧;
104.其次,针对所述多个筛选音频数据中的每一个筛选音频数据,对该筛选音频数据对应的所述至少一帧代表音频帧进行内容违规审核处理(如识别具有预先配置的违规词语或违规语句等),并将审核通过的每一个筛选音频数据确定为目标音频数据。
105.可选地,在一些示例性的实施例中,上述实施例中的所述目标音频帧筛选操作,可以包括以下步骤以筛选出代表音频帧:
106.第一步,对所述筛选音频数据包括的每一帧待处理音频帧进行声源识别处理(可以参照相关现有技术),确定每一帧待处理音频帧对应的至少一个声源标识信息,并为确定的每一个所述声源标识信息创建对应的一个音频帧初始集合,其中,每一个所述声源标识信息用于表征一个声音源,所述音频帧初始集合可以为空集合;
107.第二步,针对每一个所述声源标识信息,该声源标识信息对应的每一帧待处理音频帧分配至该声源标识信息对应的所述音频帧初始集合,得到该声源标识信息对应的待处理音频帧集合,并将包括的所述待处理音频帧对应的声源标识信息的数量最多的一个待处理音频帧集合确定为第一待处理音频帧集合,以及,将包括的所述待处理音频帧对应的声源标识信息的数量不属于最多的每一个待处理音频帧集合为第二待处理音频帧集合;
108.第三步,确定所述第一待处理音频帧集合中的每一帧待处理音频帧的音频采集时刻信息,得到所述第一待处理音频帧集合对应的多条条音频采集时刻信息,并基于该多条音频采集时刻信息确定出所述第一待处理音频帧集合对应的第一音频采集时间区间;
109.第四步,针对每一个所述第二待处理音频帧集合,确定该第二待处理音频帧集合中的每一帧待处理音频帧的音频采集时刻信息,得到该第二待处理音频帧集合对应的多条条音频采集时刻信息,并基于该多条音频采集时刻信息确定出该第二待处理音频帧集合对应的第二音频采集时间区间,以及,在该第二音频采集时间区间与所述第一音频采集时间区间之间存在交集时,将该第二音频采集时间区间确定为第三待处理音频帧集合;
110.第五步,统计所述第一待处理音频帧集合中包括的待处理音频帧的数量,得到所述第一待处理音频帧集合对应的第一音频帧统计帧数,并统计每一个所述第三待处理音频帧集合包括的所述待处理音频帧的数量,以及,将包括的所述待处理音频帧的数量大于或等于所述第一音频帧统计帧数的每一个所述第三待处理音频帧集合,确定为第四待处理音频帧集合;
111.第六步,针对每一个所述第四待处理音频帧集合,在该第四待处理音频帧集合中获取所述第一音频帧统计帧数帧待处理音频帧,并计算该第一音频帧统计帧数帧待处理音频帧与所述第一待处理音频帧集合之间每两帧待处理音频帧的声音信号能量值的差异值的平均值,得到该第四待处理音频帧集合对应的声音信号能量差异均值;
112.第七步,将所述第一待处理音频帧集合包括的每一帧待处理音频帧和对应的声音信号能量差异均值大于或等于预先配置的声音信号能量差异阈值的每一个第四待处理音频帧集合包括的每一帧待处理音频帧,确定为所述筛选音频数据的代表音频帧。
113.可选地,在一些示例性的实施例中,上述实施例中的步骤s200可以包括以下步骤,以确定多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息:
114.首先,将未审核通过的每一个待处理音频数据确定为待审核音频数据,并统计所述待审核音频数据的数量,得到对应的待审核音频统计数量;
115.其次,确定所述待审核音频统计数量与预先配置的音频统计数量阈值(如2等)之间的相对大小关系,并在所述待审核音频统计数量大于或等于所述音频统计数量阈值时,基于预先配置的音频相关性确定规则确定多个待审核音频数据之间的音频相关性程度信息。
116.可选地,在一些示例性的实施例中,所述确定所述待审核音频统计数量与预先配置的音频统计数量阈值之间的相对大小关系,并在所述待审核音频统计数量大于或等于所述音频统计数量阈值时,基于预先配置的音频相关性确定规则确定多个待审核音频数据之间的音频相关性程度信息的步,可以包括以下步骤:
117.首先,确定所述待审核音频统计数量与预先配置的音频统计数量阈值之间的相对大小关系,并在所述待审核音频统计数量大于或等于所述音频统计数量阈值时,针对多个待审核音频数据中的每两个待审核音频数据,分别确定该两个待审核音频数据未通过审核处理的未通过原因信息;
118.其次,针对多个待审核音频数据中的每两个待审核音频数据,对该两个待审核音频数据未通过审核处理的未通过原因信息进行解析处理,得到该两个待审核音频数据中分别存在的至少一帧违规音频帧;
119.然后,针对多个待审核音频数据中的每两个待审核音频数据,基于该两个待审核音频数据中分别存在的所述至少一帧违规音频帧,计算得到该两个待审核音频数据之间的违规相关性程度信息;
120.再然后,针对多个待审核音频数据中的每两个待审核音频数据,计算该两个待审核音频数据对应的两个音频采集设备的音频采集区域的区域重合面积;
121.之后,针对多个待审核音频数据中的每两个待审核音频数据,基于该两个待审核音频数据对应的两个音频采集设备的音频采集区域的区域重合面积和该两个待审核音频数据对应的两个音频采集设备的音频采集区域的区域面积,计算得到该两个待审核音频数
据之间的区域相关性程度信息;
122.最后,针对多个待审核音频数据中的每两个待审核音频数据,对该两个待审核音频数据之间的所述违规相关性程度信息和所述区域相关性程度信息进行融合处理,得到该两个待审核音频数据之间的音频相关性程度信息。
123.可选地,在一些示例性的实施例中,所述针对多个待审核音频数据中的每两个待审核音频数据,基于该两个待审核音频数据中分别存在的所述至少一帧违规音频帧,计算得到该两个待审核音频数据之间的违规相关性程度信息的步骤,可以包括以下步骤:
124.首先,针对多个待审核音频数据中的每两个待审核音频数据,计算该两个待审核音频数据中的其中一个待审核音频数据对应的每一帧违规音频帧与另一个待审核音频数据对应的每一帧违规音频帧之间的音频相似度,并计算该音频相似度的均值,得到该两个待审核音频数据对应的音频相似度均值;
125.其次,针对多个待审核音频数据中的每两个待审核音频数据,该两个待审核音频数据对应的音频相似度均值,确定为该两个待审核音频数据之间的违规相关性程度信息。
126.可选地,在一些示例性的实施例中,所述针对多个待审核音频数据中的每两个待审核音频数据,基于该两个待审核音频数据对应的两个音频采集设备的音频采集区域的区域重合面积和该两个待审核音频数据对应的两个音频采集设备的音频采集区域的区域面积,计算得到该两个待审核音频数据之间的区域相关性程度信息的步骤,可以包括以下步骤:
127.首先,针对多个待审核音频数据中的每两个待审核音频数据,确定该两个待审核音频数据对应的两个音频采集设备的音频采集区域的区域面积之间的面积平均值,并计算该两个待审核音频数据对应的两个音频采集设备的音频采集区域的区域重合面积与该面积平均值之间的面积比值;
128.其次,针对多个待审核音频数据中的每两个待审核音频数据,将该两个待审核音频数据对应的所述面积比值,确定为该两个待审核音频数据之间的区域相关性程度信息。
129.可选地,在一些示例性的实施例中,所述针对多个待审核音频数据中的每两个待审核音频数据,对该两个待审核音频数据之间的所述违规相关性程度信息和所述区域相关性程度信息进行融合处理,得到该两个待审核音频数据之间的音频相关性程度信息的步骤,可以包括以下步骤:
130.首先,确定所述违规相关性程度信息和所述区域相关性程度信息分别对应的第一权重系数和第二权重系数,其中,所述第一权重系数大于所述第二权重系数,且所述第一权重系数和所述第二权重系数之和为1;
131.其次,针对多个待审核音频数据中的每两个待审核音频数据,基于所述第一权重系数和所述第二权重系数,对该两个待审核音频数据之间的所述违规相关性程度信息和所述区域相关性程度信息进行加权求和计算,得到该两个待审核音频数据之间的音频相关性程度信息。
132.可选地,在一些示例性的实施例中,上述实施例中的步骤s300可以包括以下步骤,以分别将每一个所述音频数据类包括的待审核音频数据发送给对应的目标音频审核设备再次进行审核处理:
133.首先,基于所述多个待审核音频数据中的每两个待审核音频数据之间的音频相关
性程度信息对所述多个待审核音频数据进行聚类处理(可以是基于现有的任意一种聚类算法进行的聚类处理),得到所述多个待审核音频数据对应的至少一个音频数据类;
134.其次,针对每一个所述音频数据类,计算该音频数据类包括的待审核音频数据(中的每一帧违规音频帧)与多个音频审核设备中每一个音频审核设备在历史上审核的历史待审核音频数据的历史违规音频帧的相似度均值(音频帧相似度的均值);
135.然后,针对每一个所述音频数据类,将该音频数据类对应的相似度均值中具有最大值的相似度均值的音频审核设备,确定为该音频数据类对应的目标音频审核设备,并将该音频数据类包括的每一个待审核音频数据发送给该目标音频审核设备再次进行审核处理,以基于该目标音频审核设备确定该音频数据类包括的每一个待审核音频数据是否通过审核。
136.结合图3,本发明实施例还提供一种基于数据处理的数据推送系统,可应用于上述音频数据处理服务器。其中,所述基于数据处理的数据推送系统可以包括以下的各功能模块:
137.音频数据审核处理模块,用于对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个待处理音频数据确定为目标音频数据,其中,所述多个音频采集设备中每两个音频采集设备之间的音频采集区域不完全相同,且所述多个待处理音频数据中的每一个所述待处理音频数据包括多帧待处理音频帧;
138.音频相关性确定模块,用于将未审核通过的每一个待处理音频数据确定为待审核音频数据,并在所述待审核音频数据为多个时,确定多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息;
139.音频数据推送模块,用于基于所述多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息对所述多个待审核音频数据分类,得到对应的至少一个音频数据类,并分别将每一个所述音频数据类包括的待审核音频数据发送给对应的目标音频审核设备再次进行审核处理,以基于对应的所述目标音频审核设备确定所述音频数据类包括的待审核音频数据是否通过审核。
140.可选地,在一些示例性的实施例中,上述实施例中的所述音频相关性确定模块进一步用于:
141.将未审核通过的每一个待处理音频数据确定为待审核音频数据,并统计所述待审核音频数据的数量,得到对应的待审核音频统计数量;确定所述待审核音频统计数量与预先配置的音频统计数量阈值之间的相对大小关系,并在所述待审核音频统计数量大于或等于所述音频统计数量阈值时,基于预先配置的音频相关性确定规则确定多个待审核音频数据之间的音频相关性程度信息。
142.可选地,在一些示例性的实施例中,上述实施例中的所述音频数据推送模块进一步用于:
143.基于所述多个待审核音频数据中的每两个待审核音频数据之间的音频相关性程度信息对所述多个待审核音频数据进行聚类处理,得到所述多个待审核音频数据对应的至少一个音频数据类;针对每一个所述音频数据类,计算该音频数据类包括的待审核音频数据与多个音频审核设备中每一个音频审核设备在历史上审核的历史待审核音频数据的历
史违规音频帧的相似度均值;针对每一个所述音频数据类,将该音频数据类对应的相似度均值中具有最大值的相似度均值的音频审核设备,确定为该音频数据类对应的目标音频审核设备,并将该音频数据类包括的每一个待审核音频数据发送给该目标音频审核设备再次进行审核处理,以基于该目标音频审核设备确定该音频数据类包括的每一个待审核音频数据是否通过审核。
144.综上所述,本发明提供的一种基于数据处理的数据推送方法及系统,在对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理之后,可以将未审核通过的每一个待处理音频数据确定为待审核音频数据,并在待审核音频数据为多个时确定每两个待审核音频数据之间的音频相关性程度信息,使得可以基于每两个待审核音频数据之间的音频相关性程度信息对多个待审核音频数据分类,得到对应的至少一个音频数据类,并分别将每一个音频数据类包括的待审核音频数据发送给对应的目标音频审核设备再次进行审核处理,如此,由于增加了分别推送待审核音频数据的匹配机制,可以保障推送的效果,从而现有技术中对于音频数据的推送效果不佳的问题。
145.以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。