1.本技术涉及信息处理技术领域,具体而言,涉及一种信息流数据的检测方法。
背景技术:2.多种方式的联合监控,相较于单一方式的监控,能够使得监控效果更加,如音视频联合监控。但是,经发明人研究发现,在基于音频监控的基础上,在基于现有技术进一步确定是否需要采用其它监控操作的过程中,存在着效率较低的问题。
技术实现要素:3.有鉴于此,本技术的目的在于提供一种信息流数据的检测方法,以改善现有技术中在确定是否对目标环境执行目标监控操作的过程中效率较低的问题。
4.为实现上述目的,本技术实施例采用如下技术方案:
5.一种信息流数据的检测方法,包括:
6.在获得的通信连接的多个目标物联网设备发送的多条音频数据中确定出至少一条音频数据,作为对目标环境进行数据采集得到的代表音频数据;
7.对所述代表音频数据进行解析,得到对应的音频解析结果;
8.基于所述音频解析结果确定是否对所述目标环境执行目标监控操作。
9.在一种可能的实施例中,在上述信息流数据的检测方法中,所述对所述代表音频数据进行解析,得到对应的音频解析结果的步骤,包括:
10.获取预先确定的预设音频长度信息;
11.基于所述预设音频长度信息对所述代表音频数据进行分割处理,得到多段音频子数据,并将每一段所述音频子数据作为一帧音频帧,其中,每一段所述音频子数据的时间长度为所述预设音频长度信息;
12.分别对每一帧所述音频帧进行解析得到对应的音频解析结果。
13.在一种可能的实施例中,在上述信息流数据的检测方法中,所述分别对每一帧所述音频帧进行解析得到对应的音频解析结果的步骤,包括:
14.针对每一帧所述音频帧,对该帧音频帧进行识别处理,以确定该帧音频帧中是否具有语音信息,并在该帧音频帧具有语音信息时,将该帧音频帧作为待处理的目标音频帧;
15.对每一帧所述目标音频帧进行解析得到对应的音频解析结果。
16.在一种可能的实施例中,在上述信息流数据的检测方法中,所述对每一帧所述目标音频帧进行解析得到对应的音频解析结果的步骤,包括:
17.按照所述目标音频帧在所述代表音频数据中的时间先后关系,对所述目标音频帧进行组合处理,得到待处理音频数据;
18.对所述待处理音频数据进行解析得到对应的音频解析结果。
19.在一种可能的实施例中,在上述信息流数据的检测方法中,所述对所述待处理音频数据进行解析得到对应的音频解析结果的步骤,包括:
20.获得预先训练得到的语音
‑
文本转换模型,其中,所述语音
‑
文本转换模型为基于样本数据进行深度学习得到的神经网络模型;
21.基于所述语音
‑
文本转换模型对所述待处理音频数据进行转换处理,得到所述待处理音频数据对应的待处理文本数据;
22.获取预先确定的关键词文本集合,其中,所述关键词文本集合中包括多个目标关键词,其中,所述目标关键词基于响应对应的管理用户进行的关键词配置操作生成;
23.基于所述关键词文本集合包括的多个目标关键词,对所述待处理文本数据进行匹配处理,得到对应的匹配结果,其中,所述匹配结果作为所述待处理音频数据对应的音频解析结果,所述匹配结果包括所述待处理文本数据与所述关键词文本集合相匹配和所述待处理文本数据与所述关键词文本集合不匹配,且在所述匹配结果为所述待处理文本数据与所述关键词文本集合相匹配时,确定需要对所述目标环境执行所述目标监控操作。
24.在一种可能的实施例中,在上述信息流数据的检测方法中,所述基于所述关键词文本集合包括的多个目标关键词,对所述待处理文本数据进行匹配处理,得到对应的匹配结果的步骤,包括:
25.对所述关键词文本集合包括的多个目标关键词进行感情色彩识别处理,得到对应的第一感情色彩识别结果,其中,所述多个目标关键词的感情色彩相同,且所述第一感情色彩识别结果包括褒义感情色彩、中性感情色彩或贬义感情色彩;
26.对所述待处理文本数据进行分词处理,得到所述待处理文本数据包括的多个待处理词语;
27.基于所述第一感情色彩识别结果对所述多个待处理词语进行匹配,得到所述多个待处理词语与所述关键词文本集合之间的匹配结果。
28.在一种可能的实施例中,在上述信息流数据的检测方法中,所述基于所述第一感情色彩识别结果对所述多个待处理词语进行匹配,得到所述多个待处理词语与所述关键词文本集合之间的匹配结果的步骤,包括:
29.针对所述多个待处理词语中的每一个所述待处理词语,对该待处理词语进行感情色彩识别处理,得到该待处理词语对应的第二感情色彩识别结果,以得到每一个所述待处理词语对应的第二感情色彩识别结果;
30.基于每一个所述待处理词语对应的所述第二感情色彩识别结果,确定与所述第一感情色彩识别结果相同的第二感情色彩识别结果对应的待处理词语在所述多个待处理词语中的占比信息,得到第一占比信息;
31.基于所述第一占比信息和预先确定的占比阈值信息之间的大小关系,确定所述多个待处理词语与所述关键词文本集合之间的匹配结果,其中,所述占比阈值信息基于响应对应的管理用户进行的阈值配置操作生成,且在所述第一占比信息大于或等于所述占比阈值信息时,所述匹配结果为所述多个待处理词语与所述关键词文本集合之间相匹配,在所述第一占比信息小于所述占比阈值信息时,所述匹配结果为所述多个待处理词语与所述关键词文本集合之间不匹配。
32.在一种可能的实施例中,在上述信息流数据的检测方法中,所述基于所述第一感情色彩识别结果对所述多个待处理词语进行匹配,得到所述多个待处理词语与所述关键词文本集合之间的匹配结果的步骤,包括:
33.针对所述多个待处理词语中的每一个所述待处理词语,对该待处理词语进行感情色彩识别处理,得到该待处理词语对应的第二感情色彩识别结果,以得到每一个所述待处理词语对应的第二感情色彩识别结果;
34.基于每一个所述待处理词语对应的所述第二感情色彩识别结果,确定与所述第一感情色彩识别结果相同的第二感情色彩识别结果对应的待处理词语在所述多个待处理词语中的占比信息,得到第一占比信息;
35.针对所述多个待处理词语中的每一个所述待处理词语,确定该待处理词语是否与所述关键词文本集合中的一个目标关键词相同,并在该待处理词语与所述关键词文本集合中的一个目标关键词相同时,将该待处理词语作为目标待处理词语;
36.统计所述目标待处理词语的数量,并基于该数量和所述多个待处理词语的数量计算对应的占比信息,得到第二占比信息;
37.基于预先确定的第一权重系数和第二权重系数对所述第一占比信息和所述第二占比信息进行加权求和计算,得到对应的目标占比信息,其中,所述第一占比信息对应的所述第一权重系数小于所述第二占比信息对应的所述第二权重系数,且所述第一权重系数和所述第二权重系数基于响应对应的管理用户进行的权重系数配置操作生成;
38.基于所述目标占比信息和预先确定的占比阈值信息之间的大小关系,确定所述多个待处理词语与所述关键词文本集合之间的匹配结果,其中,所述占比阈值信息基于响应对应的管理用户进行的阈值配置操作生成,且在所述目标占比信息大于或等于所述占比阈值信息时,所述匹配结果为所述多个待处理词语与所述关键词文本集合之间相匹配,在所述目标占比信息小于所述占比阈值信息时,所述匹配结果为所述多个待处理词语与所述关键词文本集合之间不匹配。
39.在一种可能的实施例中,在上述信息流数据的检测方法中,所述基于所述音频解析结果确定是否对所述目标环境执行目标监控操作的步骤,包括:
40.若基于所述音频解析结果确定需要对所述目标环境执行目标监控操作,则生成目标监控通知信息;
41.将所述目标监控通知信息发送给部署于所述目标环境的视频监控设备,其中,所述视频监控设备用于基于所述目标监控通知信息对所述目标环境进行图像采集,以实现视频监控。
42.在一种可能的实施例中,在上述信息流数据的检测方法中,所述若基于所述音频解析结果确定需要对所述目标环境执行目标监控操作,则生成目标监控通知信息的步骤,包括:
43.若基于所述音频解析结果确定需要对所述目标环境执行目标监控操作,则基于所述多个目标物联网设备的设备位置信息和每一个所述目标物联网设备发送的音频数据之间的音量大小关系,对应的音源位置信息;
44.生成包括所述音源位置信息的目标监控通知信息,其中,所述视频监控设备用于基于所述音源位置信息对所述目标环境进行图像采集。
45.本技术提供的一种信息流数据的检测方法,通过对获得的多条音频数据进行筛选,以得到代表音频数据,使得可以基于代表音频数据确定是否对目标环境进行目标监控操作。基于此,由于确定是否执行目标监控操作的代表音频数据是基于筛选得到,因而,相
较于直接基于得到的多条音频数据确定是否执行目标监控操作的常规技术方案,采用本技术提供的技术方案,可以使得处理的效率更高,从而改善现有技术中在确定是否对目标环境执行目标监控操作的过程中效率较低的问题。
46.为使本技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
47.图1为本技术实施例提供的电子设备的结构框图。
48.图2为本技术实施例提供的信息流数据的检测方法包括的各步骤的流程示意图。
具体实施方式
49.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本技术的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
50.因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
51.如图1所示,本技术实施例提供了一种电子设备。其中,所述电子设备可以包括存储器和处理器。
52.详细地,所述存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述存储器中可以存储有至少一个可以以软件或固件(firmware)的形式,存在的软件功能模块(计算机程序)。所述处理器可以用于执行所述存储器中存储的可执行的计算机程序,从而实现本技术实施例(如后文所述)提供的信息流数据的检测方法。
53.可选地,所述存储器可以是,但不限于,随机存取存储器(random access memory,ram),只读存储器(read only memory,rom),可编程只读存储器(programmable read
‑
only memory,prom),可擦除只读存储器(erasable programmable read
‑
only memory,eprom),电可擦除只读存储器(electric erasable programmable read
‑
only memory,eeprom)等。所述处理器可以是一种通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)、片上系统(system on chip,soc)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
54.并且,图1所示的结构仅为示意,所述电子设备还可包括比图1中所示更多或者更少的组件,或具有与图1所示不同的配置,例如,可以包括用于与其它设备(如物联网设备)进行信息交互的通信单元。
55.其中,在一种可以替代的示例中,所述电子设备可以是一种具备数据处理能力的服务器。
56.结合图2,本技术实施例还提供一种信息流数据的检测方法,可应用于上述电子设备。其中,所述信息流数据的检测方法有关的流程所定义的方法步骤,可以由所述电子设备实现。
57.下面将对图2所示的具体流程,进行详细阐述。
58.步骤s110,在多个目标物联网设备发送的多条音频数据中确定出至少一条音频数据,作为对目标环境进行数据采集得到的代表音频数据。
59.在本实施例中,所述电子设备可以在获得的通信连接的多个目标物联网设备发送的多条音频数据中确定出至少一条音频数据,作为对目标环境进行数据采集得到的代表音频数据。
60.步骤s120,对所述代表音频数据进行解析,得到对应的音频解析结果。
61.在本实施例中,在基于步骤s110得到所述代表音频数据之后,所述电子设备可以对所述代表音频数据进行解析,得到对应的音频解析结果。
62.步骤s130,基于音频解析结果确定是否对目标环境执行目标监控操作。
63.在本实施例中,在基于步骤s120得到所述音频解析结果之后,所述电子设备可以基于所述音频解析结果确定是否对所述目标环境执行目标监控操作,即在音频监控的基础上,进一步确定是否进行其它方式的监控。
64.基于上述方法,通过对获得的多条音频数据进行筛选,以得到代表音频数据,使得可以基于代表音频数据确定是否对目标环境进行目标监控操作。基于此,由于确定是否执行目标监控操作的代表音频数据是基于筛选得到,因而,相较于直接基于得到的多条音频数据确定是否执行目标监控操作的常规技术方案,采用本技术提供的技术方案,可以使得处理的效率更高,从而改善现有技术中在确定是否对目标环境执行目标监控操作的过程中效率较低的问题。
65.可以理解的是,在一种可以替代的示例中,可以基于步骤s111、步骤s112和步骤s113以得到所述代表音频数据,具体内容如下。
66.步骤s111,获得通信连接的多个目标物联网设备发送的多条音频数据。
67.在本实施例中,所述电子设备可以先获得通信连接的多个目标物联网设备发送的多条音频数据。
68.其中,所述多个目标物联网设备(如音频采集设备)可以都部署于目标环境,且相互之间可以间隔一定的距离。所述多条音频数据可以基于所述多个目标物联网设备分别对所述目标环境进行音频采集得到,且每一条所述音频数据包括音频时长信息(音频数据的时长长度)、音频能量信息(音频数据的能量值,如可以是音频数据包括的多帧音频帧的能量值的平均值,每一帧音频帧的能量值可以基于相关的现有技术计算得到,在此不做具体限定)和音源数量信息(发出声音的人或物的数量,具体的确定方法可以基于相关的现有技术计算得到,在此不做具体限定)。
69.步骤s112,基于所述音频时长信息、所述音频能量信息和所述音源数量信息对所述多条音频数据进行聚类处理,得到至少一个音频数据簇。
70.在本实施例中,在基于步骤s111得到所述多条音频数据之后,所述电子设备可以基于所述音频时长信息、所述音频能量信息和所述音源数量信息对所述多条音频数据进行聚类处理(如可以基于所述音频时长信息、所述音频能量信息和所述音源数量信息形成三
维聚类空间,然后基于邻近算法或其它算法进行聚类),如此,可以得到至少一个音频数据簇。
71.其中,每一个所述音频数据簇可以包括至少一条所述音频数据。
72.步骤s113,基于所述至少一个音频数据簇筛选出至少一条音频数据,作为目标环境的代表音频数据。
73.在本实施例中,在基于步骤s112得到所述至少一个音频数据簇之后,所述电子设备可以基于所述至少一个音频数据簇筛选出至少一条音频数据,作为所述目标环境的代表音频数据。
74.可以理解的是,在一种可以替代的示例中,可以基于以下步骤以获得所述多条音频数据:
75.首先,可以获得通信连接的多个物联网设备发送的多条候选音频数据。其中,所述目标环境可以部署所述多个物联网设备,且每一个所述物联网设备可以与所述电子设备通信连接,以将采集的数据,如候选音频数据发送给所述电子设备;
76.其次,可以基于预设音频筛选规则对所述多条候选音频数据进行筛选处理,得到多个目标物联网设备发送的多条音频数据,其中,所述目标物联网设备为发送筛选出所述音频数据的物联网设备,也就是说,可以将基于所述预设音频筛选规则筛选出的候选音频数据作为所述音频数据,对应地,发送所述音频数据的物联网设备可以为所述目标物联网设备。
77.可以理解的是,在第一种可以替代的示例中,可以基于以下步骤以基于所述预设音频筛选规则得到所述多条音频数据:
78.首先,确定每一条所述候选音频数据对应的音频时长信息;
79.其次,基于预设音频筛选规则和每一条所述候选音频数据对应的所述音频时长信息,对所述多条候选音频数据进行筛选处理,得到多个目标物联网设备发送的多条音频数据。
80.例如,在一种可以替代的示例中,可以基于以下步骤以基于所述音频时长信息确定所述多条音频数据:
81.第一步,确定所述多条候选音频数据对应的音频时长信息中的最小音频时长信息和最大音频时长信息;
82.第二步,基于所述最小音频时长信息和所述最大音频时长信息确定目标音频时长区间,其中,所述目标音频时长区间的下限值基于所述最小音频时长信息确定,如以所述最小音频时长信息为下限值,所述目标音频时长区间的上限值基于所述最大音频时长信息确定,如以所述最大音频时长信息为上限值;
83.第三步,对所述目标音频时长区间进行等间隔分割处理,得到连续的多个目标音频时长子区间,并按照时长从小到大的顺序对每一个所述目标音频时长子区间进行赋值,得到每一个所述目标音频时长子区间对应的时长子区间赋值信息,其中,进行等间隔分割的长度可以基于所述电子设备响应对应的用户根据实际应用需求进行的配置操作确定,且在赋值处理时,较小时长对应的赋值小于较大时长的赋值,如时长与对应的赋值之间可以具有正相关关系;
84.第四步,针对每一个所述目标音频时长子区间,统计所述音频时长信息属于该目
标音频时长子区间的所述候选音频数据的数量,得到该目标音频时长子区间对应的第三音频数量;
85.第五步,基于每一个所述目标音频时长子区间对应的所述时长子区间赋值信息和第三音频数量,分别形成对应的时长子区间赋值
‑
音频数量组合,得到多个时长子区间赋值
‑
音频数量组合;
86.第六步,确定所述多个时长子区间赋值
‑
音频数量组合具有的时长子区间赋值
‑
音频数量变化趋势信息,如进行曲线拟合处理等得到变化趋势信息;
87.第七步,将所述多个时长子区间赋值
‑
音频数量组合中符合所述时长子区间赋值
‑
音频数量变化趋势信息的每一个时长子区间赋值
‑
音频数量组合,确定为目标时长子区间赋值
‑
音频数量组合;
88.第八步,将每一个所述目标时长子区间赋值
‑
音频数量组合包括的候选音频数据,作为筛选出的音频数据。
89.又例如,在另一种可以替代的示例中,也可以基于以下步骤以基于所述音频时长信息确定所述多条音频数据:
90.第一步,确定所述多条候选音频数据对应的音频时长信息中的最小音频时长信息和最大音频时长信息;
91.第二步,基于所述最小音频时长信息和所述最大音频时长信息确定目标音频时长区间,其中,所述目标音频时长区间的下限值基于所述最小音频时长信息确定,所述目标音频时长区间的上限值基于所述最大音频时长信息确定;
92.第三步,对所述目标音频时长区间进行等间隔分割处理,得到连续的多个目标音频时长子区间,并按照时长从小到大的顺序对每一个所述目标音频时长子区间进行赋值,得到每一个所述目标音频时长子区间对应的时长子区间赋值信息;
93.第四步,针对每一个所述目标音频时长子区间,统计所述音频时长信息属于该目标音频时长子区间的所述候选音频数据的数量,得到该目标音频时长子区间对应的第三音频数量;
94.第五步,基于每一个所述目标音频时长子区间对应的所述时长子区间赋值信息和第三音频数量,分别形成对应的时长子区间赋值
‑
音频数量组合,得到多个时长子区间赋值
‑
音频数量组合;
95.第六步,确定所述多个时长子区间赋值
‑
音频数量组合具有的时长子区间赋值
‑
音频数量变化趋势信息;
96.第七步,针对每一个所述时长子区间赋值
‑
音频数量组合,计算该时长子区间赋值
‑
音频数量组合与所述时长子区间赋值
‑
音频数量变化趋势信息之间的趋势偏离度(在时长子区间赋值和音频数量的二维空间内,计算时长子区间赋值
‑
音频数量组合与时长子区间赋值
‑
音频数量变化趋势信息对应的拟合曲线之间的距离,该距离可以作为趋势偏离度),并判断该趋势偏离度是否小于预设趋势偏离度,其中,所述预设趋势偏离度可以基于所述电子设备响应对应的用户根据实际应用需求进行的配置操作确定;
97.第八步,将小于所述预设趋势偏离度的每一个所述趋势偏离度对应时长子区间赋值
‑
音频数量组合,确定为目标时长子区间赋值
‑
音频数量组合;
98.第九步,将每一个所述目标时长子区间赋值
‑
音频数量组合包括的候选音频数据,
作为筛选出的音频数据。
99.可以理解的是,在第二种可以替代的示例中,可以基于以下步骤以基于所述预设音频筛选规则得到所述多条音频数据:
100.首先,可以确定每一条所述候选音频数据对应的音频能量信息;
101.其次,可以基于预设音频筛选规则和每一条所述候选音频数据对应的所述音频能量信息,对所述多条候选音频数据进行筛选处理,得到多个目标物联网设备发送的多条音频数据。
102.例如,在一种可以替代的示例中,可以基于以下步骤以基于所述音频能量信息得到所述多条音频数据:
103.第一步,确定所述多条候选音频数据对应的音频能量信息中的最小音频能量信息和最大音频能量信息;
104.第二步,基于所述最小音频能量信息和所述最大音频能量信息确定目标音频能量区间,其中,所述目标音频能量区间的下限值基于所述最小音频能量信息确定,所述目标音频能量区间的上限值基于所述最大音频能量信息确定;
105.第三步,对所述目标音频能量区间进行等间隔分割处理,得到连续的多个目标音频能量子区间,并按照音频能量从小到大的顺序对每一个所述目标音频能量子区间进行赋值,得到每一个所述目标音频能量子区间对应的能量子区间赋值信息,其中,较小音频能量对应的赋值小于较大音频能量的赋值;
106.第四步,针对每一个所述目标音频能量子区间,统计所述音频能量信息属于该目标音频能量子区间的所述候选音频数据的数量,得到该目标音频能量子区间对应的第四音频数量;
107.第五步,基于每一个所述目标音频能量子区间对应的所述能量子区间赋值信息和第四音频数量,分别形成对应的能量子区间赋值
‑
音频数量组合,得到多个能量子区间赋值
‑
音频数量组合;
108.第六步,确定所述多个能量子区间赋值
‑
音频数量组合具有的能量子区间赋值
‑
音频数量变化趋势信息,如前所述;
109.第七步,将所述多个能量子区间赋值
‑
音频数量组合中符合所述能量子区间赋值
‑
音频数量变化趋势信息的每一个能量子区间赋值
‑
音频数量组合,确定为目标能量子区间赋值
‑
音频数量组合;
110.第八步,将每一个所述目标能量子区间赋值
‑
音频数量组合包括的候选音频数据,作为筛选出的音频数据。
111.可以理解的是,在第三种可以替代的示例中,可以基于以下步骤以基于所述预设音频筛选规则得到所述多条音频数据:
112.首先,可以确定每一条所述候选音频数据对应的音源数量信息;
113.其次,可以基于预设音频筛选规则和每一条所述候选音频数据对应的所述音源数量信息,对所述多条候选音频数据进行筛选处理,得到多个目标物联网设备发送的多条音频数据。
114.例如,在一种可以替代的示例中,可以基于以下步骤以基于所述音源数量信息得到所述多条音频数据:
115.第一步,确定所述多条候选音频数据对应的音源数量信息中的最小音源数量信息和最大音源数量信息;
116.第二步,基于所述最小音源数量信息和所述最大音源数量信息确定目标音源数量区间,其中,所述目标音源数量区间的下限值基于所述最小音源数量信息确定,所述目标音源数量区间的上限值基于所述最大音源数量信息确定;
117.第三步,对所述目标音源数量区间进行等间隔分割处理,得到连续的多个目标音源数量子区间,并按照音源数量从小到大的顺序对每一个所述目标音源数量子区间进行赋值,得到每一个所述目标音源数量子区间对应的音源数量子区间赋值信息,其中,较小音源数量对应的赋值小于较大音源数量对应的赋值;
118.第四步,针对每一个所述目标音源数量子区间,统计所述音源数量信息属于该目标音源数量子区间的所述候选音频数据的数量,得到该目标音源数量子区间对应的第五音频数量;
119.第五步,基于每一个所述目标音源数量子区间对应的所述音源数量子区间赋值信息和第五音频数量,分别形成对应的音源数量子区间赋值
‑
音频数量组合,得到多个音源数量子区间赋值
‑
音频数量组合;
120.第六步,确定所述多个音源数量子区间赋值
‑
音频数量组合具有的音源数量子区间赋值
‑
音频数量变化趋势信息,如前所述;
121.第七步,将所述多个音源数量子区间赋值
‑
音频数量组合中符合所述音源数量子区间赋值
‑
音频数量变化趋势信息的每一个音源数量子区间赋值
‑
音频数量组合,确定为目标音源数量子区间赋值
‑
音频数量组合;
122.第八步,将每一个所述目标音源数量子区间赋值
‑
音频数量组合包括的候选音频数据,作为筛选出的音频数据。
123.可以理解的是,在一种可以替代的示例中,可以基于以下步骤以基于所述至少一个音频数据簇确定所述目标环境的代表音频数据:
124.首先,针对每一个所述音频数据簇,统计该音频数据簇包括的音频数据的数量,得到该音频数据簇对应的第一音频数量,其中,所述音频数据簇为多个,以得到对应的多个所述第一音频数量;
125.其次,计算多个所述第一音频数量之间的数量比值,并基于该数量比值和预先确定的目标总数量,确定每一个所述第一音频数量对应的目标数量(例如,将该数量比值乘以该目标总数量,如此,可以得到每一个所述第一音频数量对应的目标数量),其中,所述目标总数量基于所述电子设备响应对应的管理用户根据实际应用场景进行的数量配置操作生成;
126.然后,针对每一个所述第一音频数量,在该第一音频数量对应的音频数据簇包括的至少一条音频数据中确定该第一音频数量对应的目标数量条音频数据,作为该第一音频数量对应的目标音频数据,并将确定出的每一条所述目标音频数据作为所述目标环境的代表音频数据。
127.可以理解的是,在一种可以替代的示例中,可以基于以下步骤以在所述音频数据簇中确定出所述目标数量条音频数据作为所述目标环境的代表音频数据:
128.首先,针对每一个所述第一音频数量,确定该第一音频数量对应的音频数据簇包
括的至少一条音频数据对应的至少一条音源数量信息,其中,一条音频数据对应一条音源数量信息;
129.其次,针对每一个所述音频数据簇,确定该音频数据簇对应的每一条音源数量信息在该音频数据簇中对应的音频数据的数量,得到每一条音源数量信息对应的第二音频数量,例如,确定一个音频数据簇中音源数量为1的音频数据的数量、音源数量为2的音频数据的数量;
130.然后,针对每一个所述音频数据簇,基于该音频数据簇对应的每一个第二音频数量之间的大小关系在该音频数据簇中确定出对应的目标数量条音频数据,作为该音频数据簇对应的目标音频数据;
131.最后,将确定出的每一条所述目标音频数据作为目标环境的代表音频数据。
132.可以理解的是,在一种可以替代的示例中,可以基于以下步骤以基于第二音频数量之间的大小关系确定出目标数量条目标音频数据:
133.针对每一个所述音频数据簇,按照从大到小的先后顺序依次遍历该音频数据簇对应的第二音频数量,其中,对于遍历到的第二音频数量,可以将该第二音频数量对应的每一条音频数据作为该音频数据簇对应的目标音频数据,直到得到的目标音频数据的数量达到所述目标数量。
134.可以理解的是,在一种可以替代的示例中,可以基于以下步骤以对所述代表音频数据进行解析处理:
135.首先,获取预先确定的预设音频长度信息,所述预设音频长度可以是基于响应对应用户进行的配置操作生成,且用于表征一帧音频帧的时长;
136.其次,基于所述预设音频长度信息对所述代表音频数据进行分割处理,得到多段音频子数据,并将每一段所述音频子数据作为一帧音频帧,其中,每一段所述音频子数据的时间长度为所述预设音频长度信息;
137.然后,分别对每一帧所述音频帧进行解析得到对应的音频解析结果。
138.可以理解的是,在一种可以替代的示例中,可以基于以下步骤以得到每一帧所述音频帧对应的音频解析结果:
139.首先,针对每一帧所述音频帧,对该帧音频帧进行识别处理,以确定该帧音频帧中是否具有语音信息,并在该帧音频帧具有语音信息时,将该帧音频帧作为待处理的目标音频帧,也就是说,若一帧音频帧中不具有语音信息,即没有任何的声音,可以予以丢弃;
140.其次,对每一帧所述目标音频帧进行解析得到对应的音频解析结果。
141.可以理解的是,在一种可以替代的示例中,可以基于以下步骤以对每一帧所述目标音频帧进行解析:
142.首先,按照所述目标音频帧在所述代表音频数据中的时间先后关系,对所述目标音频帧进行组合处理,得到待处理音频数据,例如,在所述代表音频数据中,目标音频帧1位于目标音频帧2之前,在所述待处理音频帧中,目标音频帧1也位于目标音频帧2之前;
143.其次,对所述待处理音频数据进行解析得到对应的音频解析结果。
144.可以理解的是,在一种可以替代的示例中,可以基于以下步骤以对所述待处理音频数据进行解析:
145.首先,获得预先训练得到的语音
‑
文本转换模型,其中,所述语音
‑
文本转换模型为
基于样本数据进行深度学习得到的神经网络模型,具体的学习方式可以参照现有的相关技术,在此不做具体限定;
146.其次,基于所述语音
‑
文本转换模型对所述待处理音频数据进行转换处理,得到所述待处理音频数据对应的待处理文本数据;
147.然后,获取预先确定的关键词文本集合,其中,所述关键词文本集合中包括多个目标关键词,其中,所述目标关键词基于响应对应的管理用户进行的关键词配置操作生成;
148.最后,基于所述关键词文本集合包括的多个目标关键词,对所述待处理文本数据进行匹配处理,得到对应的匹配结果,其中,所述匹配结果作为所述待处理音频数据对应的音频解析结果,所述匹配结果包括所述待处理文本数据与所述关键词文本集合相匹配和所述待处理文本数据与所述关键词文本集合不匹配,且在所述匹配结果为所述待处理文本数据与所述关键词文本集合相匹配时,确定需要对所述目标环境执行所述目标监控操作。
149.可以理解的是,在一种可以替代的示例中,可以基于以下步骤以对所述待处理文本数据进行匹配处理:
150.首先,对所述关键词文本集合包括的多个目标关键词进行感情色彩识别处理,得到对应的第一感情色彩识别结果,其中,所述多个目标关键词的感情色彩相同,且所述第一感情色彩识别结果包括褒义感情色彩、中性感情色彩或贬义感情色彩,可以理解的是,进行感情色彩识别处理可以基于现有的相关技术实现吗,在此不做具体限定;
151.其次,对所述待处理文本数据进行分词处理(可以基于现有的相关技术实现),得到所述待处理文本数据包括的多个待处理词语;
152.然后,基于所述第一感情色彩识别结果对所述多个待处理词语进行匹配,得到所述多个待处理词语与所述关键词文本集合之间的匹配结果。
153.可以理解的是,在一种可以替代的示例中,可以基于以下步骤以基于所述第一感情色彩识别结果进行匹配:
154.首先,针对所述多个待处理词语中的每一个所述待处理词语,对该待处理词语进行感情色彩识别处理,得到该待处理词语对应的第二感情色彩识别结果,以得到每一个所述待处理词语对应的第二感情色彩识别结果;
155.其次,基于每一个所述待处理词语对应的所述第二感情色彩识别结果,确定与所述第一感情色彩识别结果相同的第二感情色彩识别结果对应的待处理词语在所述多个待处理词语中的占比信息,得到第一占比信息;
156.然后,基于所述第一占比信息和预先确定的占比阈值信息之间的大小关系,确定所述多个待处理词语与所述关键词文本集合之间的匹配结果,其中,所述占比阈值信息基于响应对应的管理用户进行的阈值配置操作生成,且在所述第一占比信息大于或等于所述占比阈值信息时,所述匹配结果为所述多个待处理词语与所述关键词文本集合之间相匹配,在所述第一占比信息小于所述占比阈值信息时,所述匹配结果为所述多个待处理词语与所述关键词文本集合之间不匹配。
157.可以理解的是,在另一种可以替代的示例中,也可以基于以下步骤以基于所述第一感情色彩识别结果进行匹配:
158.第一步,针对所述多个待处理词语中的每一个所述待处理词语,对该待处理词语进行感情色彩识别处理,得到该待处理词语对应的第二感情色彩识别结果,以得到每一个
所述待处理词语对应的第二感情色彩识别结果;
159.第二步,基于每一个所述待处理词语对应的所述第二感情色彩识别结果,确定与所述第一感情色彩识别结果相同的第二感情色彩识别结果对应的待处理词语在所述多个待处理词语中的占比信息,得到第一占比信息;
160.第三步,针对所述多个待处理词语中的每一个所述待处理词语,确定该待处理词语是否与所述关键词文本集合中的一个目标关键词相同,并在该待处理词语与所述关键词文本集合中的一个目标关键词相同时,将该待处理词语作为目标待处理词语;
161.第四步,统计所述目标待处理词语的数量,并基于该数量和所述多个待处理词语的数量计算对应的占比信息,得到第二占比信息;
162.第五步,基于预先确定的第一权重系数和第二权重系数对所述第一占比信息和所述第二占比信息进行加权求和计算,得到对应的目标占比信息,其中,所述第一占比信息对应的所述第一权重系数小于所述第二占比信息对应的所述第二权重系数,且所述第一权重系数和所述第二权重系数基于响应对应的管理用户进行的权重系数配置操作生成;
163.第六步,基于所述目标占比信息和预先确定的占比阈值信息之间的大小关系,确定所述多个待处理词语与所述关键词文本集合之间的匹配结果,其中,所述占比阈值信息基于响应对应的管理用户进行的阈值配置操作生成,且在所述目标占比信息大于或等于所述占比阈值信息时,所述匹配结果为所述多个待处理词语与所述关键词文本集合之间相匹配,在所述目标占比信息小于所述占比阈值信息时,所述匹配结果为所述多个待处理词语与所述关键词文本集合之间不匹配。
164.可以理解的是,在一种可以替代的示例中,可以基于执行以下步骤以实现对所述目标环境执行目标监控操作:
165.首先,若基于所述音频解析结果确定需要对所述目标环境执行目标监控操作,如前所述,在所述音频解析结果对应的匹配结果为所述待处理文本数据与所述关键词文本集合相匹配时,确定需要对所述目标环境执行所述目标监控操作,则生成目标监控通知信息;
166.其次,将所述目标监控通知信息发送给部署于所述目标环境的视频监控设备,其中,所述视频监控设备用于基于所述目标监控通知信息对所述目标环境进行图像采集,以实现视频监控。
167.可以理解的是,在一种可以替代的示例中,可以基于以下步骤以生成所述目标监控通知信息:
168.首先,若基于所述音频解析结果确定需要对所述目标环境执行目标监控操作,则基于所述多个目标物联网设备的设备位置信息和每一个所述目标物联网设备发送的音频数据之间的音量大小关系,对应的音源位置信息(例如,若每一个所述目标物联网设备发送的音频数据的音量都相同,表明音源位置在所述多个目标物联网设备的中间,如此,可以基于所述多个目标物联网设备的设备位置信息确定对应的音源位置信息);
169.其次,生成包括所述音源位置信息的目标监控通知信息,其中,所述视频监控设备用于基于所述音源位置信息对所述目标环境进行图像采集,例如,可以控制所述视频监控设备转向所述音源位置信息对应的位置,以对该位置进行图像采集,从而提高监控效果。
170.综上所述,本技术提供的一种信息流数据的检测方法,通过对获得的多条音频数据进行筛选,以得到代表音频数据,使得可以基于代表音频数据确定是否对目标环境进行
目标监控操作。基于此,由于确定是否执行目标监控操作的代表音频数据是基于筛选得到,因而,相较于直接基于得到的多条音频数据确定是否执行目标监控操作的常规技术方案,采用本技术提供的技术方案,可以使得处理的效率更高,从而改善现有技术中在确定是否对目标环境执行目标监控操作的过程中效率较低的问题。
171.在本技术实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
172.另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
173.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read
‑
only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
174.以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。