首页 > 乐器声学 专利正文
音频处理方法、装置、电子设备及可读存储介质与流程

时间:2022-02-15 阅读: 作者:专利查询

音频处理方法、装置、电子设备及可读存储介质与流程

1.本技术属于音频处理技术领域,具体涉及一种音频处理方法、装置、电子设备及可读存储介质。


背景技术:

2.随着智能语音技术不断进步,声纹应用显现出巨大的潜力。一方面,比对运算能力和算法精度的显著提升,能够支撑开展海量声纹数据的比对串并,另一方面,海量语音下声纹建模、关键词检索等算法能力的扩展,能够实现海量筛查、快速预警等功能。
3.目前,针对目标对象的声音采集通常是在较为嘈杂的环境中进行,为了提高声纹识别的准确性,通常需要采集信息量较大的原始音频,使得一些低算力设备无法及时完成声纹识别,声纹识别的效率较低。


技术实现要素:

4.本技术实施例的目的是提供一种音频处理方法、装置、电子设备及可读存储介质,能够解决音频处理效率较低的问题。
5.第一方面,本技术实施例提供了一种音频处理方法,由终端执行,所述方法包括:
6.获取第一人声音频和环境声音频;
7.根据所述第一人声音频的信息量、所述环境声音频的信息量和所述终端的算力状态,确定是否向云端服务器发送所述第一人声音频和所述环境声音频,以及音频处理请求,所述音频处理请求用于请求所述云端服务器对所述第一人声音频和所述环境声音频进行降噪处理,以获取所述第一人声音频对应的目标声纹信息。
8.第二方面,本技术实施例提供了一种音频处理方法,由云端服务器执行,所述方法包括:
9.执行第一操作,所述第一操作包括以下任意一项:
10.接收终端发送的第一人声音频和环境声音频,以及音频处理请求,所述音频处理请求用于请求所述云端服务器对所述第一人声音频和所述环境声音频进行降噪处理,以获取所述第一人声音频对应的目标声纹信息;
11.接收所述终端发送的所述目标声纹信息。
12.第三方面,本技术实施例提供了一种音频处理装置,包括:
13.获取模块,用于获取第一人声音频和环境声音频;
14.确定模块,用于根据所述第一人声音频的信息量、所述环境声音频的信息量和所述装置的算力状态,确定是否向云端服务器发送所述第一人声音频和所述环境声音频,以及音频处理请求,所述音频处理请求用于请求所述云端服务器对所述第一人声音频和所述环境声音频进行降噪处理,以获取所述第一人声音频对应的目标声纹信息。
15.第四方面,本技术实施例提供了一种音频处理装置,包括:
16.执行模块,用于执行第一操作,所述第一操作包括以下任意一项:
17.接收终端发送的第一人声音频和环境声音频,以及音频处理请求,所述音频处理请求用于请求所述装置对所述第一人声音频和所述环境声音频进行降噪处理,以获取所述第一人声音频对应的目标声纹信息;
18.接收所述终端发送的所述目标声纹信息。
19.第五方面,本技术实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面或第二方面所述的方法的步骤。
20.第六方面,本技术实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面或第二方面所述的方法的步骤。
21.第七方面,本技术实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面或第二方面所述的方法。
22.在本技术实施例中,所述终端可以根据所述第一人声音频的信息量、所述环境声音频的信息量和所述终端的算力状态,确定是否向云端服务器发送所述第一人声音频和所述环境声音频,也就是说,所述终端可以根据自身的算力状态确定是否由云端服务器对所述第一人声音频和所述环境声音频进行降噪处理,使得低算力的设备也可以及时实现对采集的音频的降噪处理,以得到目标声纹信息,提高了声纹识别的效率。
附图说明
23.图1是本技术实施例提供的一种音频处理方法的流程图之一;
24.图2是本技术实施例提供的一种音频处理方法的流程图之二;
25.图3a是本技术实施例提供的一种音频处理系统的示意图之一;
26.图3b是本技术实施例提供的一种音频处理系统的示意图之二;
27.图4是本技术实施例提供的一种音频处理装置的结构框图之一;
28.图5是本技术实施例提供的一种音频处理装置的结构框图之二;
29.图6是本技术实施例提供的一种电子设备的结构框图。
具体实施方式
30.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本技术保护的范围。
31.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
32.下面结合附图,通过具体的实施例及其应用场景对本技术实施例提供的音频处理
方法进行详细地说明。
33.为方便理解,下面对本技术实施例涉及的一些内容进行说明:
34.指向性麦克风,麦克风的指向性用于描述麦克风对来自空间各个方向声音的灵敏度模式。若麦克风对来自空间某个方向或某几个方向的声音的灵敏度高于对其他方向的声音的灵敏度,则该麦克风为非全指向性麦克风;若麦克风对来自空间某个方向或某几个方向的声音的灵敏度均相等,则该麦克风为全指向性麦克风。指向性麦克风通常可以包括心形指向麦克风、超心形指向麦克风、过心形指向麦克风、全向形指向麦克风、8字形指向麦克风等,其中,心形指向麦克风、超心形指向麦克风和过心形指向麦克风相似,三者对声音的灵敏度最高的点位均在麦克风的前方,对声音的灵敏度最低的点位均在麦克风的后方,但是三者对来自麦克风后方的声音的灵敏度区域有所差异,心形指向麦克风在麦克风的正后方,超心形指向麦克风在200
°
至210
°
处,过心形指向麦克风在150
°
至160
°
处,过心形指向麦克风的指向性更好。
35.旁路麦克风,旁路是指区别于主回路的线路,旁路麦克风可以是区别于主麦克风的其他麦克风,可以是非全指向性麦克风,也可以是全指向性麦克风。
36.请参见图1,图1是本技术实施例提供的一种音频处理方法的流程示意图之一。需要说明的是,所述音频处理方法可以由终端执行,所述终端可以为电脑、手机、平板等电子设备,具体可根据实际情况决定,在此不作具体限定。
37.如图1所示,所述音频处理方法包括以下步骤:
38.步骤101、获取第一人声音频和环境声音频。
39.所述终端可以通过麦克风采集所述第一人声音频和所述环境声音频。所述第一人声音频和所述环境声音频可以通过同一麦克风进行采集,也可以通过不同的麦克风进行采集,所述麦克风可以为所述终端内置的麦克风,也可以为外接的麦克风,具体可根据实际情况决定,在此不做具体限定。
40.在一可选实施方式中,所述第一人声音频为指向性麦克风采集的人声音频。所述指向性麦克风可以是心形指向麦克风、超心形指向麦克风、过心形指向麦克风等。具体实施时,可以将所述指向性麦克风对准被采集人员,这样所述指向性麦克风能够对来自前方的人声保持较高的灵敏度,从而可以提高收音效果,使得所述终端可以获取到更准确、全面的人声音频,以便于后续能够更加准确提取纯净人声以识别声纹信息。
41.所述环境声音频可以通过普通麦克风进行采集,在所述第一人声音频和所述环境声音频通过不同麦克风进行采集的情况下,采集所述环境声音频的麦克风可以称为旁路麦克风,所述旁路麦克风可以为任意种类的麦克风,可以是非全指向性麦克风,也可以是全指向性麦克风,具体可根据实际情况决定,在此不作具体限定。具体实施时,所述旁路麦克风可以放置于被采集人员身旁,以采集人员周围的环境声音,这样可以为后续降噪处理提供环境声音的信号参考,以有效分离人声和环境声。
42.步骤102、根据所述第一人声音频的信息量、所述环境声音频的信息量和所述终端的算力状态,确定是否向云端服务器发送所述第一人声音频和所述环境声音频,以及音频处理请求。所述音频处理请求用于请求所述云端服务器对所述第一人声音频和所述环境声音频进行降噪处理,以获取所述第一人声音频对应的目标声纹信息。
43.所述终端可以根据自身的算力状态确定是否请求所述云端服务器对所述第一人
声音频和所述环境声音频进行降噪处理。
44.所述第一人声音频的信息量可以基于所述第一人声音频的时长、占用空间大小等确定,所述环境声音频的信息量可以基于所述环境声音频的时长、占用空间大小等确定,并计算所述第一人声音频和所述环境声音频的总信息量。所述算力状态可以基于所述终端的中央处理器(central processing unit,cpu) 的性能确定,也可以基于所述终端的可用缓存空间大小确定。所述目标声纹信息为对所述第一人声音频进行降噪处理后得到的人声对应的声纹信息。
45.具体实施时,所述终端可以在每次采集到所述第一人声音频和所述环境声音频的情况下,检测一次算力状态。所述终端通过比较所述总信息量和所述算力状态,可以确定当前所述终端的算力水平能否支持对所述第一人声音频和所述环境声音频的处理。在所述算力状态能支持对所述第一人声音频和所述环境声音频的处理的情况下,所述终端可以自行对所述第一人声音频和所述环境声音频进行降噪处理;在所述算力状态不能支持对所述第一人声音频和所述环境声音频的处理的情况下,所述终端可以向所述云端服务器发送所述第一人声音频和所述环境声音频,以请求所述云端服务器对所述第一人声音频和所述环境声音频进行降噪处理。
46.本技术实施例中,所述终端可以根据所述第一人声音频的信息量、所述环境声音频的信息量和所述终端的算力状态,确定是否向云端服务器发送所述第一人声音频和所述环境声音频,也就是说,所述终端可以根据自身的算力状态确定是否由云端服务器对所述第一人声音频和所述环境声音频进行降噪处理,使得低算力的设备也可以及时实现对采集的音频的降噪处理,以得到目标声纹信息,提高了声纹识别的效率。
47.可选地,所述根据所述第一人声音频的信息量、所述环境声音频的信息量和所述终端的算力状态,确定是否向云端服务器发送所述第一人声音频和所述环境声音频,以及音频处理请求,包括:
48.在所述第一人声音频的信息量和所述环境声音频的信息量与所述算力状态不匹配的情况下,向所述云端服务器发送所述第一人声音频和所述环境声音频,以及所述音频处理请求;
49.在所述第一人声音频的信息量和所述环境声音频的信息量与所述算力状态匹配的情况下,对所述第一人声音频和所述环境声音频进行降噪处理,获取所述第一人声音频对应的目标声纹信息,并向所述云端服务器发送所述目标声纹信息。
50.本实施例中,确定所述终端当前的算力状态能否支持对所述第一人声音频和所述环境声音频的处理的方式为,确定所述第一人声音频的信息量和所述环境声音频的信息量与所述算力状态是否匹配。可选地,所述终端可以预先确定多种算力状态,并确定每种算力状态对应的最大音频处理信息量。在获取所述第一人声音频和所述环境声音频之后,可以比较所述第一人声音频和所述环境声音频的总信息量是否小于或者等于当前算力状态对应的最大音频处理信息量,在所述第一人声音频和所述环境声音频的总信息量小于或者等于当前算力状态对应的最大音频处理信息量的情况下,确定所述第一人声音频的信息量和所述环境声音频的信息量与所述算力状态匹配。
51.在所述终端请求所述云端服务器对所述第一人声音频和所述环境声音频进行降噪处理,且所述云端侧包括分布式服务器集群的情况下,所述云端侧在接收到所述音频处
理请求后,可以根据各节点服务器的算力状态和所述音频处理请求对应的信息量,基于负载均衡原则,实现所述音频处理请求的分发,确定处理所述音频处理请求的节点服务器,以进一步提高音频处理的效率。
52.需要说明的是,不论所述终端的算力状态是否支持对所述第一人声音频和所述环境声音频的处理,所述终端均可预先配置一降噪算法模块,所述降噪算法模块可以独立于声卡进行配置,也可以内置于声卡中。在其他实施例中,在所述降噪算法模块置于所述声卡,且所述声卡为所述终端的外接声卡的情况下,所述终端可以直接从所述声卡获取所述目标声纹信息,具体可根据实际情况决定,在此不作具体限定。
53.此外,本实施例中,在所述终端自行对所述第一人声音频和所述环境声音频进行降噪处理的情况下,所述终端可以在处理得到所述目标声纹信息后,将所述目标声纹信息发送至云端服务器。即,不论所述终端是否自行对所述第一人声音频和所述环境声音频进行降噪处理,所述云端服务器均可以获取到所述目标声纹信息。所述云端服务器可以存储所述目标声纹信息,以便于实现声纹信息的共享,并进行声纹比对、建模等处理,以应用到具体场景中。
54.在一可选实施方式中,所述云端服务器获取到所述目标声纹信息后,可以将其存储至预设声纹库中。所述预设声纹库用于存储各种声纹信息,将所述预设声纹库设于云端,可以实现声纹信息的共享。
55.可选地,所述对所述第一人声音频和所述环境声音频进行降噪处理,获取所述第一人声音频对应的目标声纹信息,并向所述云端服务器发送所述目标声纹信息,包括:
56.根据所述第一人声音频与所述环境声音频之间的音频信号差,得到消除环境噪声的第二人声音频;
57.基于所述第二人声音频提取所述目标声纹信息;
58.向所述云端服务器发送所述目标声纹信息。
59.本实施例中,在所述终端自行对所述第一人声音频和所述环境声音频进行降噪处理的情况下,可以利用所述音频信号差消除环境噪声。
60.具体实施时,在所述第一人声音频中人员声音为主,因此可以基于所述第一人声音频可以获取一音频信号较大的语音信号va。而所述环境声音频中环境声为主,其中可能也包含人员声音,但是基于所述环境声音频获取的语音信号 vb的音频信号较小。之后,基于语音信号va和语音信号vb的信号差进行波形分析和相位操作,可以形成相位抵消实现降噪,以得到消除环境噪声的第二人声音频。
61.在一可选实施方式中,由于采集所述第一人声音频和所述环境声音频时可能存在时间差,和/或,所述终端从麦克风获取所述第一人声音频和所述环境声音频时可能存在时间差,因此在进行降噪处理之前可以对所述第一人声音频和所述环境声音频进行同步处理,,以使后续降噪处理的准确性更高。可选地,所述终端可以通过声卡连接采集所述第一人声音频的麦克风和采集所述环境声音频的麦克风,所述声卡可以实现所述第一人声音频和所述环境声音频的同步。所述声卡可以是所述终端内置的声卡,也可以是所述终端外接的声卡,例如通用串行总线(universal serial bus,usb)声卡等移动声卡,具体可根据实际情况决定,在此不作具体限定。需要说明的是,在其他实施方式中,也可以通过其他方法实现所述第一人声音频和所述环境声音频的同步,具体可以参照相关技术中的说明,在此
不赘述。
62.需要说明的是,在所述终端请求所述云端服务器对所述第一人声音频和所述环境声音频进行降噪处理的情况下,所述云端服务器也可以利用所述音频信号差消除环境噪声,具体实施方式和有益效果可以参照上述说明,在此不作赘述。
63.可选地,所述对所述第一人声音频和所述环境声音频进行降噪处理,获取所述第一人声音频对应的目标声纹信息,并向所述云端服务器发送所述目标声纹信息,包括:
64.对所述第一人声音频和所述环境声音频进行降噪处理,获取所述第一人声音频对应的目标声纹信息;
65.获取所述目标声纹信息对应的用户信息,并将所述目标声纹信息与所述用户信息相关联;
66.向所述云端服务器发送相互关联的所述目标声纹信息与所述用户信息。
67.本实施例中,在所述终端自行对所述第一人声音频和所述环境声音频进行降噪处理的情况下,可以将处理得到所述目标声纹信息与其对应的用户信息相关联,再绑定发送至所述云端服务器,可选地,所述用户信息包括用户个人信息和用户所属地区信息中的至少一项。这样,所述云端服务器可以快速确定所述目标声纹信息对应的人员身份和/或地区信息,提高了后续进行声纹对比、建模等处理的效率。
68.需要说明的是,在所述终端请求所述云端服务器对所述第一人声音频和所述环境声音频进行降噪处理的情况下,所述云端服务器在获取所述目标声纹信息后,也可以将所述目标声纹信息与所述用户信息进行关联,具体实施方式和有益效果可以参照上述说明,在此不作赘述。
69.请参见图2,图2是本技术实施例提供的一种音频处理方法的流程示意图之二。需要说明的是,所述音频处理方法可以由云端服务器执行,所述云端服务器可以是云端的计算机、服务器等具备数据处理功能的设备或者数据平台,具体可根据实际情况决定,在此不作具体限定。
70.如图2所示,所述音频处理方法包括以下步骤:
71.步骤201、执行第一操作,所述第一操作包括以下任意一项:
72.接收终端发送的第一人声音频和环境声音频,以及音频处理请求,所述音频处理请求用于请求所述云端服务器对所述第一人声音频和所述环境声音频进行降噪处理,以获取所述第一人声音频对应的目标声纹信息;
73.接收所述终端发送的所述目标声纹信息。
74.可选地,所述执行第一操作,包括:
75.接收所述终端发送的所述第一人声音频和所述环境声音频,以及所述音频处理请求;
76.所述执行第一操作之后,所述方法还包括:
77.根据所述第一人声音频与所述环境声音频之间的音频信号差,得到消除环境噪声的第二人声音频;
78.基于所述第二人声音频提取所述目标声纹信息。
79.可选地,所述执行第一操作后,所述方法还包括:
80.在获取到所述目标声纹信息的情况下,获取所述目标声纹信息对应的用户信息,
并将所述目标声纹信息与所述用户信息相关联。
81.可选地,所述执行第一操作之后,所述方法还包括:
82.在获取到所述目标声纹信息的情况下,将所述目标声纹信息存储至预设声纹库中。
83.可选地,所述用户信息包括用户个人信息和用户所属地区信息中的至少一项。
84.需要说明的是,本实施例作为与上述方法实施例对应的云端服务器的实施方式,因此,可以参见上述方法实施例中的相关说明,且可以达到相同的有益效果。为了避免重复说明,在此不再赘述。
85.本发明实施例中介绍的多种可选的实施方式,在彼此不冲突的情况下可以相互结合实现,也可以单独实现,对此本发明实施例不作限定。
86.为方便理解,下面介绍本技术实施例的一种示例性实施方式:
87.本实施方式中的音频处理系统如图3a或3b所示。
88.本实施方式中,如图3a所示,所述音频处理系统包括指向性麦克风21、旁路麦克风22、usb声卡23、终端24,终端24为采集电脑,其上安装有声纹采集客户端。如图3b所示,所述降噪处理系统包括指向性麦克风21、旁路麦克风22、usb声卡23、终端24和云端服务器25,终端24为采集电脑,其上安装有声纹采集客户端。需要说明的是,图3a和图3b中所述降噪处理模块设置于终端24中,在其他实施方式中,所述降噪处理模块也可以设置于usb 声卡23中。
89.具体地,在采集声音时,将指向性麦克风21对准被采集人员,以采集人员声音,将旁路麦克风22置于被采集人员旁边,以收集环境声音。之后,先将指向性麦克风21和旁路麦克风22同时连接usb声卡23,再将usb声卡 23连接终端24。通过usb声卡23,可以将指向性麦克风21和旁路麦克风22 组成麦克风阵列,实现指向性麦克风21和旁路麦克风22分别采集的音频实现时间上的同步。
90.终端24上运行所述声纹采集客户端。在开始录制时,所述声纹采集客户端通过usb声卡23录制双通道音频,一通道用于指向性麦克风21的音频,一通道用于旁路麦克风22的音频。
91.所述声纹采集客户端将录制得到的双通道音频发送到所述降噪算法模块。所述降噪算法模块可以检测当前终端24的算力状态,当所述双通道音频的信息量与所述算力状态匹配的情况下,所述音频处理系统可以如图3a所示,所述声纹采集客户端可以将录制得到的双通道音频发送到所述降噪算法模块,所述降噪算法模块可以通过所述双通道音频中两个通道的音频信号差,消除环境噪声,提取纯净清晰的人声音频,并基于降噪处理后的人声音频提取目标声纹信息。之后,可以将所述目标声纹信息发送至云端服务器存储至声纹库中。
92.当所述双通道音频的信息量与所述算力状态不匹配的情况下,所述音频处理系统可以如图3b所示,所述声纹采集客户端可以将录制得到的双通道音频发送到云端侧。在所述云端侧包括分布式服务器集群的情况下,所述云端侧在接收到所述降噪处理请求后,可以根据各节点服务器的算力水平和所述降噪处理请求对应的降噪任务量,基于负载均衡原则,实现所述降噪处理请求的分发,确定处理所述降噪处理请求的节点服务器,节点服务器可以通过所述双通道音频中两个通道的音频信号差,消除环境噪声,提取纯净清晰的人声音频,并基于降噪处理后的人声音频提取目标声纹信息,然后存储至声纹库中。
93.需要说明的是,本技术实施例提供的音频处理方法,执行主体可以为音频处理装置,或者该音频处理装置中的用于执行音频处理方法的控制模块。本技术实施例中以音频处理装置执行音频处理方法为例,说明本技术实施例提供的音频处理装置。
94.参见图4,图4是本技术实施例提供的音频处理装置的结构图之一。
95.如图4所示,音频处理装置400包括:
96.获取模块401,用于获取第一人声音频和环境声音频;
97.确定模块402,用于根据所述第一人声音频的信息量、所述环境声音频的信息量和所述装置的算力状态,确定是否向云端服务器发送所述第一人声音频和所述环境声音频,以及音频处理请求,所述音频处理请求用于请求所述云端服务器对所述第一人声音频和所述环境声音频进行降噪处理,以获取所述第一人声音频对应的目标声纹信息。
98.可选地,确定模块402包括:
99.第一处理单元,用于在所述第一人声音频的信息量和所述环境声音频的信息量与所述算力状态不匹配的情况下,向所述云端服务器发送所述第一人声音频和所述环境声音频,以及所述音频处理请求;
100.第二处理单元,用于在所述第一人声音频的信息量和所述环境声音频的信息量与所述算力状态匹配的情况下,对所述第一人声音频和所述环境声音频进行降噪处理,获取所述第一人声音频对应的目标声纹信息,并向所述云端服务器发送所述目标声纹信息。
101.可选地,所述第二处理单元包括:
102.第一降噪子单元,用于根据所述第一人声音频与所述环境声音频之间的音频信号差,得到消除环境噪声的第二人声音频;
103.提取子单元,用于基于所述第二人声音频提取所述目标声纹信息;
104.第一发送子单元,用于向所述云端服务器发送所述目标声纹信息。
105.可选地,所述第二处理单元包括:
106.第二降噪子单元,用于对所述第一人声音频和所述环境声音频进行降噪处理,获取所述第一人声音频对应的目标声纹信息;
107.获取子单元,用于获取所述目标声纹信息对应的用户信息,并将所述目标声纹信息与所述用户信息相关联;
108.第二发送子单元,用于向所述云端服务器发送相互关联的所述目标声纹信息与所述用户信息。
109.可选地,所述用户信息包括用户个人信息和用户所属地区信息中的至少一项。
110.可选地,所述第一人声音频为指向性麦克风采集的人声音频。
111.音频处理装置400能够实现如图1对应的方法实施例的各个过程,以及达到相同的有益效果,为避免重复,这里不再赘述。
112.参见图5,图5是本技术实施例提供的音频处理装置的结构图之二。
113.如图5所示,音频处理装置500包括:
114.执行模块501,用于执行第一操作,所述第一操作包括以下任意一项:
115.接收终端发送的第一人声音频和环境声音频,以及音频处理请求,所述音频处理请求用于请求所述装置对所述第一人声音频和所述环境声音频进行降噪处理,以获取所述第一人声音频对应的目标声纹信息;
116.接收所述终端发送的所述目标声纹信息。
117.可选地,执行模块501具体用于:
118.接收所述终端发送的所述第一人声音频和所述环境声音频,以及所述音频处理请求;
119.音频处理装置500还包括:
120.降噪模块,用于根据所述第一人声音频与所述环境声音频之间的音频信号差,得到消除环境噪声的第二人声音频;
121.提取模块,用于基于所述第二人声音频提取所述目标声纹信息。
122.可选地,音频处理装置500还包括:
123.获取模块,用于在获取到所述目标声纹信息的情况下,获取所述目标声纹信息对应的用户信息,并将所述目标声纹信息与所述用户信息相关联。
124.可选地,音频处理装置500还包括:
125.存储模块,用于在获取到所述目标声纹信息的情况下,将所述目标声纹信息存储至预设声纹库中。
126.可选地,所述用户信息包括用户个人信息和用户所属地区信息中的至少一项。
127.音频处理装置500能够实现如图2对应的方法实施例的各个过程,以及达到相同的有益效果,为避免重复,这里不再赘述。
128.本技术实施例还提供一种电子设备。请参见图6,电子设备600可以包括处理器601、存储器602及存储在存储器602上并可在处理器601上运行的计算机程序6021,计算机程序6021被处理器601执行时可实现图1或图2对应的方法实施例中的任意步骤及达到相同的有益效果,此处不再赘述。
129.本技术实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述音频处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
130.其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(read

onlymemory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等。
131.本技术实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述音频处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
132.应理解,本技术实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
133.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本技术实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序
来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
134.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘) 中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本技术各个实施例所述的方法。
135.上面结合附图对本技术的实施例进行了描述,但是本技术并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本技术的启示下,在不脱离本技术宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本技术的保护之内。