首页 > 乐器声学 专利正文
一种声纹特征更新方法、装置、电子设备及存储介质与流程

时间:2022-02-13 阅读: 作者:专利查询

一种声纹特征更新方法、装置、电子设备及存储介质与流程

1.本技术涉及生物识别技术领域,特别是涉及一种声纹特征更新方法、装置、电子设备及存储介质。


背景技术:

2.在生物识别中,通常需要利用用户的特征对用户进行身份验证。例如,可以利用用户的人脸特征,对用户进行身份验证。为了保证身份验证的可靠性,一般采用多模态的特征进行身份验证,例如,采用声纹特征和人脸特征进行身份验证。
3.相关技术中,通常会在注册阶段获得用户的声纹特征和人脸特征,并进行存储,在验证阶段,获得待验证用户的声纹特征和人脸特征,与注册阶段所存储的声纹特征和人脸特征进行匹配,在声纹特征、人脸特征均匹配成功的情况下,认为该待验证用户验证通过。
4.上述方案虽然可以实现采用多模态的特征进行身份验证,但是随着时间的改变,用户的发声器官及发声方式可能会发生改变,导致用户的声纹特征可能会发生改变,这样在验证阶段所提取的声纹特征可能难以与注册阶段的声纹特征相匹配,从而导致身份验证的可靠性降低。


技术实现要素:

5.本技术实施例的目的在于提供一种声纹特征更新方法、装置、电子设备及存储介质,以提高身份验证的可靠性。具体技术方案如下:
6.第一方面,本技术实施例提供了一种声纹特征更新方法,所述方法包括:
7.获得待验证用户的语音数据,根据所获得的语音数据提取所述待验证用户的声纹特征,并获得所述待验证用户的其它生物数据,根据所获得的其他生物数据提取所述待验证用户的其他生物特征,其中,所述其他生物数据为:除语音数据之外的、支持进行身份验证的生物数据;
8.计算所提取的声纹特征与已注册的注册用户的声纹特征之间的第一相似度,并计算所提取的其他生物特征与所述注册用户的其他生物特征之间的第二相似度;
9.在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征。
10.本技术的一个实施例中,所述声纹容错阈值小于声纹验证阈值,所述身份表征阈值大于其他特征验证阈值,所述声纹验证阈值、其他特征验证阈值为:用于基于声纹特征、其他生物特征进行身份验证的阈值;
11.所述方法还包括:
12.在所述第一相似度大于所述声纹验证阈值、且所述第二相似度大于所述其他特征验证阈值的情况下,确定所述待验证用户与所述注册用户为同一用户;和/或
13.在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,确定所述待验证用户与所述注册用户为同一用户。
14.本技术的一个实施例中,所述在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征,包括:
15.在所述第一相似度大于声纹容错阈值且小于所述声纹验证阈值、所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征。
16.本技术的一个实施例中,所述在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征,包括:
17.确定所获得的语音数据的语音质量;
18.在确定的语音质量满足预设的语音质量条件、所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征。
19.本技术的一个实施例中,所述在确定的语音质量满足预设的语音质量条件、所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征,包括:
20.确定所获得的其他生物数据的数据质量;
21.在所确定的语音质量满足预设的语音质量条件、所确定的数据质量满足预设的数据质量条件、所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征。
22.本技术的一个实施例中,所述确定所获得的语音数据的语音质量,包括:
23.根据所获得的语音数据,确定反映所述待验证用户说话环境嘈杂程度的声纹环境质量;和/或
24.对所获得的语音数据进行语义识别,基于识别结果确定反映待验证用户说话内容的声纹内容质量。
25.本技术的一个实施例中,所述在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征,包括:
26.在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,存储所提取的声纹特征,作为用于对所述注册用户的声纹特征进行更新的目标特征;
27.在所存储的目标特征的数量达到预设数量的情况下,利用所存储的目标特征更新所述注册用户的声纹特征。
28.本技术的一个实施例中,所述在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,存储所提取的声纹特征,作为用于对所述注册用户的声纹特征进行更新的目标特征,包括:
29.在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值、且时间间隔超过预设时长的情况下,存储所提取的声纹特征,作为用于对所述注册用户的声纹特征进行更新的目标特征,其中,所述时间间隔为:上一次存储目标特征的时间与当前时间的间隔。
30.本技术的一个实施例中,通过以下方式获得所述注册用户的声纹特征:
31.获得所述注册用户的语音数据,确定所获得的语音数据的语音质量;
32.在所确定的语音质量满足预设的语音质量条件的情况下,根据所获得的语音数据提取所述注册用户的声纹特征。
33.本技术的一个实施例中,通过以下方式获得所述注册用户的其他生物特征:
34.获得所述注册用户的其他生物数据,确定所获得的其他生物数据的数据质量;
35.在所确定的数据质量满足预设的数据质量条件的情况下,根据所获得的其他生物数据提取所述注册用户的其他生物特征。
36.第二方面,本技术实施例提供了一种声纹特征更新装置,所述装置包括:
37.声纹特征获得模块,用于获得待验证用户的语音数据,根据所获得的语音数据提取所述待验证用户的声纹特征;
38.其他特征获得模块,用于获得所述待验证用户的其它生物数据,根据所获得的其他生物数据提取所述待验证用户的其他生物特征,其中,所述其他生物数据为:除语音数据之外的、支持进行身份验证的生物数据;
39.第一相似度计算模块,用于计算所提取的声纹特征与已注册的注册用户的声纹特征之间的第一相似度,并计算所提取的其他生物特征与所述注册用户的其他生物特征之间的第二相似度;
40.特征更新模块,用于在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征。
41.本技术的一个实施例中,所述声纹容错阈值小于声纹验证阈值,所述身份表征阈值大于其他特征验证阈值,所述声纹验证阈值、其他特征验证阈值为:用于基于声纹特征、其他生物特征进行身份验证的阈值;
42.所述装置还包括身份验证模块,用于:
43.在所述第一相似度大于所述声纹验证阈值、且所述第二相似度大于所述其他特征验证阈值的情况下,确定所述待验证用户与所述注册用户为同一用户;和/或
44.在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,确定所述待验证用户与所述注册用户为同一用户。
45.本技术的一个实施例中,所述特征更新模块,具体用于:
46.在所述第一相似度大于声纹容错阈值且小于所述声纹验证阈值、所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征。
47.本技术的一个实施例中,所述特征更新模块,包括:
48.语音质量确定单元,用于确定所获得的语音数据的语音质量;
49.第一特征更新单元,用于在确定的语音质量满足预设的语音质量条件、所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征。
50.本技术的一个实施例中,所述特征更新单元,具体用于:
51.确定所获得的其他生物数据的数据质量;
52.在所确定的语音质量满足预设的语音质量条件、所确定的数据质量满足预设的数据质量条件、所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征。
53.本技术的一个实施例中,所述语音质量确定单元,具体用于:
54.根据所获得的语音数据,确定反映所述待验证用户说话环境嘈杂程度的声纹环境质量;和/或
55.对所获得的语音数据进行语义识别,基于识别结果确定反映待验证用户说话内容的声纹内容质量。
56.本技术的一个实施例中,所述特征更新模块,包括:
57.特征存储单元,用于在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,存储所提取的声纹特征,作为用于对所述注册用户的声纹特征进行更新的目标特征;
58.第二特征更新单元,用于在所存储的目标特征的数量达到预设数量的情况下,利用所存储的目标特征更新所述注册用户的声纹特征。
59.本技术的一个实施例中,所述特征存储单元,具体用于:
60.在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值、且时间间隔超过预设时长的情况下,存储所提取的声纹特征,作为用于对所述注册用户的声纹特征进行更新的目标特征,其中,所述时间间隔为:上一次存储目标特征的时间与当前时间的间隔。
61.本技术的一个实施例中,所述装置还包括第一注册模块,用于通过以下方式获得所述注册用户的声纹特征:
62.获得所述注册用户的语音数据,确定所获得的语音数据的语音质量;
63.在所确定的语音质量满足预设的语音质量条件的情况下,根据所获得的语音数据提取所述注册用户的声纹特征。
64.本技术的一个实施例中,所述装置还包括第二注册模块,用于通过以下方式获得所述注册用户的其他生物特征:
65.获得所述注册用户的其他生物数据,确定所获得的其他生物数据的数据质量;
66.在所确定的数据质量满足预设的数据质量条件的情况下,根据所获得的其他生物数据提取所述注册用户的其他生物特征。
67.第三方面,本技术实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
68.存储器,用于存放计算机程序;
69.处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的方法步骤。
70.第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一所述的方法步骤。
71.本技术实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的声纹特征更新方法。
72.本技术实施例有益效果:
73.本技术实施例提供的声纹特征更新方案中,可以获得待验证用户的语音数据,根据所获得的语音数据提取待验证用户的声纹特征,并获得待验证用户的其它生物数据,根据所获得的其他生物数据提取待验证用户的其他生物特征,其中,其他生物数据为:除语音
数据之外的、支持进行身份验证的生物数据;计算所提取的声纹特征与已注册的注册用户的声纹特征之间的第一相似度,并计算所提取的其他生物特征与注册用户的其他生物特征之间的第二相似度;在第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新注册用户的声纹特征。这样在待验证用户的其他生物特征与注册用户的其他生物特征之间的相似度大于身份表征阈值、且待验证用户的声纹特征与注册用户的声纹特征之间的相似度大于声纹容错阈值的情况下,认为待验证用户与注册用户可能为同一用户,而由于注册用户的声音发生改变,导致当前进行身份验证时所获得的声纹特征与注册时的声纹特征存在差异,因此可以利用当前所获得的声纹特征对该注册用户的声纹特征进行更新,保证注册用户的声纹特征与当前的声音相匹配,便于后续基于更新后的声纹特征进行身份验证。由此可见,应用本技术实施例提供的声纹特征更新方案,能够提高身份验证的可靠性。
附图说明
74.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的实施例。
75.图1为本技术实施例提供的一种声纹特征更新方法的流程示意图;
76.图2为本技术实施例提供的另一种声纹特征更新方法的流程示意图;
77.图3为本技术实施例提供的一种声纹特征更新过程的示意图;
78.图4为本技术实施例提供的一种利用声纹特征进行身份验证的过程示意图;
79.图5为本技术实施例提供的一种声纹特征更新装置的结构示意图;
80.图6为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
81.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员基于本技术所获得的所有其他实施例,都属于本技术保护的范围。
82.在采用多模态的特征进行身份验证的场景中,由于语音交互的便利性与安全性,通常会将声纹特征作为其中一种模态进行进行身份验证。但是由于随着年龄的增大,人体器官以及发声方式会发生细微变化,导致声纹特征存在一定时变性,因此在实际应用中,利用声纹特征进行身份验证时,随着时间推移可能存在性能下降的问题,导致借助声纹特征进行身份验证的方案的可靠性较低。
83.为了提高身份验证的可靠性,本技术实施例提供了一种声纹特征更新方法、装置、电子设备及存储介质,下面分别进行详细介绍。
84.本技术的一个实施例中,提供了一种声纹特征更新方法,该方法可以应用于手机、门禁设备、计算机、服务器等电子设备中,适用于需要利用多模态的特征进行身份验证的场景,该方法包括:
85.获得待验证用户的语音数据,根据所获得的语音数据提取待验证用户的声纹特征,并获得待验证用户的其它生物数据,根据所获得的其他生物数据提取待验证用户的其他生物特征,其中,其他生物数据为:除语音数据之外的、支持进行身份验证的生物数据;
86.计算所提取的声纹特征与已注册的注册用户的声纹特征之间的第一相似度,并计算所提取的其他生物特征与注册用户的其他生物特征之间的第二相似度;
87.在第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新注册用户的声纹特征。
88.这样在待验证用户的其他生物特征与注册用户的其他生物特征之间的相似度大于身份表征阈值、且待验证用户的声纹特征与注册用户的声纹特征之间的相似度大于声纹容错阈值的情况下,认为待验证用户与注册用户可能为同一用户,而由于注册用户的声音发生改变,导致当前进行身份验证时所获得的声纹特征与注册时的声纹特征存在差异,因此可以利用当前所获得的声纹特征对该注册用户的声纹特征进行更新,保证注册用户的声纹特征与当前的声音相匹配,便于后续基于更新后的声纹特征进行身份验证。由此可见,应用上述实施例提供的声纹特征更新方案,能够提高身份验证的可靠性。
89.下面对上述声纹特征更新方法进行详细介绍。
90.参见图1,图1为本技术实施例提供的一种声纹特征更新方法的流程示意图,该方法包括如下步骤s101

s103:
91.s101,获得待验证用户的语音数据,根据所获得的语音数据提取待验证用户的声纹特征,并获得待验证用户的其它生物数据,根据所获得的其他生物数据提取待验证用户的其他生物特征。
92.其中,上述待验证用户为需要进行身份验证的用户。
93.上述语音数据为采集的语音,例如,可以采集待验证用户随机说的语音片段,得到语音数据,也可以采集待验证用户阅读预设文本的语音片段,得到语音数据,上述预设文本可以是“小艺小艺”、“hey,siri”、“74629854”等。
94.上述声纹特征可以为基频、共振峰等特征。
95.上述其他生物数据为:除语音数据之外的、支持进行身份验证的生物数据,可以是除声音之外的、其他模态的数据,如用户的人脸图像数据、指纹数据、虹膜数据等。
96.上述其他生物特征为:除声纹特征之外的、支持进行身份验证的生物特征,如人脸特征、指纹特征、虹膜特征等。
97.具体的,可以获得待验证用户的语音数据,对该语音数据进行特征提取,从而得到待验证用户的声纹特征,并获得待验证用户的其他生物数据,对该其他生物数据进行特征提取,得到待验证用户的其他生物特征。
98.本技术的一个实施例中,可以直接采集待验证用户所说的语音片段,得到上述语音数据;也可以接收语音采集设备采集的、待验证用户所说的语音片段,得到语音数据,该语音采集设备可以是麦克风、拾音器、手机等。
99.相对应地,可以直接采集待验证用户的其他生物数据;也可以接收其他生物数据采集设备采集的其他生物数据,该其他生物数据采集设备可以是摄像机、指纹采集器等。
100.本技术的一个实施例中,可以利用声纹特征提取模型对所获得的语音数据进行特征提取,得到声纹特征;也可以将所获得的语音数据转化为音频频谱数据,对该音频频谱数
据进行分析,得到声纹特征。
101.相对应地,可以利用其他特征提取模型对所获得的其他生物数据进行特征提取,得到其他生物特征;也可以利用预设的算法对所获得的其他生物数据进行特征提取,得到其他生物特征,上述算法可以是边缘提取算法、图像分割算法等。
102.s102,计算所提取的声纹特征与已注册的注册用户的声纹特征之间的第一相似度,并计算所提取的其他生物特征与注册用户的其他生物特征之间的第二相似度。
103.其中,上述注册用户为:预先注册的用户。
104.具体的,在注册阶段,可以获得注册用户语音数据和其他生物数据,基于上述数据得到注册用户的声纹特征和其他生物特征,并对上述特征进行存储,便于后续基于所存储的声纹特征和其他生物特征进行身份验证。除此之外,还可以获得注册用户的身份标识,便于后续确定验证通过的用户的身份标识,上述身份标识可以是用户的姓名、身份证号、工号等。
105.在验证阶段,可以计算待验证用户的声纹特征与所存储的注册用户的声纹特征之间的相似度,作为第一相似度,第一相似度越高,说明待验证用户与注册用户为同一用户的可能性越大;
106.并计算待验证用户的其他生物特征与所存储的注册用户的其他生物特征之间的相似度,作为第二相似度,第二相似度越高,说明待验证用户与注册用户为同一用户的可能性越大。
107.本技术的一个实施例中,在计算特征之间的相似度时,可以计算特征之间的欧氏距离、余弦相似度、曼哈顿距离等,作为特征之间的相似度。
108.s103,在第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新注册用户的声纹特征。
109.其中,上述声纹容错阈值、身份表征阈值均为预设的阈值。
110.具体的,在第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值的情况下,说明待验证用户与注册用户可能为同一用户,因此可以利用当前获得的待验证用户的声纹特征,对所存储的注册用户的声纹特征进行更新,以保证更新后的声纹特征与当前注册用户的声纹特征更加匹配,便于后续利用更新后的声纹特征进行身份验证。
111.本技术的一个实施例中,在利用所提取的声纹特征更新注册用户的声纹特征时,可以直接将注册用户的声纹特征更新为所提取的声纹特征,也可以计算所提取的声纹特征与已存储的声纹特征之间的加权平均值,作为更新后的声纹特征等。
112.具体的,可以按照以下公式计算更新后的声纹特征e
new

113.e
new
=α*e
old
+β*e
update
114.其中,上述α表示第一权重,上述e
old
表示当前存储的注册用户的声纹特征,β表示第二权重,e
update
表示所提取的声纹特征,上述第一权重、第二权重之和可以为1。
115.这样在待验证用户的其他生物特征与注册用户的其他生物特征之间的相似度大于身份表征阈值、且待验证用户的声纹特征与注册用户的声纹特征之间的相似度大于声纹容错阈值的情况下,认为待验证用户与注册用户可能为同一用户,但由于注册用户的声音发生改变,导致当前进行身份验证时所获得的声纹特征与注册时的声纹特征存在差异,因此可以利用当前所获得的声纹特征对该注册用户的声纹特征进行更新,保证注册用户的声
纹特征与当前的声音相匹配,便于后续基于更新后的声纹特征进行身份验证。由此可见,应用上述实施例提供的声纹特征更新方案,能够提高身份验证的可靠性。
116.本技术的一个实施例中,声纹容错阈值小于声纹验证阈值,身份表征阈值大于其他特征验证阈值,声纹验证阈值、其他特征验证阈值为:用于基于声纹特征、其他生物特征进行身份验证的阈值。
117.在上述方案的基础上,在身份验证阶段可以存在多种情况,下面对上述多种情况进行介绍。
118.情况一:在第一相似度大于声纹验证阈值、且第二相似度大于其他特征验证阈值的情况下,确定待验证用户与注册用户为同一用户。
119.具体的,在待验证用户的其他生物特征与注册用户的其他生物特征之间的第二相似度大于其他特征验证阈值、且待验证用户的声纹特征与注册用户的声纹特征之间的相似度大于声纹验证阈值的情况下,认为待验证用户与注册用户之间的声纹特征相似、且其他生物特征相似,可以直接确定待验证用户与注册用户可能为同一用户。
120.本技术的一个实施例中,在上述情况下,可以利用所提取的声纹特征对注册用户的声纹特征进行更新,实现声纹特征的自适应更新;
121.也可以不对注册用户的声纹特征进行更新,由于所提取的声纹特征与当前存储的声纹特征较为接近,说明注册用户的声音未发生较大改变,因此无需对注册用户的声纹特征进行更新,从而节省计算资源。
122.情况二:在第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值的情况下,确定待验证用户与注册用户为同一用户。
123.具体的,在待验证用户的其他生物特征与注册用户的其他生物特征之间的第二相似度大于身份表征阈值、且待验证用户的声纹特征与注册用户的声纹特征之间的第一相似度大于声纹容错阈值的情况下,由于待验证用户与注册用户之间的其他生物特征相似度较高,并且待验证用户与注册用户之间的声纹特征较为相似,无论上述第一相似度是否高于声纹验证阈值,都可以认为待验证用户与注册用户可能为同一用户。
124.本技术的一个实施例中,在第一相似度大于声纹容错阈值且小于声纹验证阈值、第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新注册用户的声纹特征。
125.具体的,在满足以下公式的情况下,可以利用所提取的声纹特征更新注册用户的声纹特征:
126.threshold
voice_low
<score
voice
<threshold
voice_normal
127.threshold
face_normal
<threshold
face_high
<score
face
128.其中,上述threshold
voice_low
表示声纹容错阈值,score
voice
表示待验证用户的声纹特征与注册用户的声纹特征之间的第一相似度,threshold
voice_normal
表示声纹验证阈值;
129.threshold
face_normal
表示其他特征验证阈值,threshold
face_high
表示身份表征阈值,score
face
表示待验证用户的其他生物特征与注册用户的其他生物特征之间的第二相似度。
130.上述方案中,在第二相似度大于身份表征阈值、且第一相似度大于声纹容错阈值的情况下,可以认为待验证用户与注册用户为同一用户,又由于第一相似度小于声纹验证阈值,说明注册用户的声音发生了较大改变,因此需要利用所提取的声纹特征对注册用户
的声纹特征进行更新,实现声纹特征的自适应更新,便于后续基于更新后的声纹特征进行身份验证。
131.本技术的一个实施例中,对于上述步骤s103在更新声纹特征时,可以:
132.在第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值的情况下,存储所提取的声纹特征,作为用于对注册用户的声纹特征进行更新的目标特征;在所存储的目标特征的数量达到预设数量的情况下,利用所存储的目标特征更新注册用户的声纹特征。
133.其中,上述预设数量可以是5、10、20等。
134.具体的,针对当前的待验证用户,当第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值时,可以将该待验证用户的声纹特征作为目标特征进行存储备用,当所存储的目标特征的数量达到预设数量时,可以确定注册用户的声音确实发生了较大的改变,因此可以利用所存储的目标特征更新用户的声纹特征,这样可以防止偶然情况下用户的声音发生改变而导致注册用户的声纹特征被更新,可以提高声纹特征更新的可靠性。
135.本技术的一个实施例中,可以计算预设数量个目标特征与注册用户的声纹特征之间的加权平均值,作为更新后的声纹特征;
136.还可以计算上述预设数量个目标特征之间的算数平均值,得到平均特征,然后计算平均特征与注册用户的声纹特征之间的加权平均值,作为更新后的声纹特征;
137.另外也可以直接将上述平均特征作为更新后的声纹特征,本技术实施例并不对此进行限定。
138.本技术的一个实施例中,在第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值、且时间间隔超过预设时长的情况下,存储所提取的声纹特征,作为用于对注册用户的声纹特征进行更新的目标特征。
139.其中,时间间隔为:上一次存储目标特征的时间与当前时间的间隔。
140.上述预设时长可以是5小时、1天、7天等,本技术实施例并不对此进行限定。
141.具体的,可以每间隔至少上述预设时长获得一次对应的第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值的待验证用户的声纹特征,利用所获得的声纹特征对注册用户的声纹特征进行更新,这样可以避免频繁地对已存储的注册用户的声纹特征进行更新,防止利用声纹特征对用于进行身份验证的声纹特征进行攻击。
142.本技术的一个实施例中,可以确定所获得的语音数据的语音质量,在确定的语音质量满足预设的语音质量条件、第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新注册用户的声纹特征。
143.其中,上述语音质量可以反映语音数据的质量,进而可以反映基于语音数据所得到的声纹特征的质量。
144.具体的,在语音质量满足预设的语音质量条件的情况下,说明所提取的声纹特征的质量较高,因此在第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值的情况下,可以利用所提取的声纹特征更新注册用户的声纹特征;
145.在语音质量不满足语音质量条件的情况下,说明所提取的声纹特征的质量较低,因此可以不对注册用户的声纹特征进行更新。
146.本技术的一个实施例中,在确定所获得的语音数据的语音质量时,可以根据所获
得的语音数据,确定反映待验证用户说话环境嘈杂程度的声纹环境质量。
147.具体的,可以计算语音数据的语音分离度、信噪比等,得到声纹环境质量,该质量可以反映待验证用户说话时周围环境的嘈杂程度,声纹环境质量越高,说明环境越安静,基于该语音数据所得到的声纹特征的质量越高;声纹环境质量越低,说明环境越嘈杂,基于该语音数据所得到的声纹特征的质量越低。
148.除此之外,也可以对所获得的语音数据进行语义识别,基于识别结果确定反映待验证用户说话内容的声纹内容质量。
149.具体的,可以对上述语音数据进行语义识别,得到识别结果,该识别结果可以反映待验证用户的说话内容,基于识别结果确定声纹内容质量,在待验证用户所说话的内容有实际含义时,例如说话内容为“天气不错”时,声纹内容质量较高,基于该语音数据所得到的声纹特征的质量较高;在待验证用户所说话的内容没有实际含义时,例如说话内容为“啊啊啊啊啊”时,声纹内容质量较低,基于该语音数据所得到的声纹特征的质量较低。
150.本技术的一个实施例中,还可以确定所获得的其他生物数据的数据质量;在所确定的语音质量满足预设的语音质量条件、所确定的数据质量满足预设的数据质量条件、第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新注册用户的声纹特征。
151.其中,上述数据质量能够反映所获得的其他生物数据的质量,进而能够反映基于其他生物数据所得到的其他生物特征的质量。
152.例如,假设上述其他生物数据为人脸图像,则数据质量可以反映图像质量,在人脸图像的信噪比较高、畸变较小的情况下,该人脸图像的数据质量较高,基于该人脸图像得到的人脸特征的质量较高。
153.具体的,在所确定的语音质量满足预设的语音质量条件、所确定的数据质量满足预设的数据质量条件的情况下,说明提取得到的声纹特征、其他生物特征的质量较高,因此在第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值的情况下,可以利用所提取的声纹特征更新注册用户的声纹特征;
154.在语音质量不满足语音质量条件或数据质量不满足数据质量条件的情况下,说明所提取的声纹特征或其他生物特征的质量较低,因此可以不对注册用户的声纹特征进行更新。
155.参见图2,图2为本技术实施例提供的另一种声纹特征更新方法的流程示意图,该方法包括如下步骤s201

s206:
156.s201,获得待验证用户的语音数据,根据所获得的语音数据提取待验证用户的声纹特征,并获得待验证用户的其它生物数据,根据所获得的其他生物数据提取待验证用户的其他生物特征。
157.s202,计算所提取的声纹特征与已注册的注册用户的声纹特征之间的第一相似度,并计算所提取的其他生物特征与注册用户的其他生物特征之间的第二相似度。
158.s203,在第一相似度大于声纹验证阈值、且第二相似度大于其他特征验证阈值的情况下,确定待验证用户与注册用户为同一用户,认为待验证用户验证通过;若为否,则执行步骤s204。
159.s204,在第一相似度不大于声纹验证阈值、或第二相似度不大于其他特征验证阈
值的情况下,确定所获得的语音数据的语音质量,确定所获得的其他生物数据的数据质量。
160.s205,在所确定的语音质量满足预设的语音质量条件、且所确定的数据质量满足预设的数据质量条件的情况下,若第一相似度大于声纹容错阈值且小于声纹验证阈值、第二相似度大于身份表征阈值、且时间间隔超过预设时长,存储所提取的声纹特征,作为用于对注册用户的声纹特征进行更新的目标特征。
161.其中,时间间隔为:上一次存储目标特征的时间与当前时间的间隔。
162.s206,在所存储的目标特征的数量达到预设数量的情况下,利用所存储的目标特征更新注册用户的声纹特征。
163.本技术的一个实施例中,可以通过以下方式获得注册用户的声纹特征:
164.获得注册用户的语音数据,确定所获得的语音数据的语音质量;在所确定的语音质量满足预设的语音质量条件的情况下,根据所获得的语音数据提取注册用户的声纹特征。
165.具体的,可以获得注册用户的语音片段,得到注册用户的语音数据,确定上述语音数据的语音质量,若上述语音质量满足语音质量条件,则说明注册用户说话的环境较为安静,基于该语音数据得到的声纹特征的质量较高,因此可以根据该语音数据,提取得到注册用户的声纹特征。
166.相对应地,可以通过以下方式获得注册用户的其他生物特征:
167.获得注册用户的其他生物数据,确定所获得的其他生物数据的数据质量;在所确定的数据质量满足预设的数据质量条件的情况下,根据所获得的其他生物数据提取注册用户的其他生物特征。
168.具体的,可以获得注册用户的其他生物数据,确定上述其他生物数据的数据质量,若上述数据质量满足数据质量条件,则说明基于该其他生物数据得到的其他生物特征的质量较高,因此可以根据该其他生物数据,提取得到注册用户的其他生物特征。
169.参见图3,图3为本技术实施例提供的一种声纹特征更新过程的示意图。如图3所示,可以首先采集待验证用户的语音数据和人脸图像,对上述语音数据进行特征提取得到待验证用户的声纹特征,对上述人脸图像进行特征提取得到待验证用户的人脸特征;
170.分别基于上述待验证用户的声纹特征、人脸特征与注册用户的声纹特征、人脸特征进行比对,具体可以计算待验证用户的声纹特征与已注册的注册用户的声纹特征之间的第一相似度,并计算待验证用户的人脸特征与注册用户的人脸特征之间的第二相似度;
171.基于上述第一相似度、第二相似度对待验证用户进行身份验证,在第一相似度大于声纹验证阈值、且第二相似度大于人脸特征验证阈值的情况下,确定待验证用户与注册用户为同一用户,认为待验证用户验证通过;
172.基于上述语音数据和人脸图像分析当前的环境质量,具体可以确定所获得的语音数据的语音质量,并确定所获得的人脸图像的图像质量;
173.利用上述环境质量、第一相似度、第二相似度,判断是否可以利用该声纹特征进行更新,在所确定的语音质量满足预设的语音质量条件、且所确定的图像质量满足预设的图像质量条件的情况下,若第一相似度大于声纹容错阈值且小于声纹验证阈值、第二相似度大于身份表征阈值、且时间间隔超过预设时长,存储所提取的声纹特征,作为用于对注册用户的声纹特征进行更新的目标特征;
174.其中,时间间隔为:上一次存储目标特征的时间与当前时间的间隔;
175.在所存储的目标特征的数量达到预设数量的情况下,利用所存储的目标特征更新注册用户的声纹特征。
176.为了更清楚地描述本方案,下面对声纹进行介绍。
177.声纹识别技术,也称作说话人识别技术,是一种通过声音判别说话人身份的技术。从直觉上来说,声纹虽然不像人脸、指纹的个体差异那样直观可见,但由于每个人的声道、口腔、鼻腔等发声器官也具有个体的差异性,因此反映到声音上也具有差异性。最直观的是,当我们打电话给家里的时候,通过一声“喂?”,就能准确地分辨出接电话的是爸妈或是兄弟姐妹,这种声音中承载的说话人身份信息的唯一性,使得声纹也可以像人脸、指纹那样作为生物识别技术的生力军,辅助甚至替代传统的数字符号密码,在安防和个人信息加密的领域发挥重要的作用。
178.参见图4,图4为本技术实施例提供的一种利用声纹特征进行身份验证的过程示意图,该过程可分为两个部分:声纹注册和声纹验证。
179.在声纹注册部分,可以采集目标说话人的语音数据,对该部分语音数据进行vad检测(voice activity detection,语音活动检测),去除语音数据中静音部分,对语音数据进行语音增强,检测语音数据质量,实现有效语音提取,将提取后的有效语音输入声纹特征提取模型中,利用提取算法提取得到声纹特征,将该声纹特征保存至语音数据库,作为该目标说话人的声纹特征;
180.在声纹验证阶段,可以通过与声纹注册部分相同的流程,提取得到说话人的声纹特征,利用比对算法对该声纹特征与语音数据库中的声纹特征进行比对,基于比对结果进行身份验证,进而得到身份验证结果。
181.上述实施例提供的声纹特征更新方案中,可以获得待验证用户的语音数据,根据所获得的语音数据提取声纹特征,并获得待验证用户的其它生物数据,根据所获得的其他生物数据提取其他生物特征,其中,其他生物数据为:除语音数据之外的、支持进行身份验证的生物数据;计算所提取的声纹特征与已注册的注册用户的声纹特征之间的第一相似度,并计算所提取的其他生物特征与注册用户的其他生物特征之间的第二相似度;在第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新注册用户的声纹特征。这样在待验证用户的其他生物特征与注册用户的其他生物特征之间的相似度大于身份表征阈值、且待验证用户的声纹特征与注册用户的声纹特征之间的相似度大于声纹容错阈值的情况下,认为待验证用户与注册用户可能为同一用户,而由于注册用户的声音发生改变,导致当前进行身份验证时所获得的声纹特征与注册时的声纹特征存在差异,因此可以利用当前所获得的声纹特征对该注册用户的声纹特征进行更新,保证注册用户的声纹特征与当前的声音相匹配,便于后续基于更新后的声纹特征进行身份验证。由此可见,应用上述实施例提供的声纹特征更新方案,能够提高身份验证的可靠性。
182.与上述声纹特征更新方法相对应地,本技术实施例还提供了一种声纹特征更新装置,下面进行详细介绍。
183.参见图5,图5为本技术实施例提供的一种声纹特征更新装置的结构示意图,所述装置包括:
184.声纹特征获得模块501,用于获得待验证用户的语音数据,根据所获得的语音数据提取所述待验证用户的声纹特征;
185.其他特征获得模块502,用于获得所述待验证用户的其它生物数据,根据所获得的其他生物数据提取所述待验证用户的其他生物特征,其中,所述其他生物数据为:除语音数据之外的、支持进行身份验证的生物数据;
186.相似度计算模块503,用于计算所提取的声纹特征与已注册的注册用户的声纹特征之间的第一相似度,并计算所提取的其他生物特征与所述注册用户的其他生物特征之间的第二相似度;
187.特征更新模块504,用于在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征。
188.本技术的一个实施例中,所述声纹容错阈值小于声纹验证阈值,所述身份表征阈值大于其他特征验证阈值,所述声纹验证阈值、其他特征验证阈值为:用于基于声纹特征、其他生物特征进行身份验证的阈值;
189.所述装置还包括身份验证模块,用于:
190.在所述第一相似度大于所述声纹验证阈值、且所述第二相似度大于所述其他特征验证阈值的情况下,确定所述待验证用户与所述注册用户为同一用户;和/或
191.在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,确定所述待验证用户与所述注册用户为同一用户。
192.本技术的一个实施例中,所述特征更新模块504,具体用于:
193.在所述第一相似度大于声纹容错阈值且小于所述声纹验证阈值、所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征。
194.本技术的一个实施例中,所述特征更新模块504,包括:
195.语音质量确定单元,用于确定所获得的语音数据的语音质量;
196.第一特征更新单元,用于在确定的语音质量满足预设的语音质量条件、所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征。
197.本技术的一个实施例中,所述特征更新单元,具体用于:
198.确定所获得的其他生物数据的数据质量;
199.在所确定的语音质量满足预设的语音质量条件、所确定的数据质量满足预设的数据质量条件、所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新所述注册用户的声纹特征。
200.本技术的一个实施例中,所述语音质量确定单元,具体用于:
201.根据所获得的语音数据,确定反映所述待验证用户说话环境嘈杂程度的声纹环境质量;和/或
202.对所获得的语音数据进行语义识别,基于识别结果确定反映待验证用户说话内容的声纹内容质量。
203.本技术的一个实施例中,所述特征更新模块504,包括:
204.特征存储单元,用于在所述第一相似度大于声纹容错阈值、且所述第二相似度大于身份表征阈值的情况下,存储所提取的声纹特征,作为用于对所述注册用户的声纹特征
architecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
219.通信接口用于上述电子设备与其他设备之间的通信。
220.存储器可以包括随机存取存储器(random access memory,ram),也可以包括非易失性存储器(non

volatile memory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
221.上述的处理器可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field

programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
222.在本技术提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一声纹特征更新方法的步骤。
223.在本技术提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一声纹特征更新方法。
224.上述实施例提供的声纹特征更新方案中,可以获得待验证用户的语音数据,根据所获得的语音数据提取声纹特征,并获得待验证用户的其它生物数据,根据所获得的其他生物数据提取其他生物特征,其中,其他生物数据为:除语音数据之外的、支持进行身份验证的生物数据;计算所提取的声纹特征与已注册的注册用户的声纹特征之间的第一相似度,并计算所提取的其他生物特征与注册用户的其他生物特征之间的第二相似度;在第一相似度大于声纹容错阈值、且第二相似度大于身份表征阈值的情况下,利用所提取的声纹特征更新注册用户的声纹特征。这样在待验证用户的其他生物特征与注册用户的其他生物特征之间的相似度大于身份表征阈值、且待验证用户的声纹特征与注册用户的声纹特征之间的相似度大于声纹容错阈值的情况下,认为待验证用户与注册用户可能为同一用户,而由于注册用户的声音发生改变,导致当前进行身份验证时所获得的声纹特征与注册时的声纹特征存在差异,因此可以利用当前所获得的声纹特征对该注册用户的声纹特征进行更新,保证注册用户的声纹特征与当前的声音相匹配,便于后续基于更新后的声纹特征进行身份验证。由此可见,应用上述实施例提供的声纹特征更新方案,能够提高身份验证的可靠性。
225.在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者
是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solid state disk(ssd))等。
226.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
227.本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例、电子设备实施例、计算机可读存储介质实施例、计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
228.以上所述仅为本技术的较佳实施例,并非用于限定本技术的保护范围。凡在本技术的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本技术的保护范围内。