首页 > 乐器声学 专利正文
音频采集设备、无线耳机以及电子设备系统的制作方法

时间:2022-02-24 阅读: 作者:专利查询

音频采集设备、无线耳机以及电子设备系统的制作方法

1.本公开涉及一种音频采集技术,特别涉及基于音频采集的语音唤醒技术。


背景技术:

2.随着芯片技术以及诸如蓝牙等的无线通信技术的发展,特别是随着tws(true wireless stereo,真正的无线立体声)的推出,无线耳机等无线音频设备越来越多地获得人们的青睐。
3.以无线耳机为例,不但设置有扬声器,而且还设置有麦克风、蓝牙通信模块、片上系统芯片等等,以便实现各种功能。另外,无线耳机上还需要设置电池,以便向无线耳机上设置的这些电子器件供电。
4.通过这些器件,无线耳机可以与诸如手机等电子设备进行蓝牙通信,可以从电子设备接收需要播放的音频内容,还可以向电子设备发送自带麦克风所采集的声音。
5.向电子设备发送的声音,可以是电话通话过程中的语音通话内容等。
6.另外,在一些场景下,还可以采用无线耳机的麦克风采集的语音来执行一些其它的功能,例如语音唤醒(voice trigger)功能,以便唤醒电子设备或电子设备上的应用(app)。
7.为实现这样的功能,需要执行语音识别等一些较为复杂的处理,这些处理往往会耗费较多的电池电量。
8.而另一方面,作为无线设备,电池充满电量后能够持续使用的时间也已成为人们关注的重要参数。
9.电池耗电量涉及两方面。一方面在于电池技术本身,如何在不显著增大电池占用体积的情况下,使电池具有更大的蓄电量。另一方面则在于设备各器件运行所需的耗电量,如何在实现各种期望功能的同时使用更少的电量。
10.因此,仍然需要一种能够减少无线耳机等音频设备在实现诸如语音唤醒等功能时所耗费的电量的音频采集方案。


技术实现要素:

11.本公开要解决的一个技术问题是提供一种能够减少无线耳机等音频设备在实现诸如语音唤醒等功能时所耗费的电量的音频采集设备、无线耳机和电子设备系统。
12.根据本公开的第一个方面,提供了一种音频采集设备,包括麦克风、压电感测元件、数字信号处理器和片上系统,其中,麦克风用于采集声音信号;压电感测元件用于感测声压,并且响应于所感测到的声压级高于第一声压阈值,使数字信号处理器能够接收麦克风采集的声音信号;数字信号处理器对麦克风采集的声音信号进行针对唤醒词的第一识别操作,并在通过第一识别操作识别到唤醒词的情况下,向片上系统发送声音信号;片上系统对所接收的声音信号进行针对唤醒词的第二识别操作。
13.可选地,数字信号处理器包括使能端和信号输入端,使能端连接到压电感测元件
的输出端,信号输入端连接到麦克风,压电感测元件响应于所感测到的声压级高于第一声压阈值,通过输出端向使能端输出使能信号,数字信号处理器响应于使能信号而启动,从而通过信号输入端接收麦克风采集的声音信号。
14.可选地,压电感测元件是压电开关,具有第一端、第二端和压电元件,第一端连接到麦克风,第二端连接到数字信号处理器,压电元件感测声压,并且响应于所感测到的声压级高于第一声压级阈值,接通第一端和第二端之间的信号通路。
15.可选地,片上系统在通过第二识别操作识别到唤醒词识别到唤醒词的情况下,使音频采集设备进入音频采集工作状态。
16.可选地,片上系统在通过第二识别操作识别到唤醒词的情况下,向音频采集设备所关联的电子设备发送唤醒信号。
17.可选地,数字信号处理器缓存所接收到的声音信号,基于所缓存的声音信号进行第一识别操作,并在通过第一识别操作识别到唤醒词的情况下,向片上系统发送所缓存的声音信号。
18.可选地,数字信号处理器将所缓存的声音信号划分为多个片段,逐个片段地发送给片上系统。
19.可选地,在片上系统识别到唤醒词的情况下,数字信号处理器将麦克风所采集的声音信号直接传送给片上系统。
20.可选地,数字信号处理器响应于接收到来自压电感测元件的信号而启动。
21.可选地,片上系统响应于接收到来自数字信号处理器的信号而启动。
22.可选地,压电感测元件将感测到的声压转换为电压,基于转换得到的电压是否高于第一电压阈值来判断所感测到的声压级是否高于第一声压级阈值。
23.可选地,响应于压电感测元件感测到的声压级低于第二声压级阈值的时间超过预定时间阈值,压电感测元件禁止数字信号处理器接收麦克风采集的声音信号,相应地,数字信号处理器和片上系统进入休眠状态。
24.可选地,该音频采集设备还可以包括:时钟发生器,用于向麦克风、数字信号处理器、片上系统中的至少一个提供时钟信号,其中,响应于压电感测元件感测到的声压级高于第一声压级阈值,启动时钟发生器。
25.可选地,响应于压电感测元件感测到的声压级低于第二声压级阈值的时间超过预定时间阈值,关闭时钟发生器。
26.可选地,该音频采集设备还可以包括:蓝牙通信模块,用于与音频采集设备所关联的电子设备进行蓝牙通信,在通过第二识别操作识别到唤醒词的情况下,向电子设备发送唤醒信号;以及/或者电池,用于向麦克风、压电感测元件、数字信号处理器、片上系统、蓝牙通信模块中的至少一个供电。
27.可选地,该音频采集设备还可以包括:电池,用于向麦克风、压电感测元件、数字信号处理器、片上系统中的至少一个供电;第一开关,连接在麦克风和片上系统之间,响应于系统设置或电池正在充电或电池剩余电量大于第一阈值而导通,以便片上系统从麦克风接收声音信号,并对所接收的声音信号进行针对唤醒词的第二识别操作;以及/或者第二开关,连接在麦克风和数字信号处理器之间,响应于系统设置或电池正在充电或电池剩余电量大于第二阈值而导通,以便由数字信号处理器从麦克风接收声音信号,并对所接收的声
音信号进行针对唤醒词的第一识别操作;以及/或者第三开关,连接在压电感测元件和片上系统之间,响应于系统设置或电池正在充电或电池剩余电量大于第三阈值而导通,以便片上系统接收麦克风采集的声音信号,并对所接收的声音信号进行针对唤醒词的第二识别操作。
28.根据本公开的第二个方面,提供了一种音频采集设备,包括麦克风、声压感测器、第一处理器和第二处理器,其中,麦克风用于采集声音信号;声压感测器用于感测声压,并且响应于所感测到的声压级高于第一声压级阈值,使第一处理器能够接收麦克风采集的声音信号;第一处理器对麦克风采集的声音信号进行针对唤醒词的第一识别操作,并在通过第一识别操作识别到唤醒词的情况下,向第二处理器发送声音信号;第二处理器对所接收的声音信号进行针对唤醒词的第二识别操作。
29.可选地,第一处理器的功耗低于第二处理器。
30.可选地,第二处理器是音频采集设备的主处理器,用于对音频采集设备上的各器件进行控制。
31.可选地,第一处理器响应于接收到来自压电感测元件的信号而启动。
32.可选地,第二处理器响应于接收到来自第一处理器的信号而启动。
33.可选地,响应于压电感测元件感测到的声压级低于第二声压级阈值的时间超过预定时间阈值,压电感测元件禁止第一处理器接收麦克风采集的声音信号,相应地,第一处理器和第二处理器进入休眠状态。
34.根据本公开的第三个方面,提供了一种音频采集设备,包括麦克风、声压感测器和处理器,其中,麦克风用于采集声音信号;声压感测器用于感测声压,并且响应于所感测到的声压级高于第一声压级阈值,使处理器能够接收麦克风采集的声音信号;处理器对麦克风采集的声音信号进行针对唤醒词的识别操作。
35.根据本公开的第四个方面,提供了一种无线耳机,包括:根据上述第三个方面的音频采集设备。
36.可选地,该无线耳机还可以包括:蓝牙通信模块,用于与电子设备进行蓝牙通信,响应于识别到唤醒词,向电子设备发送唤醒信号。
37.根据本公开的第五个方面,提供了一种电子设备系统,包括:根据上述第四个方面的无线耳机;以及与无线耳机进行蓝牙通信的电子设备,其中,响应于接收到无线耳机发送的唤醒信号,电子设备激活其上安装的预定应用。
38.由此,通过引入声压感测器/压电感测元件及数字信号处理器,通过在人声和噪声分析中判断是否存在人声,在更高精度的唤醒词识别之前,先通过低功耗语音识别初步判断是否存在唤醒词,能够显著降低例如无线耳机等设备在为执行设备唤醒而进行声音采集时所需的功耗,延长电池充满电量后可持续使用的时间,显著提升用户体验。
附图说明
39.通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
40.图1示出了能够实施根据本公开的音频采集方案的电子设备系统。
41.图2示出了根据本公开一个实施例的音频采集设备的示意性框图。
42.图3示出了根据本公开另一个实施例的音频采集设备的示意性框图。
43.图4示出了根据本公开另一个实施例的音频采集设备的示意性框图。
44.图5示出了根据本公开另一个实施例的音频采集设备的示意性框图。
45.图6示出了根据本公开实施例的唤醒方案的时序图。
具体实施方式
46.下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
47.图1示出了能够实施根据本公开的音频采集方案的电子设备系统。
48.如图1所示,该电子设备系统可以包括无线耳机1和电子设备2。
49.电子设备2例如可以是手机、pad或计算机等。图1中以手机为例。电子设备2上可以安装有若干应用(app)。
50.无线耳机1可以具有蓝牙通信模块。通过蓝牙通信模块,无线耳机1可以与电子设备2进行蓝牙无线通信。应当理解,其它类型的无线通信方式同样适用于本公开的技术方案。
51.无线耳机1可以从电子设备2接收音频信号以便通过无线耳机1的扬声器播放。无线耳机1也可以将其上的麦克风所采集的音频信号上传到电子设备2。
52.例如,可以通过无线耳机1采集到的唤醒语音来唤醒电子设备2本身或电子设备2上安装的预定应用210。或者,更进一步地,例如还可以使该预定应用执行预定的功能。
53.这样,可以在无线耳机1处检测用户发出的语音。当用户发出设定唤醒词时,无线耳机1向电子设备2发送唤醒信号。电子设备2响应于接收到无线耳机1发送的唤醒信号,可以激活其上安装的预定应用。
54.图1中以无线耳机1为例示出了无线音频设备。应当理解,其它类型的无线音频设备也同样可能适用于本公开的技术方案。
55.无线音频设备可以包含本公开的音频采集设备,以便执行音频采集的功能。
56.或者,本公开的音频采集设备也可以是无线音频设备本身。
57.由于本公开重点涉及音频采集过程中的实现方案,因此,下文中参考图2至图5重点描述有关音频采集设备的内容。
58.图2示出了根据本公开一个实施例的音频采集设备的示意性框图。
59.如图2所示,本公开一个示例的音频采集设备可以包括麦克风10、声压感测器20和处理器30。
60.麦克风10采集声音信号。
61.另一方面,声压感测器20也可以感测声压。并且响应于所感测到的声压级高于第一声压级阈值,例如50分贝(db),使处理器30能够接收麦克风10采集的声音信号。
62.处理器30对麦克风10采集的声音信号进行针对唤醒词的识别操作。
63.处理器30在识别到预定的唤醒词时,可以执行相应的唤醒操作,例如像关联的电
子设备发送唤醒信号,以唤醒该电子设备或该电子设备上安装的应用。
64.处理器30可以在接收到麦克风10采集的声音信号之前处于休眠状态,而在接收到该声音信号之后激活或启动。
65.音频采集设备所处的环境中,往往会有一些环境噪声。而用户发出的语音则叠加在环境噪声之上。
66.为了降低设备功耗,可以在激活处理器30之前,判断麦克风10所采集到的音频信号中是否包含语音。换言之,可以对设备所能采集到的声音进行噪声/语音检测判断。
67.在用户使用无线音频设备执行例如唤醒操作等功能的场景下,一般而言,语音的声压级往往会大于环境噪声的声压级,例如,环境噪声一般小于40db,而语音往往大于50db。
68.这样,本公开提出可以采用声压感测器20来感测声压。在声压感测器20所感测到的声压级高于第一声压级阈值,例如50db,的情况下,可以认为存在语音。此时,可以激活或启动处理器30,以执行唤醒词识别操作。
69.这样,可以避免处理器30长时间保持工作状态,也可以避免处理器30被麦克风10所采集的环境噪声所激活或启动。
70.另外,在检测到语音(声压级高于第一声压级阈值),从而启动了处理器30进行语音识别操作的情况下,响应于声压感测器20感测到的声压级低于第二声压级阈值的时间超过预定时间阈值,声压感测器20还可以再次禁止处理器30接收麦克风10采集的声音信号。相应地,处理器30可以进入休眠状态。
71.第二声压级阈值可以与第一声压级阈值相同,也可以设置为低于第一声压级。
72.预定时间阈值可以根据经验设定,一般参考用户说话的间歇时间来设定,也可以基于大数据分析根据大量用户说话的间歇时间等因素来设定。
73.另外,如图2所示,音频采集设备还可以包括蓝牙通信模块40、电池50和时钟发生器55。
74.蓝牙通信模块40用于与音频采集设备所关联的电子设备进行蓝牙通信,在处理器30通过语音识别操作识别到唤醒词的情况下,可以向电子设备发送唤醒信号。
75.时钟发生器55用于向麦克风10、处理器30、蓝牙通信模块40等中的至少一个提供时钟信号。
76.电池40向麦克风10、声压感测器20、处理器30、蓝牙通信模块40、时钟发生器55等中的至少一个供电。
77.在声压感测器20没有感测到语音(声压级低于第一声压级阈值)的情况下,处理器30、蓝牙通信模块40和时钟发生器55也都可以不工作,或以低功耗工作。
78.这样,在声压感测器20没有感测到语音(声压级低于第一声压级阈值)的情况下,在图中示出的器件中,电池50可以仅对麦克风10进行供电。
79.在声压感测器20区分识别噪声和语音的过程中,在图中示出的器件中,电池50可以仅对麦克风10和声压感测器20进行供电。
80.由此,通过引入声压感测器20,可以显著降低各器件的功耗,从而降低音频采集设备的整体功耗,延长电池50一次充满电后能够持续供电的时间。
81.图2所示实施例中,通过引入声压感测,预先进行语音/噪声识别分析,从而判断是
否要进行较高功耗的语音识别、语音唤醒操作。
82.进一步地,还可以将处理器30的工作分级,先进行低功耗的初步判断。仅在初步判认定可能存在唤醒词的情况下,才进行进一步高功耗的语音识别、语音唤醒操作。这样可以进一步降低设备的功耗。
83.图3示出了根据本公开另一个实施例的音频采集设备的示意性框图。
84.在图3所示音频采集设备中,第一处理器32和第二处理器34的组合替代了图2所示音频采集设备中的处理器30。
85.第一处理器32对麦克风10采集的声音信号进行针对唤醒词的第一识别操作。
86.第一处理器32可以以较低功耗对声音信号进行较低精度的初次分析识别。,
87.例如,第一处理器32可以是数字信号处理器(dsp),其上设置有逻辑电路。基于逻辑电路对来自麦克风10的声音信号进行分析识别处理。
88.在通过第一识别操作识别到唤醒词的情况下,第一处理器32可以向第二处理器34发送来自麦克风10的声音信号。
89.于是,第二处理器34可以对所接收的声音信号再次进行针对唤醒词的第二识别操作。
90.第二处理器例如可以是音频采集设备的主处理器,对音频采集设备上的各器件进行控制。第二处理器34的功耗可以高于第一处理器32。
91.例如,第二处理器34可以是用于蓝牙设备的片上系统(soc)。
92.第二处理器34可以采用较为复杂、更加精确的语音识别技术来针对唤醒词进行第二识别操作,以便准确识别唤醒词,避免错误发起唤醒操作。
93.第一处理器32可以响应于接收到来自声压感测器20的信号而启动。
94.而第二处理器34则可以响应于接收到来自第一处理器32的信号而启动。
95.响应于声压感测器20感测到的声压级低于第二声压级阈值的时间超过预定时间阈值,声压感测器20可以禁止第一处理器32接收麦克风10采集的声音信号。相应地,第一处理器32和第二处理器34均可以进入休眠状态。
96.与上文参考图2所描述的一样,第二声压级阈值可以与第一声压级阈值相同,也可以设置为低于第一声压级。
97.预定时间阈值可以根据经验设定,一般参考用户说话的间歇时间来设定,也可以基于大数据分析根据大量用户说话的间歇时间等因素来设定。
98.另外,如图3所示,音频采集设备还可以包括蓝牙通信模块40、电池50和时钟发生器55。这些器件的功能可以与图2所示音频采集设备中的相应器件的功能基本相同。
99.蓝牙通信模块40用于与音频采集设备所关联的电子设备进行蓝牙通信,在第二处理器34通过第二操作识别到唤醒词的情况下,可以向电子设备发送唤醒信号。
100.时钟发生器55用于向麦克风10、第一处理器32、第二处理器34、蓝牙通信模块40等中的至少一个提供时钟信号。
101.电池40向麦克风10、声压感测器20、第一处理器32、第二处理器34、蓝牙通信模块40、时钟发生器55等中的至少一个供电。
102.在声压感测器20没有感测到语音(声压级小于第一声压级阈值)的情况下,第一处理器32、第二处理器34、蓝牙通信模块40和时钟发生器55都可以不工作,或以低功耗工作。
103.这样,在声压感测器20没有感测到语音(声压级低于第一声压级阈值)的情况下,在图中示出的器件中,电池50可以仅对麦克风10进行供电。
104.在声压感测器20区分识别噪声和语音的过程中,在图中示出的器件中,电池50可以仅对麦克风10和声压感测器20进行供电。
105.在第一处理器32进行针对唤醒词的第一识别操作的过程中,在图中示出的器件中,电池50可以仅对麦克风10、声压感测器20、第一处理器32和时钟发生器55进行供电。
106.在图3所示实施例中,在图2所示实施例的基础上,进一步引入第一处理器32,在较高功耗的第二处理器34进行更加复杂、更加精确的第二识别操作之前,采用较为低功耗的第一处理器32来进行初步的第一识别操作。仅在第一识别操作识别到唤醒词的情况下,才启动/激活第二处理器34来进行第二识别操作以及语音唤醒操作。
107.由此,能够进一步降低设备整体的功耗。
108.声压感测器20例如可以是压电感测元件,通过例如压电陶瓷元件来感测声波,将声压转换为电压。
109.相应地,可以通过判断转换得到的电压是否高于对应于第一声压级阈值的第一电压阈值,来判断声压级是否高于第一声压级阈值。同样地,可以通过判断转换得到的电压是否低于对应于第二声压级阈值的第二电压阈值,来判断声压级是否低于第二声压级阈值。
110.声压感测器20可以通过多种方式来控制处理器30或第一处理器32对麦克风10所采集的声音信号的接收能力。
111.下文中参考图4和图5来描述声压感测器20控制处理器30或第一处理器32对声音信号的接收能力的可能两种方式。
112.在下文的描述中,以声压感测器20为压电感测元件、第一处理器32为数字处理器dsp、第二处理器34为片上系统soc为例,进行描述。应当理解,在采用其它类似器件的情况下,本公开的方案同样可以实现。
113.另外,关于蓝牙通信模块40、时钟发生器55、电池50的相关内容可以与上文中参考图2和图3描述的内容相同,下文中将不再详细赘述。
114.图4示出了根据本公开另一个实施例的音频采集设备的示意性框图。
115.在图4所示实施例中,数字信号处理器dsp 70可以包括使能端72和信号输入端74,使能端72连接到压电感测元件60的输出端,信号输入端74连接到麦克风10。数字信号处理器dsp 70也可以是外置dsp。
116.压电感测元件60响应于所感测到的声压级高于第一声压阈值,通过其输出端向dsp 70的使能端72输出使能信号。
117.相应地,当压电感测元件60所感测到的声压级低于第二声压阈值达预定时间阈值,可以是通过其输出端向dsp 70的使能端72输出禁止信号。
118.dsp 70响应于使能信号而启动,从而通过信号输入端74接收麦克风10采集的声音信号。
119.相应地,当压电感测元件60所感测到的声压级低于第二声压阈值达预定时间阈值,可以是通过其输出端向dsp 70的使能端72输出禁止信号。
120.dsp 70响应于禁止信号而停止工作,或进入休眠状态,从而不再通过信号输入端74接收麦克风10采集的声音信号,或者不对所接收的声音信号进行处理。
121.由此,能够通过压电感测元件60将声压转换为电压,通过电压比较,判断是否使能dsp 70,使其接收麦克风10采集的声音信号,并对所接收的声音信号进行处理。
122.图5示出了根据本公开另一个实施例的音频采集设备的示意性框图。
123.在图5所示实施例中,压电感测元件90可以是压电开关,具有第一端94、第二端96和压电元件92。
124.第一端94连接到麦克风10,用于接收来自麦克风10的声音信号。
125.第二端96连接到dsp 70,用于向dsp 70传送来自麦克风10的声音信号。
126.压电元件92感测声压,并且响应于所感测到的声压级高于第一声压级阈值,接通第一端94和第二端96之间的信号通路。
127.由此,当压电元件92所感测到的声压级高于第一声压级阈值,dsp 70可以接收到来自麦克风10的声音信号。
128.同样地,当压电元件92所感测到的声压级低于第二声压级阈值达预定时间阈值,可以断开第一端94和第二端96之间的信号通路。
129.相应地,dsp 70不再能够接收到来自麦克风10的声音信号。
130.与上面参考图2和图3描述的内容相同或类似,在图4和图5所示的实施例中,dsp 70可以对麦克风10采集的声音信号进行针对唤醒词的第一识别操作,并在通过第一识别操作识别到唤醒词的情况下,向soc 80发送声音信号。
131.于是,soc 80可以对所接收的声音信号进行针对唤醒词的第二识别操作。
132.dsp 70可以响应于接收到来自压电感测元件60/90的信号(声音信号或使能信号)而启动。
133.相应地,soc 80可以响应于接收到来自dsp 70的信号(声音信号,或者类似地,也可以是使能信号)而启动。
134.dsp 70可以例如具有缓存器,缓存所接收到的声音信号。这样,一方面,dsp 70可以基于缓存器所缓存的声音信号进行第一识别操作。另一方面,dsp 70还可以在通过第一识别操作识别到唤醒词的情况下,向soc 80发送所缓存的声音信号。
135.当用户发出语音时,压电感测元件60/90通过声压级检测(电压比较)进行语音/噪声分析。在判定存在语音(人声)的情况下启动/激活dsp 70。
136.这样,从用户发出语音到dsp 70开始工作,可能存在一定时间的间隙,例如256ms。这段时间间隙可以认为是压电感测元件60/90进行语音/噪声分析的时间段。
137.由于此时dsp 70还没有开始工作,所以dsp 70不能对麦克风10在此时间段内采集的声音信号进行处理。
138.然而,这一时间段往往较短。另外,用户在发出唤醒词之前也可能会发出一些其它声音。因此,一般并不会显著影响唤醒词的语音识别。
139.而dsp 70通过将其所接收到的声音信号缓存,可以在需要向soc 80发送声音信号时,从其最早接收到的声音信号开始发送。这样,可以避免发送给soc 80的声音信号中进一步丢失麦克风10在dsp 70进行第一识别操作的时间段内接收的声音信号。
140.在soc 80识别到唤醒词之前,dsp 70可以将所缓存的声音信号划分为多个片段,例如每30ms的声音信号为一片段,逐个片段地发送给soc 80。
141.声音片段的时长可以根据经验设定。例如,可以根据启动/激活soc 80所需时长来
80接收麦克风10采集的声音信号,并对所接收的声音信号进行针对唤醒词的第二识别操作。此时,越过了第一识别操作,而在声压检测到语音时直接进行第二识别操作。
151.可以同时设置第一开关、第二开关、第三开关,也可以只设置其中一个或两个。在设置了两个或三个上述开关的情况下,也可以仅启用其中一个或两个。
152.第一阈值、第二阈值、第三阈值可以根据经验预先设置,也可以允许用户自行调整设置。
153.优选地,第一阈值大于第二阈值和第三阈值。
154.优选地,第二阈值大于第三阈值。
155.例如,第一阈值可以为80%。
156.例如,第二阈值可以为70%。
157.例如,第三阈值可以为50%。
158.上文中参考图2至图5详细描述了根据本公开的几个实施例中用于语音唤醒的音频采集设备。
159.下面参考图6所示时序图进一步描述本公开的语音唤醒方案。
160.图6示出了根据本公开实施例的唤醒方案的时序图。
161.如图6所示,整个设备端语音唤醒流程可以分成三个阶段。也可以将其视为状态机,在三个状态(阶段,stage)之间切换。
162.第0阶段(stage0,或s0)由压电感测元件(例如可以采用压电开关)执行语音(人声)噪声分析,在安静环境下压电开关是关闭状态,此时的系统待机功耗最低。
163.图6上方示出了麦克风可以采集到的声音信号,其中在较小幅度的背景噪声信号上叠加有较大幅度的语音信号。箭头方向表示时间流逝方向。
164.待压电感测元件声压转换得到的电压高于第一电压阈值,触发人声和噪声分析。时钟发生器也开始工作,提供时钟信号。
165.例如大约256ms之后,如果判定存在人声,进入第1阶段(stage1,或s1)。
166.stage1由外置低功耗dsp执行,主要进行唤醒词初步识别(第一级识别)。低功耗dsp的功耗比压电感测元件稍高一些。
167.如果dsp执行的初步识别中发现存在有效的唤醒词,则可以例如通过硬件中断信号等触发主芯片启动,进入第2阶段(stage2,或s2)。从中断信号到stage 2启动,大致会有约30ms的延迟。
168.stage2启动主系统,例如启动片上系统soc,由soc执行第二级唤醒词识别。
169.如果soc识别出唤醒词,则可以进入2mic降噪模式,启动语音控制,全面进入音频采集工作状态,进行全功能运行。此时,系统功耗最大。
170.从第2阶段开始,到主系统完全准备就绪全功能运行,这一过程大致需要500至3000ms时间。
171.通过在硬件设计中加入压电感测元件和外置低功耗dsp,系统功耗显著优化。
172.下面的表1和表2分别示出了在一个示例中加入压电感测元件(stage0)和加入dsp(stage 1)带来的功耗变化。
173.表1 stage 0功耗变化
[0174][0175][0176]
表2 stage 1功耗变化
[0177]
dsp麦克风(μw)时钟(μw)dsp(μw)总功耗(mw)无46810052805.8有50410048405.4
[0178]
如表1和表2所示,在stage0,通过引入压电开关,可以降低约78%的系统功耗;而在stage1,通过引入外置dsp,可以降低月6%的系统功耗,总体语音唤醒流程系统功耗可以降低84%。
[0179]
上文中已经参考附图详细描述了根据本发明的音频采集设备、无线耳机和电子设备系统。
[0180]
本领域技术人员将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。
[0181]
附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0182]
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。