首页 > 乐器声学 专利正文
音频处理方法、装置、电子设备和存储介质与流程

时间:2022-02-24 阅读: 作者:专利查询

音频处理方法、装置、电子设备和存储介质与流程

1.本公开的实施例涉及音频处理技术领域,具体涉及音频处理方法、装置、电子设备和存储介质。


背景技术:

2.在集中式实时传输协议(real

time transport protocol,rtp)音频会议中,单声道音频编解码器不涉及音频源的特性,如ilbc、opus和g.711等。立体声或多通道编解码器可以传输空间特征,但具有更高的带宽。使用定向音频编码(directional audio coding,dirac)开发,可以捕获音频源位置,并且能够再现使用现有麦克风系统录制的声音的空间特性。在音视频会议中,实时远程环绕声重建可以改善与会者之间的互动。
3.但是dirac主要关注如何获取空间属性,如何对其进行传输仍然是需要解决的技术问题。


技术实现要素:

4.本公开的实施例提出了音频处理方法、装置、电子设备和存储介质。
5.第一方面,本公开提供了一种音频处理方法,包括:
6.根据音频数据包的扩展头,确定目标音频的方位信息,其中,上述方位信息用于表示上述目标音频对应的声源的空间方位,上述目标音频的编码记录在上述音频数据包的包体中;
7.根据上述目标音频的方位信息和上述目标音频的编码,输出上述目标音频。
8.在一些可选的实施方式中,在上述根据上述目标音频的方位信息和上述目标音频的编码,输出上述目标音频之前,上述方法还包括:
9.根据上述音频数据包的扩展头,确定上述目标音频的混响信息;以及
10.上述根据上述目标音频的方位信息和上述目标音频的编码,输出上述目标音频,包括:
11.根据上述目标音频的方位信息、上述目标音频的混响信息和上述目标音频的编码,输出上述目标音频。
12.在一些可选的实施方式中,上述根据音频数据包的扩展头,确定目标音频的方位信息,包括:
13.根据上述扩展头中的第一数据,确定坐标系类型;
14.根据上述扩展头中的第二数据,确定上述坐标系类型下的方位信息。
15.在一些可选的实施方式中,上述坐标系类型为球坐标系,上述方位信息包括第一角度值和第二角度值;和/或
16.上述坐标系类型为平面直角坐标系,上述方位信息包括第一坐标值和第二坐标值。
17.在一些可选的实施方式中,上述坐标系类型为球坐标系,上述第一角度值的精度
是非线性的,和/或上述第二角度值的精度是非线性的。
18.在一些可选的实施方式中,上述音频数据包为实时传输协议数据包。
19.在一些可选的实施方式中,上述目标音频为音视频会议音频。
20.在一些可选的实施方式中,上述根据上述目标音频的方位信息和上述目标音频的编码,输出上述目标音频,包括:
21.根据上述方位信息,利用虚拟三维技术输出上述目标音频对应的三维声场。
22.第二方面,本公开提供了一种音频处理方法,包括:
23.将目标音频的编码记录在音频数据包的包体中,以及将上述目标音频的方位信息记录在上述音频数据包的扩展头中,其中,上述方位信息用于表示上述目标音频对应的声源的空间方位;
24.将上述音频数据包发送至目标设备。
25.在一些可选的实施方式中,在上述将上述音频数据包发送至目标设备之前,上述方法还包括:
26.将上述目标音频的混响信息记录在上述音频数据包的扩展头中。
27.在一些可选的实施方式中,上述将上述目标音频的方位信息记录在上述音频数据包的扩展头中,包括:
28.将坐标系类型记录在上述扩展头中的第一数据;
29.将上述坐标系类型下的方位信息记录在上述扩展头中的第二数据。
30.在一些可选的实施方式中,上述坐标系类型为球坐标系,上述方位信息包括第一角度值和第二角度值;和/或
31.上述坐标系类型为平面直角坐标系,上述方位信息包括第一坐标值和第二坐标值。
32.在一些可选的实施方式中,上述坐标系类型为球坐标系,上述第一角度值的精度是非线性的,和/或上述第二角度值的精度是非线性的。
33.在一些可选的实施方式中,上述方位信息用于供上述目标设备利用虚拟三维技术输出上述目标音频对应的三维声场。
34.第三方面,本公开提供了一种音频处理装置,包括:
35.处理单元,用于根据音频数据包的扩展头,确定目标音频的方位信息,其中,上述方位信息用于表示上述目标音频对应的声源的空间方位,上述目标音频的编码记录在上述音频数据包的包体中;
36.输出单元,用于输出根据上述目标音频的方位信息和上述目标音频的编码,输出上述目标音频。
37.在一些可选的实施方式中,上述处理单元还用于:
38.根据上述音频数据包的扩展头,确定上述目标音频的混响信息;以及
39.上述输出单元还用于:
40.根据上述目标音频的方位信息、上述目标音频的混响信息和上述目标音频的编码,输出上述目标音频。
41.在一些可选的实施方式中,上述处理单元还用于:
42.根据上述扩展头中的第一数据,确定坐标系类型;
43.根据上述扩展头中的第二数据,确定上述坐标系类型下的方位信息。
44.在一些可选的实施方式中,上述坐标系类型为球坐标系,上述方位信息包括第一角度值和第二角度值;和/或
45.上述坐标系类型为平面直角坐标系,上述方位信息包括第一坐标值和第二坐标值。
46.在一些可选的实施方式中,上述坐标系类型为球坐标系,上述第一角度值的精度是非线性的,和/或上述第二角度值的精度是非线性的。
47.在一些可选的实施方式中,上述音频数据包为实时传输协议数据包。
48.在一些可选的实施方式中,上述目标音频为音视频会议音频。
49.在一些可选的实施方式中,上述输出单元还用于:
50.根据上述方位信息,利用虚拟三维技术输出上述目标音频对应的三维声场。
51.第四方面,本公开还提供了一种音频处理装置,包括:
52.记录单元,用于将目标音频的编码记录在音频数据包的包体中,以及将上述目标音频的方位信息记录在上述音频数据包的扩展头中,其中,上述方位信息用于表示上述目标音频对应的声源的空间方位;
53.发送单元,用于将上述音频数据包发送至目标设备。
54.在一些可选的实施方式中,上述记录单元还用于:
55.将上述目标音频的混响信息记录在上述音频数据包的扩展头中。
56.在一些可选的实施方式中,上述记录单元还用于:
57.将坐标系类型记录在上述扩展头中的第一数据;
58.将上述坐标系类型下的方位信息记录在上述扩展头中的第二数据。
59.在一些可选的实施方式中,上述坐标系类型为球坐标系,上述方位信息包括第一角度值和第二角度值;和/或
60.上述坐标系类型为平面直角坐标系,上述方位信息包括第一坐标值和第二坐标值。
61.在一些可选的实施方式中,上述坐标系类型为球坐标系,上述第一角度值的精度是非线性的,和/或上述第二角度值的精度是非线性的。
62.在一些可选的实施方式中,上述方位信息用于供上述目标设备利用虚拟三维技术输出上述目标音频对应的三维声场。
63.第五方面,本公开提供了一种电子设备,包括:
64.一个或多个处理器;
65.存储装置,其上存储有一个或多个程序,
66.当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如本公开第一方面或者第二方面任一实施方式描述的方法。
67.第六方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,其中,上述计算机程序被一个或多个处理器执行时实现如本公开第一方面或者第二方面任一实施方式描述的方法。
68.本公开提供的音频处理方法、装置、电子设备和存储介质,利用音频数据包的包体传输目标音频的编码,利用音频数据包的扩展头传输目标音频的方位信息,一方面无需目
标音频的编码本身包含方位信息,可以兼容现有的编解码方式,具有更广的应用范围,另一方面可以使方位信息与编码数据直接对应,减小多路传输造成的信息滞后或丢失问题。
69.此外,本公开提供的音频处理方法、装置、电子设备和存储介质,利用音频数据包的扩展头传输目标音频的方位信息,降低了传输带宽需求。另外,由于发送端可以在音频数据包发送前对其扩展头进行实时调整,因此本公开提供的方案还可以实现方位信息的实时传递以及发送端对方位信息的动态调整。
附图说明
70.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显。附图仅用于示出具体实施方式的目的,而并不认为是对本发明的限制。在附图中:
71.图1是根据本公开的音频处理系统的一个实施例的系统架构图;
72.图2a是根据本公开的音频处理方法的一个实施例的流程图;
73.图2b是根据本公开的音频处理方法中音频数据包的扩展头的示意图;
74.图2c是根据本公开的音频处理方法中第一角度数据和第一角度值的映射关系的示意图;
75.图2d是根据本公开的音频处理方法中第二角度数据和第二角度值的映射关系的示意图;
76.图2e是根据本公开的音频处理方法中平面直角坐标系的示意图;
77.图3是根据本公开的音频处理方法的另一个实施例的流程图;
78.图4a是根据本公开的音频处理装置的一个实施例的结构示意图;
79.图4b是根据本公开的音频处理装置的另一个实施例的结构示意图;
80.图5是适于用来实现本公开的实施例的电子设备的计算机系统的结构示意图。
具体实施方式
81.下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
82.需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
83.图1示出了可以应用本公开的音频处理方法、装置、终端设备和存储介质的实施例的示例性系统架构100。
84.如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
85.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如语音交互类应用、视频会议类应用、短视频社交类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
86.终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有麦克风和扬声器的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、mp3播放器(moving picture experts group audio layer iii,动态影像专家压缩标准音频层面3)、mp4(moving picture experts group audio layer iv,动态影像专家压缩标准音频层面4)播放器、便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
87.服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103发送的音视频会议请求进行处理的后台服务器。
88.在一些情况下,本公开所提供的音频处理方法可以由服务器105执行,相应地,音频处理装置也可以设置于服务器105中,这时,系统架构100也可以不包括终端设备101、102、103。
89.在一些情况下,本公开所提供的音频处理方法可以由终端设备101、102、103执行,相应地,音频处理装置也可以设置于终端设备101、102、103中,这时,系统架构100也可以不包括服务器105。
90.需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
91.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
92.继续参考图2a,其示出了根据本公开的音频处理方法的一个实施例的流程210,可应用于图1中的终端设备,该流程210包括以下步骤:
93.步骤211,根据音频数据包的扩展头,确定目标音频的方位信息,其中,方位信息用于表示目标音频对应的声源的空间方位,目标音频的编码记录在音频数据包的包体中。
94.在本实施例中,方位信息用于表示目标音频对应的声源的空间方位,例如音源相对于音频采集位置或者收听者的方向。
95.通常来说,数据包是网络数据传输中的传输单位。数据包可分为包头和包体。包头是被附加到用于控制信息的运载和传输的数据包前面的定义位长度的特殊保留字段,起到控制和描述作用。包体是用于承载所要传输的数据的部分。
96.一些通讯协议(例如实时传输协议,rtp)支持数据包包头的扩展。此时,数据包的包头可进一步分为固定头(fixed header)与扩展头(header extension)。
97.在本实施例中,可以将目标音频的方位信息记录在音频数据包的扩展头中。
98.图2b是根据本公开的音频处理方法中音频数据包的扩展头的示意图。在图2b所示的例子中,使用[rfc5285]定义的两种扩展头音频方位信息。其中,图2b上方为one

byte扩展头,图2b下方为two

byte扩展头。
[0099]
如图2b所示,参数“m”(即第一数据)用于记录坐标系类型。在一个例子中,参数“m”长度为两位。参数“m”的数值为“00”,可以表示坐标系类型为球坐标系。上述球坐标系的原点例如是收听者所在位置。参数“m”的数值为“01”,可以表示坐标系类型为平面直角坐标
系。上述平面直角坐标系的原点例如是收听者所在位置。参数“m”的数值和坐标系类型的映射关系可以根据实际需要设置,本公开对此不作限定。
[0100]
如图2b所示,参数“sita(or)x”和“phi(or)y”(即第二数据)用于记录与上述坐标系类型对应的方位信息。例如,在坐标系类型为球坐标系的情况下,参数“sita(or)x”(即第一角度数据)表示球坐标系中的水平角度(即第一角度值),参数“phi(or)y”(即第二角度数据)表示球坐标系中的竖直角度(即第二角度值)。又例如,在坐标系类型为平面直角坐标系的情况下,参数“sita(or)x”表示平面直角坐标系中的横坐标(即第一坐标值),参数“phi(or)y”表示平面直角坐标系中的纵坐标(即第二坐标值)。
[0101]
在上述例子中,在参数“sita(or)x”表示球坐标系中的水平角度的情况下,其长度例如是7位,其中第一位为符号位,后六位为角度位,0度定义为收听者正前方。由于7位数据最多能够表示128个数值,而球坐标系中的水平角度的取值范围为[

180,180],涉及到360个整数,因此需要确定参数“sita(or)x”(即第一角度数据)和球坐标系中的水平角度(即第一角度值)的映射关系。
[0102]
图2c是根据本公开的音频处理方法中第一角度数据和第一角度值的第一映射关系的示意图。在心理声学的研究中,证实了人的方位判断存在模糊,在正前方方位分辨率是
±
2度,在侧方方位分辨率是
±
10度,在后方方位分辨率是
±
5度。因此,图2c中第一角度值的间隔是非均匀的,随着第一角度值的增大,相邻第一角度值之间的间隔经历了“1
‑2‑
10

5”的变化过程,即,第一角度值的精度是非线性的。通过上述方式,一方面可以利用数量有限的第一角度数据表示范围较大的第一角度值,另一方面能够与人对方位的分辨特点保持一致,避免对实际空间听感造成影响。
[0103]
需要说明的是,图2c中仅示出了第一角度数据和第一角度值均为正值时二者的映射关系,第一角度数据和第一角度值均为负值时二者的映射关系与此类似,这里不再赘述。
[0104]
图2d是根据本公开的音频处理方法中第二角度数据和第二角度值的映射关系的示意图。与图2c所示的例子类似,图2d中第二角度值的间隔也是非均匀的。随着第二角度值的增大,相邻第二角度值之间的间隔经历了“2

5”的变化过程,即,第二角度值的精度是非线性的。其中,图2d中仅示出了第二角度数据和第二角度值均为正值时二者的映射关系,第二角度数据和第二角度值均为负值时二者的映射关系与此类似,这里不再赘述。
[0105]
图2e是根据本公开的音频处理方法中平面直角坐标系的示意图。平面直角坐标系不涉及高度信息。如图2e所示,平面直角坐标系原点可以是收听者所在位置,横坐标轴可以沿收听者面对的方向,其正方向与收听者视线方向保持一致,纵坐标轴可以垂直于前述横坐标轴。
[0106]
平面直角坐标系中的横坐标(即第一坐标值)的取值范围为[

1,1],可以利用长度为7位的参数“sita(or)x”进行量化表示。类似地,平面直角坐标系中的纵坐标(即第二坐标值)的取值范围为[

1,1],可以利用长度为7为的参数“phi(or)y”进行量化表示。
[0107]
基于上述描述,本实施例中音频处理方法的执行主体可以根据扩展头中的第一数据,确定坐标系类型,以及根据扩展头中的第二数据,确定坐标系类型下的方位信息。
[0108]
步骤212,根据目标音频的方位信息和目标音频的编码,输出目标音频。
[0109]
在本实施例中,本实施例中音频处理方法的执行主体可以通过虚拟三维(3d)等技术,结合目标音频的方位信息输出目标音频的三维声场,从而实现目标音频的空间听感。
[0110]
这里,本实施例中音频处理方法的执行主体可以直接对目标音频进行播放,也可以相应的音频信号传输至其他电子设备(例如蓝牙音箱)进行播放。
[0111]
在一个例子中,音频数据包的扩展头还包括混响信息。例如在图2b所示的例子中,参数“revb”可以表示混响类型(例如大厅、房间或者隧道等)。在此基础上,本实施例中音频处理方法的执行主体可以通过根据音频数据包的扩展头确定目标音频的混响信息,并且根据目标音频的方位信息、目标音频的混响信息和目标音频的编码,输出目标音频。通过上述方式,可以使用预定义的混响模型进行空间感重构,进一步提升目标音频的空间听感。
[0112]
本实施例中的音频处理方法,利用音频数据包的包体传输目标音频的编码,利用音频数据包的扩展头传输目标音频的方位信息,区别于利用包体传输方位信息的方式。因此,本实施例中的音频处理方法一方面无需目标音频的编码本身包含方位信息,可以兼容现有的编解码方式,具有更广的应用范围,另一方面可以使方位信息与音频编码直接对应,减小多路传输造成的信息滞后或丢失问题。
[0113]
继续参考图3,其示出了根据本公开的音频处理方法的另一个实施例的流程310,可应用于图1中的服务器,该流程310包括以下步骤:
[0114]
步骤311,将目标音频的编码记录在音频数据包的包体中,以及将目标音频的方位信息记录在音频数据包的扩展头中,其中,方位信息用于表示目标音频对应的声源的空间方位。
[0115]
这里,音频数据包的扩展头的结构可以参见上一实施例中的描述,这里不再赘述。
[0116]
步骤312,将音频数据包发送至目标设备。
[0117]
这里,目标设备例如是图1中的终端设备。
[0118]
在一个例子中,目标音频可以是音视频会议音频,本实施例中音频处理方法的执行主体可以是音视频会议服务器。在这种情况下,视频会议服务器可以方便地对方位信息进行实时传递和动态控制。
[0119]
本实施例中的音频处理方法能够实现与前述实施例中的音频处理方法类似的技术效果。此外,本实施例中的音频处理方法利用音频数据包的扩展头传输目标音频的方位信息,可以实现方位信息的实时传递以及发送端对方位信息的动态调整。
[0120]
进一步参考图4a,作为对上述图2a所示方法的实现,本公开提供了一种音频处理装置的一个实施例,该装置实施例与图2a所示的方法实施例相对应,该装置具体可以应用于各种终端设备中。
[0121]
如图4a所示,本实施例的音频处理装置410包括:处理单元411和输出单元412。其中,处理单元411,用于根据音频数据包的扩展头,确定目标音频的方位信息,其中,上述方位信息用于表示上述目标音频对应的声源的空间方位,上述目标音频的编码记录在上述音频数据包的包体中;输出单元412,用于输出根据上述目标音频的方位信息和上述目标音频的编码,输出上述目标音频。
[0122]
在本实施例中,处理单元411和输出单元412的具体处理及其所带来的技术效果可分别参考图2a对应实施例中步骤211和步骤212的相关说明,在此不再赘述。
[0123]
在一些可选的实施方式中,上述411处理单元还用于:根据上述音频数据包的扩展头,确定上述目标音频的混响信息;以及上述输出单元412还用于:根据上述目标音频的方位信息、上述目标音频的混响信息和上述目标音频的编码,输出上述目标音频。
[0124]
在一些可选的实施方式中,上述处理单元411还用于:根据上述扩展头中的第一数据,确定坐标系类型;根据上述扩展头中的第二数据,确定上述坐标系类型下的方位信息。
[0125]
在一些可选的实施方式中,上述坐标系类型为球坐标系,上述方位信息包括第一角度值和第二角度值;和/或上述坐标系类型为平面直角坐标系,上述方位信息包括第一坐标值和第二坐标值。
[0126]
在一些可选的实施方式中,上述坐标系类型为球坐标系,上述第一角度值的精度是非线性的,和/或上述第二角度值的精度是非线性的。
[0127]
在一些可选的实施方式中,上述音频数据包为实时传输协议数据包。
[0128]
在一些可选的实施方式中,上述目标音频为音视频会议音频。
[0129]
在一些可选的实施方式中,上述输出单元412还用于:根据上述方位信息,利用虚拟三维技术输出上述目标音频对应的三维声场。
[0130]
需要说明的是,本公开的实施例提供的音频处理装置中各单元的实现细节和技术效果可以参考本公开中其它实施例的说明,在此不再赘述。
[0131]
进一步参考图4b,作为对上述图3所示方法的实现,本公开提供了一种音频处理装置的一个实施例,该装置实施例与图3所示的方法实施例相对应,该装置具体可以应用于各种服务器中。
[0132]
如图4b所示,本实施例的音频处理装置420包括:记录单元421和发送单元422。其中,记录单元411,用于将目标音频的编码记录在音频数据包的包体中,以及将上述目标音频的方位信息记录在上述音频数据包的扩展头中,其中,上述方位信息用于表示上述目标音频对应的声源的空间方位;发送单元412,用于将上述音频数据包发送至目标设备。
[0133]
在本实施例中,记录单元421和发送单元422的具体处理及其所带来的技术效果可分别参考图3对应实施例中步骤321和步骤322的相关说明,在此不再赘述。
[0134]
在一些可选的实施方式中,上述记录单元421还用于:将上述目标音频的混响信息记录在上述音频数据包的扩展头中。
[0135]
在一些可选的实施方式中,上述记录单元421还用于:将坐标系类型记录在上述扩展头中的第一数据;将上述坐标系类型下的方位信息记录在上述扩展头中的第二数据。
[0136]
在一些可选的实施方式中,上述坐标系类型为球坐标系,上述方位信息包括第一角度值和第二角度值;和/或上述坐标系类型为平面直角坐标系,上述方位信息包括第一坐标值和第二坐标值。
[0137]
在一些可选的实施方式中,上述坐标系类型为球坐标系,上述第一角度值的精度是非线性的,和/或上述第二角度值的精度是非线性的。
[0138]
在一些可选的实施方式中,上述方位信息用于供上述目标设备利用虚拟三维技术输出上述目标音频对应的三维声场。
[0139]
需要说明的是,本公开的实施例提供的音频处理装置中各单元的实现细节和技术效果可以参考本公开中其它实施例的说明,在此不再赘述。
[0140]
下面参考图5,其示出了适于用来实现本公开的终端设备或服务器的计算机系统500的结构示意图。图5示出的计算机系统500仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
[0141]
如图5所示,计算机系统500可以包括处理装置(例如中央处理器、图形处理器等)
501,其可以根据存储在只读存储器(rom)502中的程序或者从存储装置508加载到随机访问存储器(ram)503中的程序而执行各种适当的动作和处理。在ram 503中,还存储有计算机系统500操作所需的各种程序和数据。处理装置501、rom 502以及ram 503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。
[0142]
通常,以下装置可以连接至i/o接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风等的输入装置506;包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许计算机系统500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备的计算机系统500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
[0143]
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从rom 502被安装。在该计算机程序被处理装置501执行时,执行本公开的实施例的方法中限定的上述功能。
[0144]
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。
[0145]
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
[0146]
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备实现如图2a或图2b所示的实施例及其可选实施方式示出的音频处理方法。
[0147]
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可
以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0148]
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0149]
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,处理单元还可以被描述为“用于根据音频数据包的扩展头,确定目标音频的方位信息的单元”。
[0150]
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。