应用于车辆的交互方法和装置与流程

应用于车辆的交互方法和装置
1.相关申请的交叉引用
2.本技术为申请日为2019年03月12日，申请号为201910184912.1，发明名称为“应用于车辆的交互方法和装置”的中国专利申请的分案申请。
技术领域
3.本技术实施例涉及计算机技术领域，具体涉及互联网技术领域，尤其涉及应用于车辆的交互方法和装置。

背景技术：

4.传统的车载语音系统，仅仅围绕司机一个人服务，接收语音的麦克风也设置在车内室的前端。并且，传统的导航、音乐、电话等也都是围绕司机来展开设计的。
5.这样，对于车内室中的乘客，往往很难使用车载语音系统，难于和车辆进行语音交互，更不能进行多媒体播放。

技术实现要素：

6.本技术实施例提出了应用于车辆的交互方法和装置。
7.第一方面，本技术实施例提供了一种应用于车辆的交互方法，包括：若接收到用户唤醒语音，基于至少两个拾音器接收到的用户唤醒语音的语音信号幅值，从至少两个拾音器和至少两个多媒体播放装置中确定出用户唤醒语音所对应的目标拾音器和目标播放装置；通过目标拾音器接收第一用户语音，响应于确定第一用户语音包括用于指示多媒体文件的标识的信息，发送指示播放多媒体文件的播放指令至目标播放装置进行播放。
8.在一些实施例中，在发送指示播放多媒体文件的播放指令至目标播放装置进行播放之后，方法还包括：通过目标拾音器接收第二用户语音，响应于确定第二用户语音包括用于指示调节播放状态的调节信息，利用播放调节信息，调节目标播放装置的播放状态。
9.在一些实施例中，响应于确定第二用户语音包括用于指示调节播放状态的调节信息，利用播放调节信息，调节目标播放装置的播放状态，包括：响应于确定第二用户语音包括用于指示调节播放状态的调节信息，判断目标播放装置是否处于播放中；响应于确定目标播放装置处于播放中，利用播放调节信息，调节目标播放装置的播放状态。
10.在一些实施例中，基于至少两个拾音器接收到的用户唤醒语音的语音信号幅值，从至少两个拾音器和至少两个多媒体播放装置中确定出用户唤醒语音所对应的目标拾音器和目标播放装置，包括：基于至少两个拾音器接收到的用户唤醒语音的语音信号幅值，从至少两个拾音器中，确定目标拾音器；确定目标拾音器所对应的目标播放装置。
11.在一些实施例中，至少两个拾音器中的后排拾音器用于接收车辆后排的语音，至少两个多媒体播放装置中的后排播放装置用于向车辆后排播放多媒体文件；通过目标拾音器接收第一用户语音，包括：若目标拾音器为后排拾音器，通过后排拾音器接收第一用户语音；以及基于文件地址，利用目标播放装置，播放多媒体文件，包括：若目标播放装置为后排
多媒体播放装置，基于文件地址，利用后排多媒体播放装置，播放多媒体文件。
12.第二方面，本技术实施例提供了一种应用于车辆的交互装置，车辆包括用于车内室的至少两个拾音器和至少两个多媒体播放装置，装置包括：确定单元，被配置成若接收到用户唤醒语音，基于至少两个拾音器接收到的用户唤醒语音的语音信号幅值，从至少两个拾音器和至少两个多媒体播放装置中确定出用户唤醒语音所对应的目标拾音器和目标播放装置；发送单元，被配置成通过目标拾音器接收第一用户语音，响应于确定第一用户语音包括用于指示多媒体文件的标识的信息，发送指示播放多媒体文件的播放指令至目标播放装置进行播放。
13.在一些实施例中，装置还包括：调节单元，被配置成通过目标拾音器接收第二用户语音，响应于确定第二用户语音包括用于指示调节播放状态的调节信息，利用播放调节信息，调节目标播放装置的播放状态。
14.在一些实施例中，调节单元，进一步被配置成按照如下方式执行响应于确定第二用户语音包括用于指示调节播放状态的调节信息，利用播放调节信息，调节目标播放装置的播放状态：响应于确定第二用户语音包括用于指示调节播放状态的调节信息，判断目标播放装置是否处于播放中；响应于确定目标播放装置处于播放中，利用播放调节信息，调节目标播放装置的播放状态。
15.在一些实施例中，确定单元，进一步被配置成按照如下方式执行基于至少两个拾音器接收到的用户唤醒语音的语音信号幅值，从至少两个拾音器和至少两个多媒体播放装置中确定出用户唤醒语音所对应的目标拾音器和目标播放装置：基于至少两个拾音器接收到的用户唤醒语音的语音信号幅值，从至少两个拾音器中，确定目标拾音器；确定目标拾音器所对应的目标播放装置。
16.在一些实施例中，至少两个拾音器中的后排拾音器用于接收车辆后排的语音，至少两个多媒体播放装置中的后排播放装置用于向车辆后排播放多媒体文件；发送单元，进一步被配置成按照如下方式执行通过目标拾音器接收第一用户语音：若目标拾音器为后排拾音器，通过后排拾音器接收第一用户语音；以及基于文件地址，利用目标播放装置，播放多媒体文件，包括：若目标播放装置为后排多媒体播放装置，基于文件地址，利用后排多媒体播放装置，播放多媒体文件。
17.第三方面，本技术实施例提供了一种应用于车辆的交互系统，系统包括处理器、用于车内室的至少两个拾音器和至少两个多媒体播放装置；至少两个拾音器，用于接收用户语音；处理器用于执行如第一方面的方法；目标播放装置，用于播放多媒体文件。
18.第四方面，本技术实施例提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如应用于车辆的交互方法中任一实施例的方法。
19.第五方面，本技术实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如应用于车辆的交互方法中任一实施例的方法。
20.本技术实施例提供的应用于车辆的交互方案，首先，若接收到用户唤醒语音，基于至少两个拾音器接收到的用户语音的语音信号幅值，从至少两个拾音器和至少两个多媒体播放装置中确定用户唤醒语音所对应的目标拾音器和目标播放装置。之后，通过目标拾音器接收第一用户语音，若确定第一用户语音所对应的语句包括多媒体文件的标识，基于标
识确定多媒体文件的文件地址。最后，基于文件地址，利用目标播放装置，播放多媒体文件。本技术实施例提供的方案不仅能接收到司机位置的语音，还能够接收到其它位置甚至后排的语音，这样其它位置的乘客可以独立地与车辆进行语音交互，收看到多媒体内容并可以较好地实现不影响到车内的他人。
附图说明
21.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本技术的其它特征、目的和优点将会变得更明显：
22.图1是本技术可以应用于其中的示例性系统架构图；
23.图2是根据本技术的应用于车辆的交互方法的一个实施例的流程图；
24.图3是根据本技术的应用于车辆的交互方法的一个应用场景的示意图；
25.图4是根据本技术的应用于车辆的交互方法的又一个实施例的流程图；
26.图5是根据本技术的应用于车辆的交互装置的一个实施例的结构示意图；
27.图6是根据本技术的应用于车辆的交互系统的一个实施例的结构示意图；
28.图7是适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。
具体实施方式
29.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。
30.需要说明的是，在不冲突的情况下，本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
31.图1示出了可以应用本技术的应用于车辆的交互方法或应用于车辆的交互装置的实施例的示例性系统架构100。
32.如图1所示，系统架构100可以包括车辆101，网络102和服务器103。网络102用以在车辆101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。
33.用户可以使用车辆101通过网络102与服务器103交互，以接收或发送消息等。车辆101上可以安装有各种通讯客户端应用，例如应用于车辆的交互应用、视频类应用、直播应用、即时通信工具、邮箱客户端、社交平台软件等。
34.这里的车辆101可以是硬件，也可以是软件。当车辆101为硬件时，可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当车辆101为软件时，可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块)，也可以实现成单个软件或软件模块。在此不做具体限定。
35.服务器103可以是提供各种服务的服务器，例如对车辆101提供支持的后台服务器。后台服务器可以对接收到的用户唤醒语音和第一用户语音等数据进行分析等处理，并将处理结果反馈给终端设备。
36.需要说明的是，本技术实施例所提供的应用于车辆的交互方法可以由服务器103
或者车辆101执行，相应地，应用于车辆的交互装置可以设置于服务器103或者车辆101中。
37.应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。
38.继续参考图2，示出了根据本技术的应用于车辆的交互方法的一个实施例的流程200。该应用于车辆的交互方法，包括以下步骤：
39.步骤201，若接收到用户唤醒语音，基于至少两个拾音器接收到的用户唤醒语音的语音信号幅值，从至少两个拾音器和至少两个多媒体播放装置中确定用户唤醒语音所对应的目标拾音器和目标播放装置。
40.在本实施例中，上述车辆包括至少两个用于车内室的拾音器和至少两个用于车内室的多媒体播放装置。应用于车辆的交互方法的执行主体(例如图1所示的车辆中的处理器)可以在接收到用户唤醒语音的情况下，基于车辆的上述至少两个拾音器中的各个拾音器接收到的用户唤醒语音的语音信号幅值(an)，来确定用户唤醒语音所对应的目标拾音器和目标播放装置。多媒体文件可以是音频、视频等等中的至少一个。多媒体播放装置可以是显示器，也可以是用于输出音频的扩音器等等。在这里，用户唤醒语音为包括指示预设唤醒词的信息的语音。预设唤醒词为预先设置的可以用于唤醒上述执行主体以进行交互的词汇。比如“你好，张三”。如果确定所接收的语音中包括指示预设唤醒词的信息，即确定接收到用户唤醒语音。用户在车内的某个座位上说出用户唤醒语音，主要用于接收该座位的语音的拾音器则可以作为用户唤醒语音的目标拾音器，即被唤醒的目标拾音器。
41.本实施例中的车辆，包括主要拾音对象为车辆第一排座位上的乘客的拾音器，还包括主要拾音对象为车辆后排座位上的乘客的拾音器。这里的车辆后排或车辆后排座位可以指车辆第一排座位之后的座位。车内的每个座位可以对应一个拾音器，并对应一个多媒体播放装置，或者每一排座位对应两个拾音器。比如，车内有四个座位，那么可以在车内设置四个拾音器。车内室中，各个拾音器的设置位置都便于其接收主要拾音对象的语音。播放装置的设置位置都便于其对应的用户进行观看。比如，第二排拾音器(后排拾音器)和第二排播放装置(后排播放装置)可以设置于第一排座位椅背的面向第二排的一侧。
42.上述执行主体可以采用多种方式，确定用户唤醒语音所对应的目标拾音器和目标播放装置。比如，上述执行主体可以确定各个拾音器所接收到的语音的幅值，并将接收到幅值最大的语音的拾音器作为目标拾音器，并将向该目标拾音器所对应的座位显示的多媒体播放装置作为目标播放装置。
43.在本实施例的一些可选的实现方式中，步骤201可以包括：
44.基于上述至少两个拾音器接收到的用户唤醒语音的语音信号幅值，从上述至少两个拾音器中，确定目标拾音器；确定目标拾音器所对应的目标播放装置。
45.在这些可选的实现方式中，上述执行主体可以基于上述至少两个拾音器接收到的用户唤醒语音的语音信号幅值，确定出目标拾音器。并确定与该目标拾音器对应的目标播放装置。具体地，可以采用多种方式确定目标拾音器。可以将接收到的幅值最大的拾音器作为目标拾音器。也可以确定出接收到最大的幅值与其次的幅值的拾音器，并分别假设这两个拾音器为目标拾音器。在其中一个拾音器为目标拾音器的情况下，根据隔离度，计算另一个拾音器在消除位置偏差后的幅值。确定所假设的每种情况下，其中一个拾音器所接收到的音频幅值与另一个拾音器消除位置偏差后的音频幅值的差值。并将取得差值较小的结果
所假设的目标拾音器作为目标拾音器。
46.这些实现方式可以首先准确地确定出所唤醒的拾音器，进而确定出向用户播放多媒体文件的播放装置。之后用户可以通过该拾音器与车辆进行语音交互，并利用播放装置收看多媒体内容。
47.步骤202，通过目标拾音器接收第一用户语音，响应于确定第一用户语音包括用于指示多媒体文件的标识的信息，发送指示播放多媒体文件的播放指令至目标播放装置进行播放。
48.在本实施例中，上述目标拾音器可以收集到第一用户语音并传输给上述执行主体，以使上述执行主体接收到第一用户语音。响应于确定上述第一用户语音包括用于指示多媒体文件的标识的信息，可以发送指示播放多媒体文件的播放指令至目标播放装置，这样目标播放装置可以播放上述多媒体文件。在实践中，目标播放装置可以进行实时播放，也可以在通过下载地址下载多媒体文件后进行播放。
49.上述执行主体可以通过指示标识的信息确定出标识，并利用该标识获取到多媒体文件。具体地，上述执行主体可以基于标识来确定多媒体文件的文件地址。之后，上述执行主体可以利用该标识在本地或者在互联网查找多媒体文件的文件地址。此外，也可以直接利用标识在本地找到对应的多媒体文件。标识是能够指示多媒体文件，用于区别不同多媒体文件的内容。比如，标识可以是名称、简称或者名称的一部分。指示标识的信息可以是标识本身，或者标识对应的代码或者字符等等。这里的文件地址可以是用于实时播放的播放地址，也可以是用于下载多媒体文件的下载地址。
50.在本实施例的一些可选的实现方式中，至少两个拾音器中的后排拾音器用于接收车辆后排的语音，至少两个多媒体播放装置中的后排播放装置用于向车辆后排播放多媒体文件；步骤202中的通过目标拾音器接收第一用户语音，可以包括：若目标拾音器为后排拾音器，通过后排拾音器接收第一用户语音；以及步骤203可以包括：若目标播放装置为后排多媒体播放装置，基于文件地址，利用后排多媒体播放装置，播放多媒体文件。
51.在这些可选的实现方式中，上述执行主体可以在确定目标拾音器为后排拾音器的情况下，通过该后排拾音器接收第一用户语音。上述执行主体可以在目标播放装置为后排多媒体播放装置的情况下，利用该后排多媒体播放装置，播放多媒体文件。这样，坐在车辆后排的用户也能够唤醒其位置对应的多媒体播放装置，并观看该播放装置播放的多媒体内容。
52.继续参见图3，图3是根据本实施例的应用于车辆的交互方法的应用场景的一个示意图。在图3的应用场景中，执行主体301若接收到用户唤醒语音302，基于至少两个拾音器接收到的用户唤醒语音302的语音信号幅值303，从上述至少两个拾音器和上述至少两个多媒体播放装置中确定出用户唤醒语音302所对应的目标拾音器304和目标播放装置305；通过目标拾音器304接收第一用户语音306，响应于确定第一用户语音306包括用于指示多媒体文件的标识的信息307，发送指示播放多媒体文件的播放指令308至目标播放装置进行播放。
53.本技术的上述实施例提供的方法不仅能接收到司机位置的语音，还能够接收到后排等的其他位置的语音，这样后排位置的乘客可以独立地与车辆进行语音交互，收看到多媒体内容并可以较好地实现不影响到车内的其他人。
54.进一步参考图4，其示出了应用于车辆的交互方法的又一个实施例的流程400。该应用于车辆的交互方法的流程400，包括以下步骤：
55.步骤401，若接收到用户唤醒语音，基于至少两个拾音器接收到的用户唤醒语音的语音信号幅值，从至少两个拾音器和至少两个多媒体播放装置中确定用户唤醒语音所对应的目标拾音器和目标播放装置。
56.在本实施例中，上述车辆包括至少两个拾音器和至少两个多媒体播放装置。其中至少两个拾音器可以包括前排拾音器和后排拾音器。至少两个多媒体播放装置可以包括前排播放装置和后排播放装置。至少两个拾音器中的后排拾音器用于接收车辆后排的语音，至少两个多媒体播放装置中的后排播放装置用于向车辆后排播放多媒体文件。应用于车辆的交互方法的执行主体(例如图1所示的车辆中的处理器)可以在接收到用户唤醒语音的情况下，基于车辆的上述至少两个拾音器中的各个拾音器接收到的用户唤醒语音的语音信号幅值(an)，来确定用户唤醒语音所对应的目标拾音器和目标播放装置。多媒体文件可以是音频、视频等等中的至少一个。多媒体播放装置可以是显示器，也可以是用于输出音频的扩音器等等。
57.步骤402，通过目标拾音器接收第一用户语音，响应于确定第一用户语音包括用于指示多媒体文件的标识的信息，发送指示播放多媒体文件的播放指令至目标播放装置进行播放。
58.在本实施例中，上述目标拾音器可以收集到第一用户语音并传输给上述执行主体，以使上述执行主体接收到第一用户语音。响应于确定上述第一用户语音包括用于指示多媒体文件的标识的信息，可以发送指示播放多媒体文件的播放指令至目标播放装置，这样目标播放装置可以播放上述多媒体文件。在实践中，目标播放装置可以进行实时播放，也可以在通过下载地址下载多媒体文件后进行播放。
59.步骤403，通过目标拾音器接收第二用户语音，响应于确定第二用户语音包括用于指示调节播放状态的调节信息，利用播放调节信息，调节目标播放装置的播放状态。
60.在本实施例中，上述执行主体可以在确定出目标拾音器，并在目标拾音器被唤醒之后，通过目标拾音器接收第二用户语音。若确定第二用户语音所对应的语句包括调节信息，则可以利用播放调节信息，对上述目标播放装置的播放状态进行调节。对音频进行语音识别之后，可以得到音频对应的语句。调节信息为在语句中出现的关于调节播放的词句，可以是完整的语句，也可以是语句的一部分。比如，语句可以是“快进”也可以是“对视频进行快进”。这两个语句中的播放调节信息都是“快进”。播放状态可以呈现为多种方式，比如，播放进度，播放音量，是否全屏播放等等。
61.在实践中，上述调节信息可以是对播放状态进行调节的多种内容中的任意一种，比如播放、暂停、停止、快进、快退、音量调大或全屏播放等等。
62.在本实施例的一些可选的实现方式中，上述响应于第二用户语音包括用于指示调节播放状态的调节信息，利用播放调节信息，调节目标播放装置的播放状态，可以包括：
63.响应于通过目标拾音器接收的第二用户语音包括用于指示调节播放状态的调节信息，判断目标播放装置是否处于播放中；响应于确定目标播放装置处于播放中，利用播放调节信息，调节目标播放装置的播放状态。
64.在这些可选的实现方式中，上述执行主体可以在每次调节播放状态之前，需要先
确定目标播放装置是否处于播放中，若是，则可以调节目标播放装置的播放状态。
65.这些实现方式可以在确定播放装置在播放中时，再进行播放，从而减少执行主体对播放装置的无效调节。
66.本实施例中，用户可以利用语音与目标拾音器进行交互，并调节目标播放装置的播放状态，进而丰富了坐在各个座位的乘客与车载系统的交互方式，也让调节过程更加便捷。
67.进一步参考图5，作为对上述各图所示方法的实现，本技术提供了一种应用于车辆的交互装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。
68.如图5所示，本实施例的应用于车辆的交互装置500包括：确定单元501和发送单元502。其中，确定单元501，被配置成确定单元，被配置成若接收到用户唤醒语音，基于至少两个拾音器接收到的用户唤醒语音的语音信号幅值，从至少两个拾音器和至少两个多媒体播放装置中确定出用户唤醒语音所对应的目标拾音器和目标播放装置；发送单元502，被配置成通过目标拾音器接收第一用户语音，响应于确定第一用户语音包括用于指示多媒体文件的标识的信息，发送指示播放多媒体文件的播放指令至目标播放装置进行播放。
69.在一些实施例中，应用于车辆的交互装置500的确定单元501可以在接收到用户唤醒语音的情况下，基于车辆的各个拾音器接收到的用户唤醒语音的语音信号幅值，来确定用户唤醒语音所对应的目标拾音器和目标播放装置。多媒体文件可以是音频、视频等等中的至少一个。多媒体播放装置可以是显示器，也可以是用于输出音频的扩音器等等。
70.在一些实施例中，发送单元502可以接收到第一用户语音。响应于确定上述第一用户语音包括用于指示多媒体文件的标识的信息，可以发送指示播放多媒体文件的播放指令至目标播放装置，这样目标播放装置可以播放上述多媒体文件。在实践中，目标播放装置可以进行实时播放，也可以在通过下载地址下载多媒体文件后进行播放。
71.在本实施例的一些可选的实现方式中，装置还包括：调节单元，被配置成通过目标拾音器接收第二用户语音，响应于确定第二用户语音包括用于指示调节播放状态的调节信息，利用播放调节信息，调节目标播放装置的播放状态。
72.在本实施例的一些可选的实现方式中，调节单元，进一步被配置成按照如下方式执行响应于确定第二用户语音包括用于指示调节播放状态的调节信息，利用播放调节信息，调节目标播放装置的播放状态：响应于确定第二用户语音包括用于指示调节播放状态的调节信息，判断目标播放装置是否处于播放中；响应于确定目标播放装置处于播放中，利用播放调节信息，调节目标播放装置的播放状态。
73.在本实施例的一些可选的实现方式中，确定单元，进一步被配置成按照如下方式执行基于至少两个拾音器接收到的用户唤醒语音的语音信号幅值，从至少两个拾音器和至少两个多媒体播放装置中确定出用户唤醒语音所对应的目标拾音器和目标播放装置：基于至少两个拾音器接收到的用户唤醒语音的语音信号幅值，从至少两个拾音器中，确定目标拾音器；确定目标拾音器所对应的目标播放装置。
74.在本实施例的一些可选的实现方式中，至少两个拾音器中的后排拾音器用于接收车辆后排的语音，至少两个多媒体播放装置中的后排播放装置用于向车辆后排播放多媒体文件；发送单元，进一步被配置成按照如下方式执行通过目标拾音器接收第一用户语音：若
目标拾音器为后排拾音器，通过后排拾音器接收第一用户语音；以及基于文件地址，利用目标播放装置，播放多媒体文件，包括：若目标播放装置为后排多媒体播放装置，基于文件地址，利用后排多媒体播放装置，播放多媒体文件。
75.如图6所示，作为对上述各图所示方法的实现，本技术提供了一种应用于车辆的交互系统，系统包括处理器、用于车内室的至少两个拾音器和至少两个多媒体播放装置，处理器用于执行上述各图所示方法；
76.上述至少两个拾音器，用于接收用户唤醒语音；
77.上述处理器，用于执行如上述任一实施例的方法；
78.上述目标播放装置，用于播放多媒体文件。
79.本技术的上述实施例提供的系统不仅能接收到司机位置的语音，还能够接收到后排等的其他位置的语音，这样后排位置的乘客可以独立地与车辆进行语音交互，收看到多媒体内容并可以较好地实现不影响到车内的其他人。
80.如图7所示，电子设备700可以包括处理装置(例如中央处理器、图形处理器等)701，其可以根据存储在只读存储器(rom)702中的程序或者从存储装置708加载到随机访问存储器(ram)703中的程序而执行各种适当的动作和处理。在ram 703中，还存储有电子设备700操作所需的各种程序和数据。处理装置701、rom 702以及ram703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
81.通常，以下装置可以连接至i/o接口705：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风706；输出装置707；包括例如磁带、硬盘等的存储装置708；以及通信装置709。通信装置709可以允许电子设备700与其他设备进行无线或有线通信以交换数据。虽然图7示出了具有各种装置的电子设备700，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图7中示出的每个方框可以代表一个装置，也可以根据需要代表多个装置。需要说明的是，如果电子设备是终端设备，输入装置706还可以包括加速度计、陀螺仪等的；输出装置707则可以包括例如液晶显示器(lcd)、扬声器、振动器等。
82.特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置709从网络上被下载和安装，或者从存储装置708被安装，或者从rom 702被安装。在该计算机程序被处理装置701执行时，执行本公开的实施例的方法中限定的上述功能。需要说明的是，本公开的实施例的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd
‑
rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中，计算机可读信号介质可以包括在基带
中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、rf(射频)等等，或者上述的任意合适的组合。
83.附图中的流程图和框图，图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
84.描述于本技术实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括确定单元和发送单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，发送单元还可以被描述为“通过目标拾音器接收第一用户语音，响应于确定第一用户语音包括用于指示多媒体文件的标识的信息，发送指示播放多媒体文件的播放指令至目标播放装置进行播放的单元”。
85.作为另一方面，本技术还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的装置中所包含的；也可以是单独存在，而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该装置执行时，使得该装置：若接收到用户唤醒语音，基于至少两个拾音器接收到的用户唤醒语音的语音信号幅值，从至少两个拾音器和至少两个多媒体播放装置中确定出用户唤醒语音所对应的目标拾音器和目标播放装置；通过目标拾音器接收第一用户语音，响应于确定第一用户语音包括用于指示多媒体文件的标识的信息，发送指示播放多媒体文件的播放指令至目标播放装置进行播放。
86.以上描述仅为本技术的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本技术中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本技术中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。