智能体协作装置、其动作方法以及存储介质与流程

1.本公开涉及一种能够利用多个智能体(agent)所提供的服务的智能体协作装置及其动作方法、以及存储有智能体协作程序的存储介质。

背景技术：

2.在日本特开2018
‑
189984号公报中，作为用于对两个智能体的服务进行利用的语音对话方法，而记载了一种基于对智能体进行识别的关键字等智能体信息来决定由两个智能体中的哪一个进行应对的方法。具体而言，作为家智能体的语音对话智能体接受输入语音信号，并针对输入语音信号实施语音识别处理，且基于语音识别处理的结果和智能体信息，来决定由家智能体和其它的车智能体中的哪一个实施基于输入语音信号的处理。在决定中，在决定为由家智能体实施的情况下，实施基于语音识别处理的结果的处理，生成并输出该处理所涉及的应答语音信号。另一方面，在决定为由车智能体实施的情况下，将输入语音信号转送给车智能体服务器。
3.但是，在日本特开2018
‑
189984号公报中，于多个智能体中的一个智能体正在进行音乐或者有声读物的播放的过程中针对其它的智能体实施了语音对话的情况下，因播放中的声音和语音对话混合存在而难以听到由语音对话所进行的应答语音，因而还存在改善的余地。

技术实现要素：

4.本公开是考虑了上述事实而完成的，提供一种在多个智能体中的一个智能体正在进行音乐或者有声读物的播放的过程中针对其它的智能体实施了语音对话的情况下能够容易听到由语音对话所进行的应答语音的智能体协作装置及其动作方法、以及存储有智能体协作程序的存储介质。
5.本公开的第一方式为一种智能体协作装置，包括：声音输出部，其对根据来自多个智能体的指示而进行的声音输出进行控制，所述多个智能体能够通过语音对话而对预定的服务进行指示；控制部，其在所述多个智能体中一个智能体作为所述服务而正在进行音乐或者有声读物的播放中针对其它的智能体实施了语音对话的情况下，以减小或者停止所述播放中的音量的方式对所述声音输出部进行控制。
6.根据第一方式，在声音输出部中，对根据来自能够通过语音对话对预定的服务进行指示的多个智能体的指示所进行的声音输出进行控制。
7.而且，在控制部中，在多个智能体中的一个智能体作为服务而正在进行音乐或者有声读物的播放中针对其它的智能体实施了语音对话的情况下，以减小或者停止播放中的音量的方式对声音输出部进行控制。由此，在多个智能体中的一个智能体正在进行音乐或者有声读物的播放中针对其它的智能体实施了语音对话的情况下，能够容易听到基于语音对话所进行的应答语音。
8.另外，也可以采用如下方式，即，在所述播放中所述其它的智能体接受了语音对话
的情况下，控制部以如下的方式对所述声音输出部进行控制，即，减小所述播放中的音量，并且在所述其它的智能体输出针对语音对话的应答语音时停止所述播放中的声音。由此，在能够容易听到由语音对话所进行的应答语音的同时，省略播放中的声音的停止指示，实施其它的智能体所提供的有声读物或音乐等的播放。
9.此外，也可以采用如下方式，即，在所述播放中所述其它的智能体接受了语音对话的情况下，控制部以如下方式对所述声音输出部进行控制，即，减小所述播放中的音量，且在所述其它的智能体输出应答语音的期间停止所述播放中的声音，并且，在与所述其它的智能体的语音对话结束后再次开始所述播放中的声音。由此，即使在音乐或者有声读物的播放中，也能够容易听到其它的智能体的应答语音。
10.此外，也可以采用如下方式，即，在所述一个智能体正在进行音乐或者有声读物的播放中所述其它的智能体对音乐或者有声读物进行播放的情况下，控制部以如下方式对所述声音输出部进行控制，即，在所述其它的智能体接受了语音对话时，减小所述播放中的音量，并且，在所述其它的智能体开始音乐或者有声读物的播放时，停止所述一个智能体进行的音乐或者有声读物的播放。由此，能够在容易听到由语音对话而进行的应答语音的同时，省略播放中的声音的停止指示，并实施其它的智能体所提供的有声读物或音乐等的播放。
11.此外，也可以采用如下方式，即，在所述一个智能体正在进行音乐或者有声读物的播放中所述其它的智能体输出针对语音对话的应答语音的情况下，控制部以如下方式对所述声音输出部进行控制，即，在所述其它的智能体接受了语音对话时，减小所述播放中的音量，并且，在所述其它的智能体输出所述应答语音之后，复原所述播放中的音量。由此，即使正在进行音乐或者有声读物的播放，也能够容易听到其它的智能体的应答语音。
12.本公开的第二方式为一种智能体协作装置的动作方法，所述智能体协作装置具有能够通过语音对话而对预定的服务进行指示的多个智能体的功能和对来自所述多个智能体的声音输出进行控制的声音输出部，所述智能体协作装置的动作方法包括：对针对所述多个智能体中的一个智能体的语音通话进行检测，对所述多个智能体中的其它的智能体是否作为所述服务而处于音乐或者有声读物的播放中进行判断，在判断为处于播放中的情况下，以减小或者停止所述播放中的音量的方式对所述声音输出部进行控制。
13.本公开的第三方式为一种非临时性存储介质，其存储有使计算机执行智能体协作处理的程序，所述计算机具有能够通过语音对话而对预定的服务进行指示的多个智能体的功能和对来自所述多个智能体的声音输出进行控制的声音输出部，所述智能体协作处理包括：对针对所述多个智能体中的一个智能体的语音通话进行检测，对所述多个智能体中的其它的智能体是否作为所述服务而处于音乐或者有声读物的播放中进行判断，在判断为处于播放中的情况下，以减小或者停止所述播放中的音量的方式对所述声音输出部进行控制。
14.在第二方式以及第三方式中，与第一方式同样，在多个智能体中的一个智能体正在进行音乐或者有声读物的播放中针对其它的智能体实施了语音对话的情况下，能够容易听到由语音对话所进行的应答语音。
15.如以上所说明的那样，根据本公开，能够提供一种在多个智能体中的一个智能体正在进行音乐或者有声读物的播放中针对其它的智能体实施了语音对话的情况下能够容易听到由语音对话所进行的应答语音的智能体协作装置及其动作方法、以及存储有智能体
协作程序的存储介质。
附图说明
16.图1为表示本实施方式所涉及的智能体协作装置的概略结构的框图。
17.图2为表示通过本实施方式所涉及的智能体协作装置中的语音检测部所实施的处理的流程的一个示例的流程图。
18.图3为表示通过本实施方式所涉及的智能体协作装置中的a2a协作控制部所实施的具体的处理的流程的一个示例的流程图。
19.图4为表示应答输出处理的一个示例的流程图。
20.图5为在本实施方式所涉及的智能体协作装置10中在通过第二智能体24对有声读物进行播放的过程中对第一智能体22指示进行音乐播放的情况下的顺序图。
21.图6为在本实施方式所涉及的智能体协作装置10中在通过第二智能体24对有声读物进行播放的过程中对第一智能体22指示进行天气预报的情况下的顺序图。
22.图7为表示应答输出处理的变形例的流程图。
23.图8为在应用了变形例的应答输出处理的情况下的本实施方式所涉及的智能体协作装置10中在通过第二智能体24对有声读物进行播放的过程中对第一智能体22指示进行音乐播放的情况下的顺序图。
24.图9为在应用了变形例的应答输出处理的情况下的本实施方式所涉及的智能体协作装置10中在通过第二智能体24对有声读物进行播放的过程中对第一智能体22指示进行天气预报的情况下的顺序图。
具体实施方式
25.以下，参照附图，对本公开的实施方式的一个示例进行详细说明。图1为表示本实施方式所涉及的智能体协作装置的概略结构的框图。
26.关于本实施方式所涉及的智能体协作装置10，以被实装在作为车载器而被搭载的主机(head unit，h/u)上的示例为一个示例进行说明。
27.智能体协作装置10经由通信装置16与多个智能体服务器连接。在本实施方式中，作为一个示例，智能体协作装置10与第一智能体服务器12和第二智能体服务器14这两个智能体服务器连接。智能体协作装置10通过与两个智能体服务器实施通信，从而向使用者提供各个智能体服务器所提供的服务。此外，智能体协作装置10具有对来自各个智能体服务器的声音输出进行控制的功能。
28.第一智能体服务器12以及第二智能体服务器14各自提供所谓的、被称为vpa(virtual personal assistant：虚拟个人助理)的语音对话助理的功能。具体而言，通过语音对话而将音乐播放、有声读物播放、天气预报等预定的服务经由智能体协作装置10提供给使用者。关于详细的结构，能够应用公知的各种各样的技术，因此省略说明。
29.通信装置16在本实施方式中被设为车辆专用的通信机，实施智能体协作装置10与第一智能体服务器12的通信、以及智能体协作装置10与第二智能体服务器14的通信。例如，各自的通信经由移动电话等的无线通信网而实施。作为一个示例，应用被称为dcm(data communication module：数据通信模块)的通信装置。
30.智能体协作装置10由包括例如cpu(central processing unit：中央处理单元)、rom(read only memory：只读存储器)、以及ram(random access memory：随机存取存储器)等的一般性的微型计算机构成，并且具备作为声音输出部的一个示例的声音输出控制部18、作为控制部的一个示例的a2a协作控制部20、以及语音检测部26的功能。
31.声音输出控制部18与扬声器28连接，并对来自第一智能体服务器12以及第二智能体服务器14的声音输出进行控制。
32.a2a协作控制部20与触摸面板30、声音输出控制部18、以及语音检测部26连接，并且与各个部件实施信息的授受。此外，a2a协作控制部20具有第一智能体22以及第二智能体24的功能。第一智能体22与第一智能体服务器12对应设置，并且对与第一智能体服务器12的互动进行控制。此外，第二智能体24与第二智能体服务器14对应设置，并且对与第二智能体服务器14的互动进行控制。a2a协作控制部20在从各个智能体服务器接收到了与语音对话相关的信息的情况下，向声音输出控制部18进行通知。由此，声音输出控制部18对基于与语音对话相关的信息的来自扬声器28的声音输出进行控制。
33.语音检测部26与话筒32连接，并且对从话筒32得到的语音信息进行检测，且将检测结果通知给a2a协作控制部20。例如，语音检测部26对用于启动各个智能体的唤醒词进行检测。
34.接下来，对以上述方式被构成的本实施方式所涉及的智能体协作装置10的各个部分所实施的具体的动作的一个示例进行说明。
35.在本实施方式所涉及的智能体协作装置10中，语音检测部26对唤醒词进行检测，并且向a2a协作控制部20进行通知，a2a协作控制部20经由通信装置16与对应的智能体服务器连接。
36.声音输出控制部18根据来自各个智能体服务器的声音输出(语音对话、音乐、有声读物等)的要求，对来自扬声器28的声音的输出进行控制。
37.在第一智能体22以及第二智能体24中的任意一方的智能体正在进行音乐或者有声读物的播放的过程中针对另一方的智能体实施了语音对话的情况下，a2a协作控制部20以将播放中的音量减小或者停止的方式对控制声音输出控制部18进行控制。
38.此外，在另一方的智能体于一方的智能体正在播放的过程中接受了语音对话的情况下，a2a协作控制部20以如下方式进行控制，即，使一方的智能体减小播放中的音量，并且在另一方的智能体输出针对语音对话的应答语音时停止播放中的声音。
39.此外，在另一方的智能体于一方的智能体正在播放的过程中接受了语音对话的情况下，a2a协作控制部20以如下方式进行控制，即，使一方的智能体减小播放中的音量，并且，在另一方的智能体输出应答语音的期间内停止播放中的声音，且在与另一方的智能体的语音对话结束后使一方的智能体再次开始播放中的声音。
40.此外，在另一方的智能体于一方的智能体正在进行音乐或者有声读物的播放的过程中对音乐或者有声读物进行播放的情况下，a2a协作控制部20以如下方式进行控制，即，在另一方的智能体接受了语音对话时，减小播放中的音量，并且，在另一方的智能体开始音乐或者有声读物的播放时，停止由一方的智能体进行的音乐或者有声读物的播放。
41.并且，在另一方的智能体于一方的智能体正在进行音乐或者有声读物的播放的过程中输出针对语音对话的应答语音的情况下，a2a协作控制部20以如下方式进行控制，即，
在另一方的智能体接受了语音对话时，减小播放中的音量，并且，在另一方的智能体输出应答语音后，使播放中的音量还原。
42.接下来，对由本实施方式所涉及的智能体协作装置10的各个部分所实施的具体的处理进行说明。
43.首先，对由语音检测部26实施的处理进行说明。图2为表示由本实施方式所涉及的智能体协作装置10中的语音检测部26所实施的处理的流程的一个示例的流程图。另外，图2的处理在例如从话筒32向语音检测部26输入了语音的情况下开始。
44.在步骤100中，语音检测部26实施语音检测，并且向步骤102转移。也就是说，对从话筒32被输入的语音进行检测。
45.在步骤102中，语音检测部26对是否检测到唤醒词进行判断。该判断对是否检测到用于启动第一智能体22的预定的唤醒词、或者用于启动第二智能体24的预定的唤醒词进行判断。在该判断被肯定的情况下向步骤104转移，在被否定的情况下结束一系列的处理。
46.在步骤104中，语音检测部26对与唤醒词相对应的智能体是否为启动中进行判断。在该判断被否定的情况下向步骤106转移，在被肯定的情况下向步骤112转移。
47.在步骤106中，语音检测部26对检测到的唤醒词是否为第一智能体22用进行判断。在该判断被肯定的情况下向步骤108转移，在检测到第二智能体24用的唤醒词从而上述判断被否定的情况下向步骤110转移。
48.在步骤108中，语音检测部26通知第一智能体22启动，并且向步骤112转移。
49.另一方面，在步骤110中，语音检测部26通知第二智能体24启动，并且向步骤112转移。
50.在步骤112中，语音检测部26对是否在预定的时间内检测到语音进行判断。在该判断被否定的情况下，也就是说，在预定的时间内未检测到语音的情况下，结束一系列的处理，在该判断被肯定的情况下向步骤114转移。
51.在步骤114中，语音检测部26将检测到的语音通知给所对应的智能体并且结束一系列的处理。也就是说，在第一智能体22的唤醒词检测后于预定的时间以内检测到了语音的情况下，将检测到的语音通知给第一智能体22。另一方面，在第二智能体24的唤醒词检测后于预定的时间以内检测到语音的情况下，将检测到的语音通知给第二智能体24。
52.接下来，对由a2a协作控制部20所实施的处理进行说明。图3为表示由本实施方式所涉及的智能体协作装置10中的a2a协作控制部20所实施的具体的处理的流程的一个示例的流程图。另外，图3的处理在从语音检测部26接收到了智能体的启动通知的情况下开始。
53.在步骤200中，a2a协作控制部20接收智能体启动通知，并且向步骤202转移。也就是说，对通过图2的步骤108或者步骤110进行的智能体的启动通知进行接收。
54.在步骤202中，a2a协作控制部20对从语音检测部26接收到的智能体的启动通知是否为第一智能体22的启动通知进行判断。在该判断被肯定的情况下向步骤204转移，在被否定的情况下向步骤205转移。
55.在步骤204中，启动第一智能体22，并且向步骤206转移。具体而言，转变为确立第一智能体22与第一智能体服务器12的通信从而能够提供来自第一智能体服务器12的服务的状态。
56.另一方面，在步骤205中，启动第二智能体24，并且向步骤206转移。具体而言，转变
为确立第二智能体24与第二智能体服务器14的通信从而能够提供来自第二智能体服务器14的服务的状态。
57.在步骤206中，a2a协作控制部20对其它的智能体是否为启动中进行判断。该判断在第一智能体22以及第二智能体24中的一方接收到了语音信息的情况下，对第一智能体22以及第二智能体24中的另一方是否为启动中进行判断。在该判断被肯定的情况下向步骤208转移，在被否定的情况下向步骤210转移。
58.在步骤208中，a2a协作控制部20减小先启动的智能体所进行的声音输出的音量，并且向步骤210转移。也就是说，a2a协作控制部20对声音输出控制部18指示进行由先启动的智能体进行的声音输出(例如，有声读物和音乐等)的音量的减小。由此，已经被输出的音源的音量被减小，从而容易听到与智能体的对话。另外，步骤208也可以设为不是进行音量的减小，而是将对话中的声音输出暂时停止。
59.在步骤210中，a2a协作控制部20对是否在预定的时间内从语音检测部26接收到了语音通知进行判断。该判断对是否通过上述的步骤114而接收到了语音的通知进行判断。在该判断被肯定的情况下向步骤212转移，在被否定的情况下结束一系列的处理。
60.在步骤212中，a2a协作控制部20从所对应的智能体向而所对应的智能体服务器发送语音信息，并且向步骤214转移。也就是说，在第一智能体22被启动并且接收到了语音通知的情况下，第一智能体22向第一智能体服务器12发送语音信息。另一方面，在第二智能体24被启动并且接收到了语音通知的情况下，第二智能体24向第二智能体服务器14发送语音信息。
61.在步骤214中，a2a协作控制部20从智能体服务器接收语音信息，并且向步骤216转移。例如，在于步骤212中向智能体服务器发送了对有声读物或音乐进行播放的内容的语音信息的情况下，智能体服务器基于语音信息而实施意图理解，并且接收所对应的对有声读物和音乐进行播放的语音信息。
62.在步骤216中，a2a协作控制部20实施应答输出处理，并且结束一系列的处理。应答输出处理为实施针对来自使用者的对话的应答的处理，例如，实施图4所示的处理。图4为表示应答输出处理的一个示例的流程图。
63.也就是说，在步骤300中，a2a协作控制部20对是否为其它的智能体进行的声音输出中进行判断。在该判断被否定的情况下向步骤302转移，在被肯定的情况下向步骤304转移。
64.在步骤302中，a2a协作控制部20基于从智能体服务器接收到的语音信息而实施要求的声音播放，然后使图4的处理返回至图3的处理并且结束一系列的处理。
65.在步骤304中，a2a协作控制部20对从智能体服务器接收到的语音信息是否为音乐播放进行判断。在该判断被肯定的情况下向步骤306转移，在被否定的情况向步骤312转移。
66.在步骤306中，a2a协作控制部20以发声出播放开始消息的方式对声音输出控制部18进行控制，并且向步骤308转移。
67.在步骤308中，a2a协作控制部20结束由其它的智能体进行的声音输出，并且向步骤310转移。
68.在步骤310中，a2a协作控制部20以对要求的音乐、即从智能体服务器接收到的语音信息所表示的音乐进行播放的方式对声音输出控制部18进行控制，然后使图4的处理返
回至图3的处理并结束一系列的处理。
69.另一方面，在步骤312中，a2a协作控制部20对从智能体服务器接收到的语音信息是否为天气预报进行判断。在该判断被否定的情况下向步骤314转移，在被肯定的情况下向步骤316转移。
70.在步骤314中，a2a协作控制部20实施与其它的要求相应的语音发声，然后使图4的处理返回至图3的处理并且结束一系列的处理。
71.在步骤316中，a2a协作控制部20以发声出从智能体服务器接收到的语音信息所表示的天气预报的方式对声音输出控制部18进行控制，并且向步骤318转移。也就是说，在减小其它的智能体所进行的声音输出(例如，有声读物或音乐等)的音量的同时发声出天气预报，因而能够容易听到天气预报。
72.在步骤318中，a2a协作控制部20以将曾先启动的其它的智能体所进行的声音输出的音量复原的方式对声音输出控制部18进行控制，然后使图4的处理返回并且结束一系列的处理。
73.在此，列举具体例而对本实施方式所涉及的智能体协作装置10的动作进行说明。图5为，在本实施方式所涉及的智能体协作装置10中，在通过第二智能体24对音乐进行播放的过程中，针对第一智能体22指示进行音乐播放的情况下的顺序图。另外，虽然作为一个示例而对在通过第二智能体24对音乐进行播放的过程中对第一智能体22指示进行音乐播放的情况进行了说明，但不限于此。例如，在通过第二智能体24对音乐或者有声读物进行播放的过程中对第一智能体22指示进行音乐或者有声读物的播放的情况也是同样的。
74.如图5所示的那样，在第二智能体24正在播放音乐时，使用者发声出作为第一智能体22的唤醒词的“第一智能体”。由此，语音检测部26通过上述的步骤100而检测出语音，从而步骤102被肯定，步骤104被否定。然后，步骤106被肯定，从而通过步骤108而通知第一智能体22启动。当第一智能体22的启动被通知时，通过a2a协作控制部20通过上述的步骤200来接收启动通知，从而步骤202的判断被肯定并且通过步骤204而启动第一智能体22。此时，由于第二智能体24为音乐播放中，因此步骤206的判断被肯定，并且通过步骤208而减小第二智能体24所进行的音乐播放的音量。
75.此外，当接着唤醒词而在预定的时间内发声出“放音乐”时，在语音检测部26中，步骤112的判断被肯定，从而通过步骤114而将语音通知给第一智能体22。当语音被通知时，在a2a协作控制部20中，上述的步骤210的判断被肯定，并且通过步骤212向第一智能体服务器12发送发声语音。然后，通过第一智能体服务器12实施意图理解，并且通过步骤214而由a2a协作控制部20的第一智能体22对应答进行接收，并且通过步骤216而实施应答输出处理。
76.在应答输出处理中，上述的步骤300以及304的判断被肯定，在步骤306中，通过第一智能体22而使播放开始消息被发声。也就是说，如图5所示的那样，在调低了第二智能体24的音乐播放的音量的状态下，通过第一智能体22而以“用xx放音乐”的方式发声出消息。此时，通过步骤308，结束第二智能体24所进行的音乐播放。然后，在步骤310中，通过第一智能体22来播放音乐。
77.通过以此方式实施处理，从而在图5的示例中，能够在容易听到语音对话所进行的应答语音的同时，省略由第二智能体24进行的播放中的音乐的停止指示，并实施第一智能体22所提供的音乐的播放。
78.图6为，在本实施方式所涉及的智能体协作装置10中，在通过第二智能体24对音乐进行播放的过程中，对第一智能体22指示进行天气预报的情况下的顺序图。另外，虽然作为一个示例而对在通过第二智能体24对音乐进行播放的过程中对第一智能体22指示进行天气预报的情况进行说明，但不限于此。例如，在通过第二智能体24对音乐或者有声读物进行播放的过程中对第一智能体22指示进行天气预报或者其它的服务的情况也是同样的。
79.如图6所示的那样，在第二智能体24正在播放音乐时，使用者发声出作为第一智能体22的唤醒词的“第一智能体”。由此，语音检测部26通过上述的步骤100而检测出语音，从而步骤102被肯定，步骤104被否定。然后，步骤106被肯定，从而通过步骤108而通知第一智能体22启动。当第一智能体22的启动被通知时，在a2a协作控制部20中，通过上述的步骤200而对启动通知进行接收，步骤202的判断被肯定，从而通过步骤204启动第一智能体22。此时，由于第二智能体24为音乐播放中，因此步骤206的判断被肯定，并且通过步骤208而减小第二智能体24所进行的音乐播放的音量。
80.此外，当接着唤醒词而在预定的时间内发声出“告诉我天气”时，在语音检测部26中，步骤112的判断被肯定，从而通过步骤114将语音通知给第一智能体22。当被通知有语音时，在a2a协作控制部20中，上述的步骤210的判断被肯定，从而通过步骤212向第一智能体服务器12发送发声语音。然后，通过第一智能体服务器12来实施意图理解，并且通过步骤214而由a2a协作控制部20的第一智能体22对应答进行接收，并且通过步骤216而实施应答输出处理。
81.在应答输出处理中，上述的步骤300的判断被肯定，步骤304的判断被否定，步骤312的判断被肯定，在步骤316中，通过第一智能体22而发声出天气预报。也就是说，如图6所示的那样，在下调了第二智能体24的音乐播放的音量的状态下，通过第一智能体22而以“今天的天气是晴天”的方式发声出天气预报。然后，在天气预报的发声结束后，在步骤318中，使第二智能体22进行的音乐播放的音量复原。
82.通过以此方式实施处理，从而在图6的示例中，即使在通过第二智能体24而对音乐进行播放的过程中，也能够容易听到第一智能体22的应答语音。
83.接下来，对应答输出处理的变形例进行说明。图7为表示应答输出处理的变形例的流程图。另外，针对与图4相同的处理标注同一符号而进行说明。
84.在步骤300中，a2a协作控制部20对是否为由其它的智能体进行的声音输出中进行判断。在该判断被否定的情况下向步骤302转移，在被肯定的情况下向步骤304转移。
85.在步骤302中，a2a协作控制部20基于从智能体服务器接收到的语音信息而实施要求的声音播放，然后使图7的处理返回至图3的处理并且结束一系列的处理。
86.在步骤304中，a2a协作控制部20对从智能体服务器接收到的语音信息是否为音乐播放进行判断。在该判断被肯定的情况下向步骤305转移，在被否定的情况下向步骤312转移。
87.在步骤305中，a2a协作控制部20结束由其它的智能体进行的声音输出，并且向步骤307转移。
88.在步骤307中，a2a协作控制部20以发声出播放开始消息的方式对声音输出控制部18进行控制，并且向步骤310转移。
89.在步骤310中，a2a协作控制部20以对要求的音乐、即从智能体服务器接收到的语
音信息所表示的音乐进行播放的方式对声音输出控制部18进行控制，然后使图7的处理返回至图3的处理并且结束一系列的处理。
90.另一方面，在步骤312中，a2a协作控制部20对从智能体服务器接收到的语音信息是否为天气预报进行判断。在该判断被否定的情况下向步骤314转移，在被肯定的情况下向步骤315转移。
91.在步骤314中，a2a协作控制部20实施与其它的要求相应的语音发声，然后使图7的处理返回并且结束一系列的处理。
92.此外，在步骤315中，a2a协作控制部20停止先启动的智能体所进行的声音输出，并且向步骤316转移。也就是说，a2a协作控制部20对声音输出控制部18指示停止由先启动的智能体所进行的声音输出(例如，有声读物和音乐等)。
93.在步骤316中，a2a协作控制部20以发声出从智能体服务器接收到的语音信息所表示的天气预报的方式对声音输出控制部18进行控制，并且向步骤317转移。也就是说，在其它的智能体所进行的声音输出(例如，有声读物或音乐等)被停止的状态下发声出天气预报，因此能够容易听到天气预报。
94.在步骤317中，a2a协作控制部20以再次开始由先启动的智能体所进行的声音输出的方式对声音输出控制部18进行控制，然后使图7的处理返回并且结束一系列的处理。
95.在此，列举具体示例而对应用了变形例的应答输出处理的情况下的本实施方式所涉及的智能体协作装置10的动作进行说明。图8为，在应用了变形例的应答输出处理的情况下的本实施方式所涉及的智能体协作装置10中，在通过第二智能体24对音乐进行播放的过程中，对第一智能体22指示进行音乐播放的情况下的顺序图。另外，虽然作为一个示例而对在通过第二智能体24对音乐进行播放的过程中对第一智能体22指示进行音乐播放的情况进行说明，但不限于此。例如，在通过第二智能体24对音乐或者有声读物进行播放的过程中对第一智能体22指示进行音乐或者有声读物的播放的情况也是同样的。
96.如图8所示的那样，在第二智能体24正在播放音乐时，使用者发声出作为第一智能体22的唤醒词的“第一智能体”。由此，语音检测部26通过上述的步骤100而对语音进行检测，从而步骤102被肯定，步骤104被否定。然后，步骤106被肯定，并且通过步骤108而通知第一智能体22启动。当第一智能体22的启动被通知时，在a2a协作控制部20中，通过上述的步骤200而对启动通知进行接收，步骤202的判断被肯定，从而通过步骤204而启动第一智能体22。此时，由于第二智能体24为音乐播放中，因此步骤206的判断被肯定，从而通过步骤208而减小第二智能体24所进行的音乐播放的音量。
97.此外，当接着唤醒词而在预定的时间内发声出“放音乐”时，在语音检测部26中，步骤112的判断被肯定，从而通过步骤114而将语音通知给第一智能体22。当被通知有语音时，在a2a协作控制部20中，上述的步骤210的判断被肯定，从而通过步骤212向第一智能体服务器12发送发声语音。然后，通过第一智能体服务器12实施意图理解，并且通过步骤214而由a2a协作控制部20的第一智能体22对应答进行接收，并且通过步骤216而实施应答输出处理。
98.在应答输出处理中，上述的步骤300以及304的判断被肯定，并且在通过步骤305而结束由第二智能体24进行的音乐播放后，在步骤307中通过第一智能体22而发声出播放开始消息。也就是说，如图8所示的那样，在第二智能体24的音乐播放被停止了的状态下，通过
第一智能体22而以“用xx放音乐”的方式发声出消息。然后，在步骤310中，通过第一智能体22播放音乐。
99.通过以此方式而实施处理，从而在图8的示例中，能够在容易听到通过语音对话而进行的应答语音的同时，省略由第二智能体24进行的播放中的音乐的停止指示，实施第一智能体22所提供的音乐的播放。
100.图9为，在应用了变形例的应答输出处理的情况下的本实施方式所涉及的智能体协作装置10中，在通过第二智能体24对音乐进行播放的过程中，对第一智能体22指示进行天气预报的情况下的顺序图。另外，虽然作为一个示例而对在通过第二智能体24对音乐进行播放的过程中对第一智能体22指示进行天气预报的情况进行说明，但不限于此。例如，在通过第二智能体24对音乐或者有声读物进行播放的过程中对第一智能体22指示进行天气预报或者其它的服务的情况也是同样的。
101.如图9所示的那样，在第二智能体24正在播放音乐时，使用者发声出作为第一智能体22的唤醒词的“第一智能体”。由此，语音检测部26通过上述的步骤100对语音进行检测，从而步骤102被肯定，步骤104被否定。然后，步骤106被肯定，并且通过步骤108而通知第一智能体22启动。当被通知有第一智能体22的启动时，在a2a协作控制部20中，通过上述的步骤200而对启动通知进行接收，从而步骤202的判断被肯定，并且通过步骤204而启动第一智能体22。此时，由于第二智能体24为音乐播放中，因此步骤206的判断被肯定，并且通过步骤208而减小由第二智能体24进行的音乐播放的音量。
102.此外，在接着唤醒词而于预定的时间内发声出“告诉我天气”时，在语音检测部26中，步骤112的判断被肯定，从而通过步骤114而将语音通知给第一智能体22。当被通知有语音时，在a2a协作控制部20中，上述的步骤210的判断被肯定，从而通过步骤212而向第一智能体服务器12发送发声语音。然后，通过第一智能体服务器12实施意图理解，并且通过步骤214而由a2a协作控制部20的第一智能体22对应答进行接收，并且通过步骤216实施应答输出处理。
103.在应答输出处理中，上述的步骤300的判断被肯定，步骤304的判断被否定，步骤312的判断被肯定，并且在步骤315中停止由第二智能体24进行的音乐播放，然后，在步骤316中通过第一智能体22而发声出天气预报。也就是说，如图9所示的那样，在第二智能体24的音乐播放被停止了的状态下，通过第一智能体22而以“今天的天气是晴天”的方式发声出天气预报。然后，在天气预报的发声结束后，如图9的虚线所示的那样，在步骤318中，再次开始由第二智能体24进行的音乐播放。另外，图9的虚线部分也可以不使音乐播放再次开始，而是结束第二智能体24所进行的音乐播放。
104.通过以此方式实施处理，从而在图9的示例中，即使在通过第二智能体24对音乐进行播放的过程中，也能够容易听到第一智能体22的应答语音。
105.另外，在上述的实施方式中，虽然在图4以及图7中，以第一智能体22以及第二智能体24作为服务而提供音乐播放、有声读物播放、以及天气预报的服务的情况为一个示例进行了说明，但服务并不限于这些。
106.此外，虽然在上述的实施方式中，对具有第一智能体22和第二智能体24这两个智能体的示例进行了说明，但是不限于此，还可以具有三个以上的多个智能体。在该情况下，在多个智能体之中一个智能体为音乐或者有声读物的播放中而对其它的智能体实施了语
音对话的情况下，a2a协作控制部20只要以减小或者停止播放中的音量的方式对声音输出控制部进行控制即可。
107.此外，由上述的各个实施方式中的智能体协作装置10所实施的处理作为通过cpu来执行程序而被实施的软件处理进行了说明，但是不限于此。也可以作为通过例如gpu(graphics processing unit：图形处理单元)、asic(application specific integrated circuit：专用集成电路)、以及fpga(field
‑
programmable gate array：现场可编程门阵列)等硬件实施的处理。或者，也可以作为组合了软件以及硬件双方的处理。此外，在作为软件的处理的情况下，可以使程序在各种存储介质中存储并流通。
108.并且，本公开不被限定于上述内容，除了上述内容之外，当然能够在不脱离其主旨的范围内进行各种各样的变形并实施。