用户超时静音判别方法、装置、设备、介质及程序产品与流程

1.本技术涉及金融科技(fintech)的语音通话技术领域，尤其涉及一种用户超时静音判别方法、装置、设备、介质及程序产品。

背景技术：

2.随着金融科技，尤其是互联网科技金融的不断发展，越来越多的技术(如分布式、人工智能等)应用在金融领域，但金融业也对技术提出了更高的要求，如对金融业对应待办事项的分发也有更高的要求。
3.随着计算机软件和人工智能、大数据云服务应用的不断发展，目前，智能外呼系统可通过文本转语音技术将合成音频发送给用户端，在用户端和语音机器人需要交互的场景，机器人播完一句话，在等待用户说话的过程中，可能存在用户不说话，长时间用户静音的情况，此时通话无法继续下去并结束，目前，通常设定一个固定的语音播报时长，超过该语音播报时长了则判定发生了用户超时静音，但是，对于较为复杂的通话场景，仅仅通过一个固定的语音播报时长判别是否发生用户超时静音的准确度较低。

技术实现要素：

4.本技术的主要目的在于提供一种用户超时静音判别方法、装置、设备、介质及程序产品，旨在解决现有技术中通话场景中判别是否发生用户超时静音的准确度低的技术问题。
5.为实现上述目的，本技术提供一种用户超时静音判别方法，所述用户超时静音判别方法应用于用户超时静音判别设备，所述用户超时静音判别方法包括：
6.获取目标通话场景中的语音播报序列，并计算所述语音播报序列对应的语音序列播报时长；
7.获取所述目标通话场景对应的语音播报完毕等待时长以及预设网络传输延时，并依据所述语音播报完毕等待时长、所述语音序列播报时长以及所述预设网络传输延时，计算第一语音播报总时长；
8.依据所述第一语音播报总时长，判别是否发生用户超时静音。
9.可选地，所述依据所述第一语音播报总时长，判别是否发生用户超时静音的步骤包括：
10.获取所述语音播报序列对应的播报起始时间戳，并依据所述第一语音播报总时长和所述播报起始时间戳，计算预估播报终止时间戳；
11.依据所述预估播报终止时间戳，通过检测是否生成下一语音播报序列，判别是否发生用户超时静音。
12.可选地，所述依据所述预估播报终止时间戳，通过检测是否生成下一语音播报序列，判别是否发生用户超时静音的步骤包括：
13.开始播报所述语音播报序列，采集所述语音播报序列对应的实际播报完毕时间
戳；
14.依据所述实际播报完毕时间戳以及所述预估播报终止时间戳，通过检测是否生成所述下一语音播报序列，判别是否发生用户超时静音。
15.可选地，所述依据所述实际播报完毕时间戳以及所述预估播报终止时间戳，通过检测是否生成所述下一语音播报序列，判别是否发生用户超时静音的步骤包括：
16.将所述实际播报完毕时间戳与所述预估播报终止时间戳进行比对，若所述实际播报完毕时间戳小于所述播报终止时间戳，则检测在到达所述预估播报终止时间戳之前是否生成所述下一语音播报序列；
17.若在到达所述预估播报终止时间戳之前已生成所述下一语音播报序列，则计算所述下一语音播报序列对应的第二语音播报总时长，以继续进行语音播报；
18.若在到达所述预估播报终止时间戳之前未生成所述下一语音播报序列，则判定发生用户超时静音。
19.可选地，在所述开始播报所述语音播报序列的步骤之后，所述用户超时静音判别方法还包括：
20.若检测到在所述语音播报序列播报完毕之前生成下一语音播报序列，则计算所述下一语音播报序列对应的第二语音播报总时长；
21.依据所述第一语音播报总时长、所述第二语音播报总时长以及所述播报起始时间戳，更新所述预估播报终止时间戳；
22.依据更新后的预估播报终止时间戳与所述实际播报完毕时间戳，判别是否发生用户超时静音；
23.若未检测到在所述语音播报序列播报完毕之前生成下一语音播报序列，则执行步骤：采集所述语音播报序列对应的实际播报完毕时间戳。
24.可选地，在所述获取所述目标通话场景对应的语音播报完毕等待时长的步骤之前，所述用户超时静音判别方法还包括：
25.获取所述语音播报序列对应的播报对象信息以及对应的通话场景信息；
26.依据所述播报对象信息与所述通话场景信息，预测播报对象在所述语音播报序列播报结束后的目标等待时长，得到所述语音播报完毕等待时长。
27.本技术还提供一种用户超时静音判别装置，所述用户超时静音判别装置为虚拟装置，且所述用户超时静音判别装置应用于用户超时静音判别设备，所述用户超时静音判别装置包括：
28.第一计算模块，用于获取目标通话场景中的语音播报序列，并计算所述语音播报序列对应的语音序列播报时长；
29.第二计算模块，用于获取所述目标通话场景对应的语音播报完毕等待时长以及预设网络传输延时，并依据所述语音播报完毕等待时长、所述语音序列播报时长以及所述预设网络传输延时，计算第一语音播报总时长；
30.判别模块，用于依据所述第一语音播报总时长，判别是否发生用户超时静音。
31.可选地，所述判别模块还用于：
32.获取所述语音播报序列对应的播报起始时间戳，并依据所述第一语音播报总时长和所述播报起始时间戳，计算预估播报终止时间戳；
33.依据所述预估播报终止时间戳，通过检测是否生成下一语音播报序列，判别是否发生用户超时静音。
34.可选地，所述判别模块还用于：
35.开始播报所述语音播报序列，采集所述语音播报序列对应的实际播报完毕时间戳；
36.依据所述实际播报完毕时间戳以及所述预估播报终止时间戳，通过检测是否生成所述下一语音播报序列，判别是否发生用户超时静音。
37.可选地，所述判别模块还用于：
38.将所述实际播报完毕时间戳与所述预估播报终止时间戳进行比对，若所述实际播报完毕时间戳小于所述播报终止时间戳，则检测在到达所述预估播报终止时间戳之前是否生成所述下一语音播报序列；
39.若在到达所述预估播报终止时间戳之前已生成所述下一语音播报序列，则计算所述下一语音播报序列对应的第二语音播报总时长，以继续进行语音播报；
40.若在到达所述预估播报终止时间戳之前未生成所述下一语音播报序列，则判定发生用户超时静音。
41.可选地，所述判别模块还用于：
42.若检测到在所述语音播报序列播报完毕之前生成下一语音播报序列，则计算所述下一语音播报序列对应的第二语音播报总时长；
43.依据所述第一语音播报总时长、所述第二语音播报总时长以及所述播报起始时间戳，更新所述预估播报终止时间戳；
44.依据更新后的预估播报终止时间戳与所述实际播报完毕时间戳，判别是否发生用户超时静音；
45.若未检测到在所述语音播报序列播报完毕之前生成下一语音播报序列，则执行步骤：采集所述语音播报序列对应的实际播报完毕时间戳。
46.可选地，所述用户超时静音判别装置还用于：
47.获取所述语音播报序列对应的播报对象信息以及对应的通话场景信息；
48.依据所述播报对象信息与所述通话场景信息，预测播报对象在所述语音播报序列播报结束后的目标等待时长，得到所述语音播报完毕等待时长。
49.本技术还提供一种用户超时静音判别设备，所述用户超时静音判别设备为实体设备，所述用户超时静音判别设备包括：存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述用户超时静音判别方法的程序，所述用户超时静音判别方法的程序被处理器执行时可实现如上述的用户超时静音判别方法的步骤。
50.本技术还提供一种介质，所述介质为可读存储介质，所述可读存储介质上存储有实现用户超时静音判别方法的程序，所述用户超时静音判别方法的程序被处理器执行时实现如上述的用户超时静音判别方法的步骤。
51.本技术还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述的用户超时静音判别方法的步骤。
52.本技术提供了一种用户超时静音判别方法、装置、设备、介质及程序产品，相比于现有技术中设定一个固定的语音播报时长，超过该语音播报时长了则判定发生了用户超时
静音的技术手段，本技术首先获取目标通话场景中的语音播报序列，并计算所述语音播报序列对应的语音序列播报时长，进而获取所述目标通话场景对应的语音播报完毕等待时长以及预设网络传输延时，并依据所述语音播报完毕等待时长、所述语音序列播报时长以及所述预设网络传输延时，计算第一语音播报总时长，所以，在每次进行语音播报之前，将第一语音播报总时长与实际通话场景对应的语音序列播报时长、语音播报完毕等待时长以及预设网络传输延时相关联，实现了动态计算语音播报总时长的目的，而非设置一个固定的语音播报时长，进而依据所述第一语音播报总时长，判别是否发生用户超时静音，即可避免依据固定的语音播报时长来判别是否发生用户超时静音，克服了对于较为复杂的通话场景，仅仅通过一个固定的语音播报时长判别是否发生用户超时静音的准确度较低的技术缺陷，提升了判别是否发生用户超时静音的准确度。
附图说明
53.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本技术的实施例，并与说明书一起用于解释本技术的原理。
54.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
55.图1为本技术用户超时静音判别方法第一实施例的流程示意图；
56.图2为本技术用户超时静音判别方法中用户端、语音机器人以及会话管理系统之间的交互示意图；
57.图3为本技术用户超时静音判别方法第二实施例的流程示意图；
58.图4为本技术实施例中用户超时静音判别方法涉及的硬件运行环境的设备结构示意图。
59.本技术目的实现、功能特点及优点将结合实施例，参照附图做进一步说明。
具体实施方式
60.应当理解，此处所描述的具体实施例仅用以解释本技术，并不用于限定本技术。
61.本技术实施例提供一种用户超时静音判别方法，在本技术用户超时静音判别方法的第一实施例中，参照图1，所述用户超时静音判别方法包括：
62.步骤s10，获取目标通话场景中的语音播报序列，并计算所述语音播报序列对应的语音序列播报时长；
63.在本实施例中，需要说明的是，所述目标通话场景为人机交互的语音通话场景，也即，语音机器人与用户端进行语音交互的场景，而当语音机器人向用户端播报一段语音时，此时用户通常处于静音状态，在语音机器人播报完毕后，用户通常也需要一段时间才能进行语音反馈，此时用户仍然处于静音状态，但可能会存在用户根本不进行语音反馈的情况，此时容易发生用户静音超时的情况，使得通话无法进行下去或者结束。
64.另外，需要说明的是，用户端与语音机器人最近的通话可用通话序列进行表示，例如，机器人说话序列xi(i＝1,2,3,
…
,n),用户说话序列yj(j＝1,2,3,
…
,m),则通话序列为两者的结合，可以为x1,y1,x2,y2,
…
,也可以为x1,x2,y1,x3,y2,
…
，而机器人说话序列中
某一序列元素也可以拆分为语句播报序列，所述语句播报序列至少包括一语音分片，一语音分片对应的固定字节数的语音数据，进而语音机器人每经过一个预设时间长度播报一语音分片，即可完成对语句播报序列的语音播报，如图2所示为用户端、语音机器人以及会话管理系统之间的交互示意图，其中，xi为机器人说话序列，yj为用户说话序列，会话管理系统根据用户说话序列，匹配生成对应的语音播报序列，而语音机器人以采样的方式从会话管理系统中拉取语音播报序列，并向客户端进行播报。
65.获取目标通话场景中的语音播报序列，并计算所述语音播报序列对应的语音序列播报时长，具体地，获取目标通话场景中的语音播报序列，并确定所述语音播报序列对应的语音分片数量以及对应的预设序列元素播报间隔时长，进而依据所述语音分片数量和所述预设序列元素播报间隔时长，计算所述语音播报序列对应的语音序列播报时长，其中，所述语音序列播报时长为语音机器人播报所述语音播报序列所需的时长，
66.另外，需要说明的是，所述待发送序列元素为所述语音播报序列中的语音分片，所述语音机器人在播报语音时，通常以采样的方式逐步读取语音数据进行播报，所以，所述语音分片数量与采样时间、采样频率、采样深度以及语音分片的大小相关联，例如，假设采样频率为8khz，则证明语音机器人1s内采样8000次，所述采样频率为8khz，采样深度为2字节，采样时间为1s，语音分片的大小为320字节，则所述语音分片数量为50。
67.步骤s20，获取所述目标通话场景对应的语音播报完毕等待时长以及预设网络传输延时，并依据所述语音播报完毕等待时长、所述语音序列播报时长以及所述预设网络传输延时，计算第一语音播报总时长；
68.在本实施例中，需要说明的是，所述语音播报完毕等待时长与通话场景的类型相关联，例如，当通话场景为问题答疑类通话场景时，则应当为用户预留更多的时间进行思考问题答案，进而可设置语音播报完毕等待时长偏长，而当通话场景为业务推荐类通话场景时，应当快速将产品推荐完毕，进而可设置语音播报完毕等待时长偏短，也即不同类型的目标通话场景设置不同的语音播报完毕等待时长。所述预设网络传输延时为会话管理系统与语音机器人之间网络传输延时，其中，会话管理系统为用于管理语音机器人向用户端反馈的语音内容的系统，而语音机器人用于播报这个语音内容对应的语音播报序列。
69.获取所述目标通话场景对应的语音播报完毕等待时长以及预设网络传输延时，并依据所述语音播报完毕等待时长、所述语音序列播报时长以及所述预设网络传输延时，计算第一语音播报总时长，具体地，依据所述目标通话场景的类型，匹配对应的语音播报完毕等待时长，并获取预设网络传输延时，进而对所述语音播报完毕等待时长、所述语音序列播报时长以及所述预设网络传输延时求和，得到第一语音播报总时长，其中，所述第一语音播报总时长为预估的从语音机器人开始播报语音到用户端反馈语音所需时间，若语音机器人在到达第一语音播报总时长之前，接收到了下一语音播报序列，则证明未发生用户静音超时，若语音机器人在到达第一语音播报总时长之前，未接收到下一语音播报序列，则证明发生了用户静音超时，其中，下一语音播报序列为会话管理系统基于用户的反馈语音匹配的语句对应的语音播报序列。
70.其中，在所述获取所述目标通话场景对应的语音播报完毕等待时长的步骤之前，所述用户超时静音判别方法还包括：
71.步骤a10，获取所述语音播报序列对应的播报对象信息以及对应的通话场景信息；
72.在本实施例中，需要说明的是，需要的语音播报完毕等待时长通常与播报对象以及通话场景相关联，例如，对于老人来讲，大脑反应速度以及思考速度较慢，则需要将语音播报完毕等待时长设置的偏长一些，而对于年轻人来讲，则刚好相反，可将语音播报完毕等待时长设置的偏短一些。所述播报对象信息可以为用户画像，所述通话场景信息可以为通话场景的类型以及通话时长等信息。
73.步骤a20，依据所述播报对象信息与所述通话场景信息，预测播报对象在所述语音播报序列播报结束后的目标等待时长，得到所述语音播报完毕等待时长。
74.在本实施例中，依据所述播报对象信息与所述通话场景信息，预测播报对象在所述语音播报序列播报结束后的目标等待时长，得到所述语音播报完毕等待时长，具体地，将所述播报对象信息以及所述通话场景信息拼接为待预测样本，并将所述待预测样本输入预设播报等待时长预测模型，预测播报对象在所述语音播报序列播报结束后的目标等待时长，得到所述语音播报完毕等待时长，进而实现了依据播报对象信息以及通话场景信息，精确预测语音播报完毕等待时长的目的，使得预估的语音播报总时长更加精确，进而可提升用户超时静音的判别准确度。
75.另外地，需要说明的是，对于较长的语音播报序列，用户通常需要更多的时间去进行思考反馈，进而在步骤a20之后，所述用户超时静音判别方法还包括：
76.将所述将所述播报对象信息、所述通话场景信息拼接为待预测样本以及所述语音播报序列的长度拼接为待预测样本，将所述待预测样本输入预设播报等待时长预测模型，预测播报对象在所述语音播报序列播报结束后的目标等待时长，得到所述语音播报完毕等待时长，进而增加了预测播报对象在所述语音播报序列播报结束后的目标等待时长的决策依据，提升了预测语音播报完毕等待时长的准确度，使得预估的语音播报总时长更加精确，进而可提升用户超时静音的判别准确度。
77.步骤s30，依据所述第一语音播报总时长，判别是否发生用户超时静音。
78.在本实施例中，依据所述第一语音播报总时长，判别是否发生用户超时静音，具体地，通过语音机器人开始播报所述语音播报序列，并从开始播报所述语音播报序列到下一语音播报序列达到的时间长度，得到实际语音播报时长，若所述实际语音播报时长不大于所述第一语音播报总时长，则判定未发生用户超时静音，若所述实际语音播报时长大于所述第一语音播报总时长，则判定发生用户超时静音。
79.本技术实施例提供了一种用户超时静音判别方法相比于现有技术中设定一个固定的语音播报时长，超过该语音播报时长了则判定发生了用户超时静音的技术手段，本技术实施例首先获取目标通话场景中的语音播报序列，并计算所述语音播报序列对应的语音序列播报时长，进而获取所述目标通话场景对应的语音播报完毕等待时长以及预设网络传输延时，并依据所述语音播报完毕等待时长、所述语音序列播报时长以及所述预设网络传输延时，计算第一语音播报总时长，所以，在每次进行语音播报之前，将第一语音播报总时长与实际通话场景对应的语音序列播报时长、语音播报完毕等待时长以及预设网络传输延时相关联，实现了动态计算语音播报总时长的目的，而非设置一个固定的语音播报时长，进而依据所述第一语音播报总时长，判别是否发生用户超时静音，即可避免依据固定的语音播报时长来判别是否发生用户超时静音，克服了对于较为复杂的通话场景，仅仅通过一个固定的语音播报时长判别是否发生用户超时静音的准确度较低的技术缺陷，提升了判别是
否发生用户超时静音的准确度。
80.进一步地，参照图3，在本技术另一实施例中，所述依据所述第一语音播报总时长，判别是否发生用户超时静音的步骤包括：
81.步骤s31，获取所述语音播报序列对应的播报起始时间戳，并依据所述第一语音播报总时长和所述播报起始时间戳，计算预估播报终止时间戳；
82.在本实施例中，需要说明的是，所述播报起始时间戳为语音机器人播报所述语音播报序列的起始时间点。
83.具体地，获取所述语音播报序列对应的播报起始时间戳，并对所述播报起始时间戳和所述第一语音播报总时长求和，得到预估播报终止时间戳。
84.步骤s32，依据所述预估播报终止时间戳，通过检测是否生成下一语音播报序列，判别是否发生用户超时静音。
85.在本实施例中，依据所述预估播报终止时间戳，通过检测是否生成下一语音播报序列，判别是否发生用户超时静音，具体地，检测语音机器人在所述预估播报终止时间戳之前是否接收到来自会话管理系统的下一语音播报序列，若语音机器人在所述预估播报终止时间戳之前接收到来自会话管理系统的下一语音播报序列，则判定未发生用户超时静音；若语音机器人在所述预估播报终止时间戳之前未接收到来自会话管理系统的下一语音播报序列，则判定发生用户超时静音。
86.其中，所述依据所述预估播报终止时间戳，通过检测是否生成下一语音播报序列，判别是否发生用户超时静音的步骤包括：
87.步骤s321，开始播报所述语音播报序列，采集所述语音播报序列对应的实际播报完毕时间戳；
88.在本实施例中，需要说明的是，语音机器人在进行语音序列播报时存在2个时间段，分别为语音实际播报时间段以及等待用户响应时间段。所述实际播报完毕时间戳为语音机器人实际播报所述语音播报序列结束的时间点的基础上加上预留给客户进行响应的时间而得到的时间点，也即为等待用户响应时间段接收时的时间点。
89.其中，在所述开始播报所述语音播报序列的步骤之后，所述用户超时静音判别方法还包括：
90.步骤c10，若检测到在所述语音播报序列播报完毕之前生成下一语音播报序列，则计算所述下一语音播报序列对应的第二语音播报总时长；
91.在本实施例中，若检测到在所述语音播报序列播报完毕之前生成下一语音播报序列，则计算所述下一语音播报序列对应的第二语音播报总时长，具体地，若检测到在所述语音播报序列播报完毕之前生成下一语音播报序列，则证明所述语音播报序列与所述下一语音播报序列为连续播报序列，所述下一语音播报序列不为依据用户对语音播报序列的反馈而匹配生成，进而计算所述下一语音播报序列对应的第二语音播报总时长，其中，计算所述下一语音播报序列对应的第二语音播报总时长与计算所述语音播报序列对应的第一语音播报总时长的具体计算过程一致，在此不再赘述。
92.步骤c20，依据所述第一语音播报总时长、所述第二语音播报总时长以及所述播报起始时间戳，更新所述预估播报终止时间戳；
93.在本实施例中，依据所述第一语音播报总时长、所述第二语音播报总时长以及所
述播报起始时间戳，更新所述预估播报终止时间戳，具体地，在所述播报起始时间戳的基础上累加所述第一语音播报总时长和所述第二语音播报总时长，以更新所述预估播报终止时间戳。
94.步骤c30，依据更新后的预估播报终止时间戳与所述实际播报完毕时间戳，判别是否发生用户超时静音；
95.在本实施例中，需要说明的是，若设定一个固定的语音播报时长来判别是否发生用户静音超时，则当语音机器人连续进行语音序列的播报时，则总的语音持续播报时长很容易超过设定的固定的语音播报时长，进而容易导致误判定发生用户超时静音。
96.依据更新后的预估播报终止时间戳与所述实际播报完毕时间戳，判别是否发生用户超时静音，具体地，若更新后的实际播报完毕时间戳在所述预估播报终止时间戳之前，通过语音机器人检测是否接收到新的下一语音播报序列，若语音机器人检测接收到新的下一语音播报序列，则判定未发生用户静音超时，若语音机器人检测未接收到新的下一语音播报序列，则判定发生用户静音超时，若更新后的实际播报完毕时间戳不在所述预估播报终止时间戳之前，则判定发生用户静音超时，实现了当语音机器人连续进行语音序列播报时，准确判别是否发生用户静音超时的目的，避免了在语音机器人在连续进行语音播报时误判定用户静音超时的情况发生，所以提升了用户静音超时判别的准确度。
97.步骤c40，若未检测到在所述语音播报序列播报完毕之前生成下一语音播报序列，则执行步骤：采集所述语音播报序列对应的实际播报完毕时间戳。
98.在本实施例中，若未检测到在所述语音播报序列播报完毕之前生成下一语音播报序列，则证明下一语音播报序列需要依据用户对所述语音播报序列的反馈进行匹配生成，进而执行步骤：采集所述语音播报序列对应的实际播报完毕时间戳，以判定是否发生用户静音超时。
99.步骤s322，依据所述实际播报完毕时间戳以及所述预估播报终止时间戳，通过检测是否生成所述下一语音播报序列，判别是否发生用户超时静音。
100.在本实施例中，依据所述实际播报完毕时间戳以及所述预估播报终止时间戳，通过检测是否生成所述下一语音播报序列，判别是否发生用户超时静音，具体地，若所述实际播报完毕时间戳在所述预估播报终止时间戳之前，通过语音机器人检测是否接收到下一语音播报序列，若语音机器人检测接收到下一语音播报序列，则判定未发生用户静音超时，若语音机器人检测未接收到下一语音播报序列，则判定发生用户静音超时，若所述实际播报完毕时间戳不在所述预估播报终止时间戳之前，则判定发生用户静音超时，其中，在判定用户静音超时之后，可根据实际情况，选择重播或者结束语音播报。
101.其中，所述依据所述实际播报完毕时间戳以及所述预估播报终止时间戳，通过检测是否生成所述下一语音播报序列，判别是否发生用户超时静音的步骤包括：
102.步骤b10，将所述实际播报完毕时间戳与所述预估播报终止时间戳进行比对，若所述实际播报完毕时间戳小于所述播报终止时间戳，则检测在到达所述预估播报终止时间戳之前是否生成所述下一语音播报序列；
103.在本实施例中，将所述实际播报完毕时间戳与所述预估播报终止时间戳进行比对，若所述实际播报完毕时间戳小于所述播报终止时间戳，则检测在到达所述预估播报终止时间戳之前是否生成所述下一语音播报序列，具体地，将所述实际播报完毕时间戳与所
述预估播报终止时间戳进行比对，若所述实际播报完毕时间戳小于所述播报终止时间戳，则检测在到达所述预估播报终止时间戳之前是否生成所述下一语音播报序列，以判别用户是否有对所述语音播报序列进行反馈，其中，所述下一语音播报序列是依据用户对于语音播报序列的反馈学习进行匹配生成的。
104.步骤b20，若在到达所述预估播报终止时间戳之前已生成所述下一语音播报序列，则计算所述下一语音播报序列对应的第二语音播报总时长，以继续进行语音播报；
105.步骤b30，若在到达所述预估播报终止时间戳之前未生成所述下一语音播报序列，则判定发生用户超时静音。
106.在本实施例中，若在到达所述预估播报终止时间戳之前已生成所述下一语音播报序列，则证明用户对所述语音播报序列进行了反馈，并未发生用户静音超时，进而计算所述下一语音播报序列对应的第二语音播报总时长，以继续进行语音播报，直至通话结束；若在到达所述预估播报终止时间戳之前未生成所述下一语音播报序列，则证明用户未在规定时间内对所述语音播报序列进行反馈，所以判定发生用户超时静音。
107.本技术实施例提供一种用户超时静音判别方法，也即获取所述语音播报序列对应的播报起始时间戳，并依据所述第一语音播报总时长和所述播报起始时间戳，计算预估播报终止时间戳，进而依据所述预估播报终止时间戳以及确定是否生成下一播报序列，判别是否发生用户超时静音，也即，其中，所述下一播报序列根据用户对于语音播报序列的反馈进行匹配生成，进而实现了用户对于语音播报序列的反馈时间点，动态判别是否发生用户超时静音的目的，而非设置一个固定的语音播报时长判别是否发生语音超时静音，可避免依据固定的语音播报时长来判别是否发生用户超时静音，克服了对于较为复杂的通话场景，仅仅通过一个固定的语音播报时长判别是否发生用户超时静音的准确度较低的技术缺陷，提升了判别是否发生用户超时静音的准确度。
108.参照图4，图4是本技术实施例方案涉及的硬件运行环境的设备结构示意图。
109.如图4所示，该用户超时静音判别设备可以包括：处理器1001，例如cpu，存储器1005，通信总线1002。其中，通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速ram存储器，也可以是稳定的存储器(non
‑
volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
110.可选地，该用户超时静音判别设备还可以包括矩形用户接口、网络接口、摄像头、rf(radio frequency，射频)电路，传感器、音频电路、wifi模块等等。矩形用户接口可以包括显示屏(display)、输入子模块比如键盘(keyboard)，可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如wi
‑
fi接口)。
111.本领域技术人员可以理解，图4中示出的用户超时静音判别设备结构并不构成对用户超时静音判别设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。
112.如图4所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及用户超时静音判别程序。操作系统是管理和控制用户超时静音判别设备硬件和软件资源的程序，支持用户超时静音判别程序以及其它软件和/或，程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信，以及与用户超时静音判别系统中其它硬
件和软件之间通信。
113.在图4所示的用户超时静音判别设备中，处理器1001用于执行存储器1005中存储的用户超时静音判别程序，实现上述任一项所述的用户超时静音判别方法的步骤。
114.本技术用户超时静音判别设备具体实施方式与上述用户超时静音判别方法各实施例基本相同，在此不再赘述。
115.本技术实施例还提供一种用户超时静音判别装置，所述用户超时静音判别装置应用于用户超时静音判别设备，所述用户超时静音判别装置包括：
116.第一计算模块，用于获取目标通话场景中的语音播报序列，并计算所述语音播报序列对应的语音序列播报时长；
117.第二计算模块，用于获取所述目标通话场景对应的语音播报完毕等待时长以及预设网络传输延时，并依据所述语音播报完毕等待时长、所述语音序列播报时长以及所述预设网络传输延时，计算第一语音播报总时长；
118.判别模块，用于依据所述第一语音播报总时长，判别是否发生用户超时静音。
119.可选地，所述判别模块还用于：
120.获取所述语音播报序列对应的播报起始时间戳，并依据所述第一语音播报总时长和所述播报起始时间戳，计算预估播报终止时间戳；
121.依据所述预估播报终止时间戳，通过检测是否生成下一语音播报序列，判别是否发生用户超时静音。
122.可选地，所述判别模块还用于：
123.开始播报所述语音播报序列，采集所述语音播报序列对应的实际播报完毕时间戳；
124.依据所述实际播报完毕时间戳以及所述预估播报终止时间戳，通过检测是否生成所述下一语音播报序列，判别是否发生用户超时静音。
125.可选地，所述判别模块还用于：
126.将所述实际播报完毕时间戳与所述预估播报终止时间戳进行比对，若所述实际播报完毕时间戳小于所述播报终止时间戳，则检测在到达所述预估播报终止时间戳之前是否生成所述下一语音播报序列；
127.若在到达所述预估播报终止时间戳之前已生成所述下一语音播报序列，则计算所述下一语音播报序列对应的第二语音播报总时长，以继续进行语音播报；
128.若在到达所述预估播报终止时间戳之前未生成所述下一语音播报序列，则判定发生用户超时静音。
129.可选地，所述判别模块还用于：
130.若检测到在所述语音播报序列播报完毕之前生成下一语音播报序列，则计算所述下一语音播报序列对应的第二语音播报总时长；
131.依据所述第一语音播报总时长、所述第二语音播报总时长以及所述播报起始时间戳，更新所述预估播报终止时间戳；
132.依据更新后的预估播报终止时间戳与所述实际播报完毕时间戳，判别是否发生用户超时静音；
133.若未检测到在所述语音播报序列播报完毕之前生成下一语音播报序列，则执行步
骤：采集所述语音播报序列对应的实际播报完毕时间戳。
134.可选地，所述用户超时静音判别装置还用于：
135.获取所述语音播报序列对应的播报对象信息以及对应的通话场景信息；
136.依据所述播报对象信息与所述通话场景信息，预测播报对象在所述语音播报序列播报结束后的目标等待时长，得到所述语音播报完毕等待时长。
137.本技术用户超时静音判别装置的具体实施方式与上述用户超时静音判别方法各实施例基本相同，在此不再赘述。
138.本技术实施例提供了一种介质，所述介质为可读存储介质，且所述可读存储介质存储有一个或者一个以上程序，所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的用户超时静音判别方法的步骤。
139.本技术可读存储介质具体实施方式与上述用户超时静音判别方法各实施例基本相同，在此不再赘述。
140.本技术实施例提供了一种计算机程序产品，且所述计算机程序产品包括有一个或者一个以上计算机程序，所述一个或者一个以上计算机程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的用户超时静音判别方法的步骤。
141.本技术计算机程序产品具体实施方式与上述用户超时静音判别方法各实施例基本相同，在此不再赘述。
142.以上仅为本技术的优选实施例，并非因此限制本技术的专利范围，凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本技术的专利处理范围内。