音频切割方法、系统、存储介质以及计算机设备与流程

1.本发明涉及音频处理技术领域，尤其涉及一种音频切割方法、系统、存储介质以及计算机设备。

背景技术：

2.手机或者带屏音箱等终端设备在asr(语音识别技术)的识别过程中，一般而言会在屏幕同步出现识别结果。如说“今晚去”，则屏幕也会同步一般约缓个几十ms出现“今晚去”的文字识别结果。
3.为了实现这种同步显示的效果，现有技术中采用了不同的asr方案，然而多数的asr方案都存在以下的缺陷：
4.1、单纯把在手机或者带屏音箱等终端设备收集到的语音音频根据一定的大小，单纯的将语音音频切割成几十份或者几百份。这么做的问题是需要asr的云端服务器进行同样几十次甚至几百次的计算耗费服务器成本，另外一方面，asr频繁进行分析，很可能导致nlp、tts出现问题，如tts容易出现电流声等。
5.2、预定使用少量的切割次数，然而这种不精细的切割也可能导致音频上传速度慢，语音与屏幕显示同步不及时的问题。
6.很显然，过往单纯的以特定经验进行asr的识别的可适应差、容易出现问题。
7.综上所述，现有技术在实际使用上显然存在不便与缺陷，所以有必要加以改进。

技术实现要素：

8.针对上述的缺陷，本发明的目的在于提供一种音频切割方法、系统、存储介质以及计算机设备，提高音频切割的准确率。
9.为了实现上述目的，本发明提供了一种音频切割方法，包括：
10.实时采集第一音频信息；
11.将所述第一音频信息翻译为第一文字信息；
12.根据所述第一文字信息预测所述第一音频信息的后续的音频信息，获得第二音频信息；
13.根据所述第二音频信息进行音频切割规划；
14.按照所述音频切割规划对实时采集的所述第一音频信息的后续的音频信息进行音频切割。
15.根据所述的音频切割方法，根据所述第一文字信息预测所述第一音频信息的后续的音频信息，获得第二音频信息的步骤包括：
16.根据所述第一文字信息预测所述第一音频信息的后续的音频信息对应的第二文字信息；
17.根据所述第一文字信息以及所述第二文字信息预测所述第一音频信息的后续的音频信息对应的语速信息；所述第二音频信息包括所述第二文字信息以及所述语速信息。
18.根据所述的音频切割方法，根据所述第一文字信息预测所述第一音频信息的后续的音频信息，获得第二音频信息的步骤还包括：
19.根据所述第一文字信息以及所述第二文字信息分析文字之间的停顿，获取停顿信息；所述第二音频信息包括所述第二文字信息、所述语速信息以及停顿信息。
20.根据所述的音频切割方法，所述根据所述第二音频信息进行音频切割规划的步骤包括：
21.根据所述第二文字信息、语速信息以及停顿信息判断所述第二音频信息的大小，根据所述第二音频信息的大小计算音频切割的次数。
22.根据所述的音频切割方法，所述按照所述音频切割规划对实时采集的所述第一音频信息的后续的音频信息进行音频切割的步骤包括：
23.按照所述音频切割次数对实时采集的所述第一音频信息的后续的音频信息进行音频切割。
24.根据所述的音频切割方法，将所述第一音频信息翻译为第一文字信息的步骤包括：
25.通过语音识别技术将所述第一音频信息翻译为第一文字信息。
26.根据所述的音频切割方法，所述根据所述第一文字信息预测所述第一音频信息的后续的音频信息对应的第二文字信息的步骤包括：
27.通过自然语言理解技术根据所述第一文字信息预测所述第一音频信息的后续的音频信息对应的第二文字信息。
28.为了实现上述目的，本发明还提供了一种音频切割系统，包括：
29.第一音频信息采集模块，用于实时采集第一音频信息；
30.第一语音识别模块，用于将所述第一音频信息翻译为第一文字信息；
31.第二音频信息获取模块，用于根据所述第一文字信息预测所述第一音频信息的后续的音频信息，获得第二音频信息；
32.切割规划模块，用于根据所述第二音频信息进行音频切割规划；
33.音频切割模块，用于按照所述音频切割规划对实时采集的所述第一音频信息的后续的音频信息进行音频切割。
34.为了实现上述目的，本发明提供了一种存储介质，用于存储一种用于执行上述任意一种音频切割方法的计算机程序。
35.为了实现上述目的，本发明提供了一种计算机设备，包括存储介质、处理器以及存储在所述存储介质上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述的音频切割方法。
36.本发明通过对实时采集的第一音频信息的后续的音频信息进行预测，预测的后续的音频信息为第二音频信息，按照对所述第二音频信息进行音频切割的音频切割规划对实时采集的所述第一音频信息的后续的音频信息进行音频切割。具体的是，实时采集第一音频信息；将所述第一音频信息翻译为第一文字信息；根据所述第一文字信息预测所述第一音频信息的后续的音频信息，获得第二音频信息；根据所述第二音频信息进行音频切割规划；按照所述音频切割规划对实时采集的所述第一音频信息的后续的音频信息进行音频切割。借此，本发明可以提高音频切割的准确率。
附图说明
37.图1是本发明优选实施例的音频切割系统的示意图；
38.图2是本发明优选实施例的音频切割系统的示意图；
39.图3是本发明优选实施例的音频切割方法的流程图；
40.图4是本发明提供的计算机设备的结构示意图。
具体实施方式
41.为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
42.需要说明的，本说明书中针对“一个实施例”、“实施例”、“示例实施例”等的引用，指的是描述的该实施例可包括特定的特征、结构或特性，但是不是每个实施例必须包含这些特定特征、结构或特性。此外，这样的表述并非指的是同一个实施例。进一步，在结合实施例描述特定的特征、结构或特性时，不管有没有明确的描述，已经表明将这样的特征、结构或特性结合到其它实施例中是在本领域技术人员的知识范围内的。
43.此外，在说明书及后续的权利要求当中使用了某些词汇来指称特定组件或部件，所属领域中具有通常知识者应可理解，制造商可以用不同的名词或术语来称呼同一个组件或部件。本说明书及后续的权利要求并不以名称的差异来作为区分组件或部件的方式，而是以组件或部件在功能上的差异来作为区分的准则。在通篇说明书及后续的权利要求书中所提及的“包括”和“包含”为一开放式的用语，故应解释成“包含但不限定于”。以外，“连接”一词在此系包含任何直接及间接的电性连接手段。间接的电性连接手段包括通过其它装置进行连接。
44.参见图1～图2，在本发明的第一实施例中提供了音频切割系统100，包括：
45.第一音频信息采集模块10，用于实时采集第一音频信息；
46.第一语音识别模块20，用于将所述第一音频信息翻译为第一文字信息；
47.第二音频信息获取模块30，用于根据所述第一文字信息预测所述第一音频信息的后续的音频信息，获得第二音频信息；
48.切割规划模块40，用于根据所述第二音频信息进行音频切割规划；
49.音频切割模块50，用于按照所述音频切割规划对实时采集的所述第一音频信息的后续的音频信息进行音频切割。
50.在该实施例中，由于现有技术在需要将音频信息进行asr(语音识别技术)时，只是单纯地将终端设备采集到的音频信息单纯地切割成预定的份数，对于具体的音频信息没有针对性，所述预定的份数过大时，asr对每份音频信息频繁地进行分析，将增加asr服务器的成本，所述预定的份数过小则导致音频上传速度慢，语音与终端设备的文字显示不同步的问题。为了解决上述技术问题，本实施例中，将asr的识别过程中介入对用户即将要说的话进行预测，从而预测所述用户即将要说的话对应的音频信息的大小，从而提前进行音频切割规划。具体的是，实时采集第一音频信息，可以通过手机或者带屏音箱等终端设备进行采集；将采集到的所述第一音频信息翻译为第一文字信息，优选的是，所述第一语音识别模块20通过语音识别技术将所述第一音频信息翻译为第一文字信息，获取到所述第一文字信息
后介入预测过程，即根据所述第一文字信息预测所述第一音频信息的后续的音频信息(即对用户即将要说的话进行预测)，获得第二音频信息；根据所述第二音频信息进行音频切割规划；当实时采集到所述第一音频信息的后续的音频信息时即可按照所述音频切割规划进行音频切割。由此，可以针对具体的音频信息进行音频切割，使得音频切割有序合理，提高音频切割的准确率。
51.在本发明的第二实施例中，所述第二音频信息获取模块30包括：
52.第二文字信息获取模块31，用于根据所述第一文字信息预测所述第一音频信息的后续的音频信息对应的第二文字信息；
53.语速信息获取模块32，用于根据所述第一文字信息以及所述第二文字信息预测所述第一音频信息的后续的音频信息对应的语速信息；所述第二音频信息包括所述第二文字信息以及所述语速信息。
54.在该实施例中，语速是影响对应的音频信息的大小的重要因素，音频信息的大小可以影响音频切割规划。
55.在本发明的第三实施例中，所述第二音频信息获取模块30还包括：
56.停顿信息获取模块33，用于根据所述第一文字信息以及所述第二文字信息分析文字之间的停顿，获取停顿信息；所述第二音频信息包括所述第二文字信息、所述语速信息以及停顿信息。
57.在该实施例中，由于人们的思维并不是连续不断的，在具体的场景中特别容易出现卡壳的情况，导致在对话时可能存在停顿的情况，且在复杂的汉语或者多语言场景中也可能存在着微小的断词、分词的差异，停顿时间越长，则音频越长，从而使得对应的音频信息的大小则越大，因此需要获取字与字之间的停顿时长。
58.在本发明的第四实施例中，所述切割规划模块40包括：
59.切割次数获取模块41，用于根据所述第二文字信息、语速信息以及停顿信息判断所述第二音频信息的大小，根据所述第二音频信息的大小计算音频切割的次数。
60.在该实施例中，通过判断所述第二音频信息的大小来确定音频切割的次数。
61.在本发明的第五实施例中，所述音频切割模块50包括：
62.音频切割子模块51，用于按照所述音频切割次数对实时采集的所述第一音频信息的后续的音频信息进行音频切割。
63.在该实施例中，实时采集的所述第一音频信息的后续的音频信息，为真实的第一音频信息的后续输入的音频信息，而第二音频信息为预测的第一音频信息的后续输入的音频信息，通过介入预测过程，获得预测的第二音频信息，并根据所述第二音频信息的大小计算音频切割的次数，由此，可以按照所述音频的切割次数对实时采集的所述第一音频信息的后续的音频信息进行音频切割，具有针对性，不是单纯地分配切割次数，从而提高音频切割的准确率。
64.在本发明的第六实施例，所述第二文字信息获取模块31包括：
65.自然语言理解模块311，用于通过自然语言理解技术根据所述第一文字信息预测所述第一音频信息的后续的音频信息对应的第二文字信息。
66.具体的是，所述自然语言理解模块311通过所述自然语言理解技术根据隐马尔可夫模型预测所述第一文字信息中的后续的文字信息，计算每个所述文字信息的出现概率，
选取所述出现概率最大的文字信息为第二文字信息。
67.在本发明的第七实施例中，还包括：
68.第二语音识别模块60，用于将所述进行音频切割后的每段所述实时采集的所述第一音频信息的后续的音频信息分别进行语音识别。
69.在该实施例中，对音频进行合理切割，每切割一段音频信息则上传到asr服务器进行语音识别，转换为文字信息，可以实现在用户输入音频信息时，几乎同步出现根据所述音频信息转换的文字信息，并且切割次数合理减少asr服务器的成本。
70.图3是本发明实施例的音频切割方法的流程图，所述方法可以通过上述任一项所述的系统100实现，所述音频切割方法，包括：
71.步骤s301，实时采集第一音频信息；通过第一音频信息采集模块10实现；
72.步骤s302，将所述第一音频信息翻译为第一文字信息；通过第一语音识别模块20实现；
73.步骤s303，根据所述第一文字信息预测所述第一音频信息的后续的音频信息，获得第二音频信息；通过第二音频信息获取模块30实现；
74.步骤s304，根据所述第二音频信息进行音频切割规划；通过切割规划模块40实现；
75.步骤s305，按照所述音频切割规划对实时采集的所述第一音频信息的后续的音频信息进行音频切割；通过音频切割模块50实现。
76.在该实施例中，所述方法可以通过上述任一项所述的系统100实现，具体实施过程参见上述描述，在此不再赘述。
77.在本发明的一个实施例中，所述步骤s303包括：
78.根据所述第一文字信息预测所述第一音频信息的后续的音频信息对应的第二文字信息；通过第二文字信息获取模块31实现；
79.根据所述第一文字信息以及所述第二文字信息预测所述第一音频信息的后续的音频信息对应的语速信息；所述第二音频信息包括所述第二文字信息以及所述语速信息；通过语速信息获取模块32实现。
80.在本发明的一个实施例中，所述步骤s303还包括：
81.根据所述第一文字信息以及所述第二文字信息分析文字之间的停顿，获取停顿信息；所述第二音频信息包括所述第二文字信息、所述语速信息以及停顿信息；通过停顿信息获取模块33实现。
82.在本发明的一个实施例中，所述步骤s304包括：
83.根据所述第二文字信息、语速信息以及停顿信息判断所述第二音频信息的大小，根据所述第二音频信息的大小计算音频切割的次数；通过切割次数获取模块41实现。
84.在本发明的一个实施例中，所述步骤s305包括：
85.按照所述音频切割次数对实时采集的所述第一音频信息的后续的音频信息进行音频切割，通过音频切割子模块51实现。
86.在本发明的一个实施例中，所述步骤s302包括：
87.通过语音识别技术将所述第一音频信息翻译为第一文字信息；通过第一语音识别模块20实现。
88.在本发明的一个实施例中，所述步骤s303包括：
89.通过自然语言理解技术根据所述第一文字信息预测所述第一音频信息的后续的音频信息对应的第二文字信息，通过自然语言理解模块311实现。
90.在本发明的一个实施例中，所述通过自然语言理解技术根据所述第一文字信息预测所述第一音频信息的后续的音频信息对应的第二文字信息的步骤包括：
91.通过所述自然语言理解技术根据隐马尔可夫模型预测所述第一文字信息中的后续的文字信息，计算每个所述文字信息的出现概率，选取所述出现概率最大的文字信息为第二文字信息；通过自然语言理解模块311实现。
92.在本发明的一个实施例中，所述步骤s305之后还包括：
93.将所述进行音频切割后的每段所述实时采集的所述第一音频信息的后续的音频信息分别进行语音识别；通过第二语音识别模块60实现。
94.音频切割方法的具体实施过程举例：
95.用户开始输入音频信息，终端设备采集到所述音频信息被唤醒，并且自动地对用户输入的音频信息中说出的第一个字进行切割；
96.将包含上述第一个字的第一音频信息上传到asr进行识别，将所述第一音频信息翻译为第一文字信息，并将所述第一文字信息反馈至nlp语义理解引擎(自然语言理解模块311)，所述nlp(natural language processing，自然语言处理)语义理解引擎根据已有的语言模型、hmm(隐马尔可夫模型)等进行分析预测所述用户在说完第一个字之后的第二个字是什么，选取概率最大的文字；如所述用户准备要说“现在多少点”，此时终端设备先对第一个字“现”的音频进行收集，获取到所述第一音频信息，并将其反馈到asr识别，接着将识别结果(即第一文字信息)反馈至nlp进行预测过程，nlp分析后预测出“现”后面搭配为“在”的出现概率为80％，搭配“你”的出现概率为11％，则认为第二个字为“在”，以此类推，预测所述用户准备要说的第三个字、第四个字，从而获得第二文字信息；
97.分析“现”与“在”之间的语速，获得语速信息，以及通过分析“现”与“在”的语言结构判断是否容易出现停顿，获得停顿信息；
98.根据所述第二文字信息、语速信息以及停顿信息判断所述第二音频信息的大小，根据所述第二音频信息的大小计算音频切割的次数；
99.继续采集所述用户输入的音频信息，即采集“现”字后续的音频信息，并将所述后续的音频信息按照所述音频切割的次数进行切割。
100.当然，用户开始输入音频信息，终端设备采集到所述音频信息被唤醒，不一定是对用户输入的音频信息中说出的第一个字进行切割；可能是第二个字，也可能是第三个字等，例如当用户说完第二个字进行切割，在预测过程中，所述nlp语义理解引擎根据已有的语言模型、hmm(隐马尔可夫模型)等同步结合第一个字和第二个字、上下文、及语速、语言结构等等综合情况去推测第三个字是什么及可能对应的音频大小，以此类推。
101.本发明还提供一种存储介质，用于存储一种用于执行上述任意一种任务调度方法的计算机程序。例如计算机程序指令，当其被计算机执行时，通过该计算机的操作，可以调用或提供根据本技术的方法和/或技术方案。而调用本技术的方法的程序指令，可能被存储在固定的或可移动的存储介质中，和/或通过广播或其他信号承载媒体中的数据流而被传输和/或被存储在根据程序指令运行的计算机设备的存储介质中。在此，根据本技术的一个实施例中，包括一个如图4所示的计算机设备400，所述计算机设备400优选包括用于存储计
算机程序的存储介质200和用于执行计算机程序的处理器300，其中，当该计算机程序被该处理器300执行时，触发该计算机设备400执行基于前述多个实施例中的方法和/或技术方案。
102.需要注意的是，本技术可在软件和/或软件与硬件的组合体中被实施，例如，可采用专用集成电路(asic)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中，本技术的软件程序可以通过处理器执行以实现上文步骤或功能。同样地，本技术的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，ram存储器，磁或光驱动器或软磁盘及类似设备。另外，本技术的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。
103.根据本发明的方法可以作为计算机实现方法在计算机上实现、或者在专用硬件中实现、或以两者的组合的方式实现。用于根据本发明的方法的可执行代码或其部分可以存储在计算机程序产品上。计算机程序产品的示例包括存储器设备、光学存储设备、集成电路、服务器、在线软件等。优选地，计算机程序产品包括存储在计算机可读介质上以便当所述程序产品在计算机上执行时执行根据本发明的方法的非临时程序代码部件。
104.在优选实施例中，计算机程序包括适合于当计算机程序在计算机上运行时执行根据本发明的方法的所有步骤的计算机程序代码部件。优选地，在计算机可读介质上体现计算机程序。
105.综上所述，本发明通过对实时采集的第一音频信息的后续的音频信息进行预测，预测的后续的音频信息为第二音频信息，按照对所述第二音频信息进行音频切割的音频切割规划对实时采集的所述第一音频信息的后续的音频信息进行音频切割。具体的是，实时采集第一音频信息；将所述第一音频信息翻译为第一文字信息；根据所述第一文字信息预测所述第一音频信息的后续的音频信息，获得第二音频信息；根据所述第二音频信息进行音频切割规划；按照所述音频切割规划对实时采集的所述第一音频信息的后续的音频信息进行音频切割。借此，本发明可以提高音频切割的准确率。
106.当然，本发明还可有其它多种实施例，在不背离本发明精神及其实质的情况下，熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
107.本发明还公开了：a1一种音频切割方法，包括：
108.实时采集第一音频信息；
109.将所述第一音频信息翻译为第一文字信息；
110.根据所述第一文字信息预测所述第一音频信息的后续的音频信息，获得第二音频信息；
111.根据所述第二音频信息进行音频切割规划；
112.按照所述音频切割规划对实时采集的所述第一音频信息的后续的音频信息进行音频切割。
113.a2、根据a1所述的音频切割方法，根据所述第一文字信息预测所述第一音频信息的后续的音频信息，获得第二音频信息的步骤包括：
114.根据所述第一文字信息预测所述第一音频信息的后续的音频信息对应的第二文字信息；
115.根据所述第一文字信息以及所述第二文字信息预测所述第一音频信息的后续的音频信息对应的语速信息；所述第二音频信息包括所述第二文字信息以及所述语速信息。
116.a3、根据a2所述的音频切割方法，根据所述第一文字信息预测所述第一音频信息的后续的音频信息，获得第二音频信息的步骤还包括：
117.根据所述第一文字信息以及所述第二文字信息分析文字之间的停顿，获取停顿信息；所述第二音频信息包括所述第二文字信息、所述语速信息以及停顿信息。
118.a4、根据a3所述的音频切割方法，所述根据所述第二音频信息进行音频切割规划的步骤包括：
119.根据所述第二文字信息、语速信息以及停顿信息判断所述第二音频信息的大小，根据所述第二音频信息的大小计算音频切割的次数。
120.a5、根据a4所述的音频切割方法，所述按照所述音频切割规划对实时采集的所述第一音频信息的后续的音频信息进行音频切割的步骤包括：
121.按照所述音频切割次数对实时采集的所述第一音频信息的后续的音频信息进行音频切割。
122.a6、根据a1所述的音频切割方法，将所述第一音频信息翻译为第一文字信息的步骤包括：
123.通过语音识别技术将所述第一音频信息翻译为第一文字信息。
124.a7、根据a2所述的音频切割方法，所述根据所述第一文字信息预测所述第一音频信息的后续的音频信息对应的第二文字信息的步骤包括：
125.通过自然语言理解技术根据所述第一文字信息预测所述第一音频信息的后续的音频信息对应的第二文字信息。
126.a8、根据a7所述的音频切割方法，所述通过自然语言理解技术根据所述第一文字信息预测所述第一音频信息的后续的音频信息对应的第二文字信息的步骤包括：
127.通过所述自然语言理解技术根据隐马尔可夫模型预测所述第一文字信息中的后续的文字信息，计算每个所述文字信息的出现概率，选取所述出现概率最大的文字信息为第二文字信息。
128.a9、根据a1所述的音频切割方法，所述按照所述音频切割规划对实时采集的所述第一音频信息的后续的音频信息进行音频切割的步骤之后还包括：
129.将所述进行音频切割后的每段所述实时采集的所述第一音频信息的后续的音频信息分别进行语音识别。
130.b10、一种音频切割系统，包括：
131.第一音频信息采集模块，用于实时采集第一音频信息；
132.第一语音识别模块，用于将所述第一音频信息翻译为第一文字信息；
133.第二音频信息获取模块，用于根据所述第一文字信息预测所述第一音频信息的后续的音频信息，获得第二音频信息；
134.切割规划模块，用于根据所述第二音频信息进行音频切割规划；
135.音频切割模块，用于按照所述音频切割规划对实时采集的所述第一音频信息的后续的音频信息进行音频切割。
136.b11、根据b10所述的音频切割系统，所述第二音频信息获取模块包括：
137.第二文字信息获取模块，用于根据所述第一文字信息预测所述第一音频信息的后续的音频信息对应的第二文字信息；
138.语速信息获取模块，用于根据所述第一文字信息以及所述第二文字信息预测所述第一音频信息的后续的音频信息对应的语速信息；所述第二音频信息包括所述第二文字信息以及所述语速信息。
139.b12、根据b11所述的音频切割系统，所述第二音频信息获取模块还包括：
140.停顿信息获取模块，用于根据所述第一文字信息以及所述第二文字信息分析文字之间的停顿，获取停顿信息；所述第二音频信息包括所述第二文字信息、所述语速信息以及停顿信息。
141.b13、根据b12所述的音频切割系统，所述切割规划模块包括：
142.切割次数获取模块，用于根据所述第二文字信息、语速信息以及停顿信息判断所述第二音频信息的大小，根据所述第二音频信息的大小计算音频切割的次数。
143.b14、根据b13所述的音频切割系统，所述音频切割模块包括：
144.音频切割子模块，用于按照所述音频切割次数对实时采集的所述第一音频信息的后续的音频信息进行音频切割。
145.b15、根据b10所述的音频切割系统，所述第一语音识别模块通过语音识别技术将所述第一音频信息翻译为第一文字信息。
146.b16、根据b11所述的音频切割系统，所述第二文字信息获取模块包括：
147.自然语言理解模块，用于通过自然语言理解技术根据所述第一文字信息预测所述第一音频信息的后续的音频信息对应的第二文字信息。
148.b17、根据b16所述的音频切割系统，所述自然语言理解模块通过所述自然语言理解技术根据隐马尔可夫模型预测所述第一文字信息中的后续的文字信息，计算每个所述文字信息的出现概率，选取所述出现概率最大的文字信息为第二文字信息。
149.b18、根据b10所述的音频切割系统，还包括：
150.第二语音识别模块，用于将所述进行音频切割后的每段所述实时采集的所述第一音频信息的后续的音频信息分别进行语音识别。
151.c19、一种存储介质，用于存储一种用于执行a1～a9中任意一种音频切割方法的计算机程序。
152.d20、一种计算机设备，包括存储介质、处理器以及存储在所述存储介质上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现a1～a9任一项所述的音频切割方法。