← 返回列表

一种过滤无效语音识别数据的方法和系统

申请号: CN202311449861.3
申请人: 北京云上曲率科技有限公司
申请日期: 2023/11/2

摘要文本

本申请公开了一种过滤无效语音识别数据的方法和系统,所述方法包括:接收所要识别的音频数据;判断音频数据是否为静音或噪音,若是,则不识别所述音频数据,输出音频数据为无效语音的判断结果;评价音频数据中的人声质量,判断音频数据的人声质量是否低,若是,则不识别音频数据,输出音频数据为无效语音的判断结果;判断音频数据中是否为音乐,若是,则不识别音频数据,输出音频数据为无效语音的判断结果;判断音频数据是否是目标语种,若否,则不识别述音频数据,输出音频数据为无效语音的判断结果;通过本申请方法,能够大大提升对质量较差的音频的过滤效果,避免了输入音频较差,对输入音频进行错误识别造成资源浪费的问题。

专利详细信息

项目 内容
专利名称 一种过滤无效语音识别数据的方法和系统
专利类型 发明申请
申请号 CN202311449861.3
申请日 2023/11/2
公告号 CN117457016A
公开日 2024/1/26
IPC主分类号 G10L21/0208
权利人 北京云上曲率科技有限公司
发明人 郑大川; 陈振标; 杜晓祥
地址 北京市海淀区科学院南路2号1号楼9层913

专利主权项内容

1.一种过滤无效语音识别数据的方法,其特征在于,所述方法包括:接收所要识别的音频数据;判断所述音频数据是否为静音或短时噪音,若是,则不识别所述音频数据,输出所述音频数据为无效语音的判断结果;评价所述音频数据中的人声质量,判断所述音频数据的人声质量是否低,若是,则不识别所述音频数据,输出所述音频数据为无效语音的判断结果;判断所述音频数据中是否为音乐,若是,则不识别所述音频数据,输出所述音频数据为无效语音的判断结果;判断所述音频数据是否是目标语种,若否,则不识别所述音频数据,输出所述音频数据为无效语音的判断结果;若判断出所述音频数据不是静音、噪音、音乐、人声质量过低和非目标语种的情况下,对所述音频数据进行识别,返回所述音频数据的文字识别结果。。关注微信公众号马克数据网