← 返回列表
一种检测语音翻译系统中不流畅现象的方法及系统
摘要文本
本发明实施例提供的一种检测语音翻译系统中不流畅现象的方法及系统,通过训练的不流畅检测模型对待检测的源文本数据中的不流畅现象进行标注,从语义层面将不流畅的文本数据转换为更适合书面表达的流畅的目标文本数据,以使其更符合书面语的表达习惯,更方便下游机器翻译任务的处理。。来自:www.macrodatas.cn
申请人信息
- 申请人:北京紫冬认知科技有限公司
- 申请人地址:100190 北京市海淀区中关村南三街6号5层52513号
- 发明人: 北京紫冬认知科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种检测语音翻译系统中不流畅现象的方法及系统 |
| 专利类型 | 发明授权 |
| 申请号 | CN201810949635.4 |
| 申请日 | 2018年8月20日 |
| 公告号 | CN110858268B |
| 公开日 | 2024年3月8日 |
| IPC主分类号 | G06F40/205 |
| 权利人 | 北京紫冬认知科技有限公司 |
| 发明人 | 王峰 |
| 地址 | 北京市海淀区中关村南三街6号5层52513号 |
专利主权项内容
1.一种检测语音翻译系统中不流畅现象的方法,其特征在于,所述方法包括:获取待检测的源文本数据;对所述源文本数据进行预处理及向量化处理,得到每句源文本数据的词向量序列,其中,所述预处理包括:对所述源文本数据按字切分,提取所述源文本数据的二元语法及三元语法特征,根据所述源文本数据对应的语音信号提取韵律特征;将所述源文本数据的词向量序列输入预先训练好的不流畅检测模型,得到不流畅检测模型的输出结果;根据所述不流畅检测模型的输出结果,得到所述源文本数据对应的流畅目标文本数据和不流畅标注结果。 马 克 数 据 网