← 返回列表

一种语音数据处理方法、装置、设备及介质

申请号: CN201811628970.0
申请人: 北京猎户星空科技有限公司
申请日期: 2018年12月28日

摘要文本

本发明实施例公开了一种语音数据处理方法、装置、设备及介质,用以减少所需的目标发音人的语音训练数据,降低语音合成的工作量、周期和成本。所述语音数据处理方法,包括:获取多个发音人的语音训练数据和目标发音人的语音训练数据,所述目标发音人的语音训练数据的数量远小于所述多个发音人的语音训练数据总数量;基于所述多个发音人的语音训练数据和所述目标发音人的语音训练数据,训练生成用于合成所述目标发音人语音的初级语音合成模型;根据预先配置的文本语料,利用所述初级语音合成模型,得到所述目标发音人用于语音合成的语料数据。

专利详细信息

项目 内容
专利名称 一种语音数据处理方法、装置、设备及介质
专利类型 发明授权
申请号 CN201811628970.0
申请日 2018年12月28日
公告号 CN111383627B
公开日 2024年3月22日
IPC主分类号 G10L13/04
权利人 北京猎户星空科技有限公司
发明人 杨鹏; 孙子涵; 邱家洪
地址 北京市朝阳区姚家园南路一号惠通时代广场8号

专利主权项内容

1.一种语音数据处理方法,其特征在于,包括:获取多个发音人的语音训练数据和目标发音人的语音训练数据,所述目标发音人的语音训练数据的数量远小于所述多个发音人的语音训练数据总数量;基于所述多个发音人的语音训练数据和所述目标发音人的语音训练数据,训练生成用于合成所述目标发音人语音的初级语音合成模型;根据预先配置的文本语料,利用所述初级语音合成模型,得到所述目标发音人用于语音合成的语料数据;所述根据预先配置的文本语料,利用所述初级语音合成模型,得到所述目标发音人用于语音合成的语料数据,包括:将预先配置的文本语料输入至所述初级语音合成模型,得到所述文本语料对应的语音合成数据;从所述语音合成数据中,筛选出符合预设要求的语音合成数据,并确定为所述目标发音人的语料数据;所述方法还包括:从所述语料数据中提取语音片段,利用提取出的语音片段组成用于拼接合成所述目标发音人语音的语音库,所述语音库中包含所述目标发音人的声学片段;在基于获得的输入文本合成所述目标发音人的语料数据时,对获得的输入文本进行处理,得到所述输入文本对应的声学参数;根据所述声学参数,从所述语音库中选取对应的声学片段进行拼接合成,得到与所述输入文本对应的目标发音人的语音数据。 详见官网: