← 返回列表

一种基于大语言模型的车载数据语音标签系统

申请号: CN202311754382.2
申请人: 知迪汽车技术(北京)有限公司
申请日期: 2023/12/19

摘要文本

本发明涉及一种基于大语言模型的车载数据语音标签系统,尤其涉及汽车数据处理技术领域,包括数据记录模块,用以对车辆的路测数据进行采集;语音记录模块,用以对语音记录的开启进行判断,并对语音记录开启的判断过程进行修正,还用以对记录后的语音进行预处理和存储;语音处理模块,用以通过LLM大语言模型对已存储的语音进行标签识别并设置索引;数据上传模块,用以将语音识别后的语音进行切片处理并上传至云端进行分类存储;反馈训练模块,用以根据对LLM大语言模型进行训练,并对语音处理的有效性进行反馈,还用以对反馈过程进行补偿。本发明提高了车载数据的语音标签效率。

专利详细信息

项目 内容
专利名称 一种基于大语言模型的车载数据语音标签系统
专利类型 发明申请
申请号 CN202311754382.2
申请日 2023/12/19
公告号 CN117763194A
公开日 2024/3/26
IPC主分类号 G06F16/65
权利人 知迪汽车技术(北京)有限公司
发明人 王世禄; 吴行健; 陈志航; 朱晓诚
地址 北京市朝阳区建国路86号院1号楼8层01

专利主权项内容

1.一种基于大语言模型的车载数据语音标签系统,其特征在于,包括:数据记录模块,用以对车辆的路测数据进行采集;语音记录模块,用以根据环境音量对语音记录的开启进行判断,并根据用户记录按钮对语音记录开启的判断过程进行修正,还用以对记录后的语音进行预处理和存储;语音处理模块,用以通过LLM大语言模型对已存储的语音进行标签识别,还用以对识别成功的语音设置索引;数据上传模块,用以将语音识别后的语音进行切片处理并上传至云端进行分类存储,还用以对云端中识别失败的语音和识别错误的语音校正索引并存储于云端的语音训练集中;反馈训练模块,用以根据训练时间对LLM大语言模型进行训练,还用以计算失效率,并根据失效率对语音处理的有效性进行反馈,还用以对语音处理效率进行判断,并根据判断结果对反馈过程进行补偿。