一种基于大语言模型的车载数据语音标签系统

申请号: CN202311754382.2

申请人: 知迪汽车技术(北京)有限公司

申请日期: 2023/12/19

摘要文本

本发明涉及一种基于大语言模型的车载数据语音标签系统，尤其涉及汽车数据处理技术领域，包括数据记录模块，用以对车辆的路测数据进行采集；语音记录模块，用以对语音记录的开启进行判断，并对语音记录开启的判断过程进行修正，还用以对记录后的语音进行预处理和存储；语音处理模块，用以通过LLM大语言模型对已存储的语音进行标签识别并设置索引；数据上传模块，用以将语音识别后的语音进行切片处理并上传至云端进行分类存储；反馈训练模块，用以根据对LLM大语言模型进行训练，并对语音处理的有效性进行反馈，还用以对反馈过程进行补偿。本发明提高了车载数据的语音标签效率。

申请人信息

申请人:知迪汽车技术(北京)有限公司
申请人地址:100020 北京市朝阳区建国路86号院1号楼8层01
发明人: 知迪汽车技术(北京)有限公司

专利详细信息

项目	内容
专利名称	一种基于大语言模型的车载数据语音标签系统
专利类型	发明申请
申请号	CN202311754382.2
申请日	2023/12/19
公告号	CN117763194A
公开日	2024/3/26
IPC主分类号	G06F16/65
权利人	知迪汽车技术(北京)有限公司
发明人	王世禄; 吴行健; 陈志航; 朱晓诚
地址	北京市朝阳区建国路86号院1号楼8层01

专利主权项内容

1.一种基于大语言模型的车载数据语音标签系统，其特征在于，包括：数据记录模块，用以对车辆的路测数据进行采集；语音记录模块，用以根据环境音量对语音记录的开启进行判断，并根据用户记录按钮对语音记录开启的判断过程进行修正，还用以对记录后的语音进行预处理和存储；语音处理模块，用以通过LLM大语言模型对已存储的语音进行标签识别，还用以对识别成功的语音设置索引；数据上传模块，用以将语音识别后的语音进行切片处理并上传至云端进行分类存储，还用以对云端中识别失败的语音和识别错误的语音校正索引并存储于云端的语音训练集中；反馈训练模块，用以根据训练时间对LLM大语言模型进行训练，还用以计算失效率，并根据失效率对语音处理的有效性进行反馈，还用以对语音处理效率进行判断，并根据判断结果对反馈过程进行补偿。

一种基于大语言模型的车载数据语音标签系统

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

特别鸣谢

一种基于大语言模型的车载数据语音标签系统

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种高频变压器串并联倍流输出的整流电路

沙发(HSN-6053)

时延对齐方法及装置

一种高脱色竹制活性碳及其制备工艺

床(HSN-B016)

座椅部件(GF-82733H)

热门技术领域

快速入口

专利技术资料

特别鸣谢