← 返回列表
文本数据的处理方法和装置、以及存储介质和电子装置
摘要文本
本发明公开了一种文本数据的处理方法和装置、以及存储介质和电子装置。其中,该方法包括:抓取多个媒体资源集的每个媒体资源集中目标媒体资源的文本数据,得到多个文本,其中,多个文本与多个媒体资源集一一对应;确定多个文本中任意两个文本之间的文本相似度值;根据每个文本相对于多个文本中其它文本的文本相似度值,确定对应文本的文本准确度值;根据多个文本中文本准确度值符合目标条件的文本,对目标媒体资源集中的目标媒体资源的文本数据进行处理。本发明解决了相关技术中对文本数据进行处理的方法效率较低的技术问题。
申请人信息
- 申请人:腾讯科技(北京)有限公司
- 申请人地址:100080 北京市海淀区海淀大街38号银科大厦16层1601-1608室
- 发明人: 腾讯科技(北京)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 文本数据的处理方法和装置、以及存储介质和电子装置 |
| 专利类型 | 发明授权 |
| 申请号 | CN201810444924.9 |
| 申请日 | 2018年5月10日 |
| 公告号 | CN110196920B |
| 公开日 | 2024年2月9日 |
| IPC主分类号 | G06F16/78 |
| 权利人 | 腾讯科技(北京)有限公司 |
| 发明人 | 汤见乐 |
| 地址 | 北京市海淀区海淀大街38号银科大厦16层1601-1608室 |
专利主权项内容
1.一种文本数据的处理方法,其特征在于,包括:抓取多个媒体资源集的每个媒体资源集中目标媒体资源的文本数据,得到多个文本,其中,所述多个文本与所述多个媒体资源集一一对应;确定所述多个文本中任意两个文本之间的文本相似度值;根据每个文本相对于所述多个文本中其它文本的文本相似度值,确定对应文本的文本准确度值;根据所述多个文本中文本准确度值符合目标条件的文本,对目标媒体资源集中的所述目标媒体资源的文本数据进行处理。