← 返回列表

一种文本标注方法及其设备、计算机存储介质

申请号: CN201811483154.5
申请人: 北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司
申请日期: 2018年12月5日

摘要文本

本发明实施例提供一种文本标注方法及其设备、计算机存储介质,其中,所述方法包括:获取待标注文本的各个分词和每一所述分词的预标注信息,其中,所述预标注信息包括自定义词性;根据获取到的每一所述分词的关联分词及所述关联分词的预标注信息,确定所述分词的标注特征;将每一所述分词和所述分词对应的标注特征,输入预设的分类模型,得到所述分词的目标标注信息;根据每一所述分词的目标标注信息对对应的分词进行标注。

专利详细信息

项目 内容
专利名称 一种文本标注方法及其设备、计算机存储介质
专利类型 发明授权
申请号 CN201811483154.5
申请日 2018年12月5日
公告号 CN111274384B
公开日 2024年2月6日
IPC主分类号 G06F16/35
权利人 北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司
发明人 安旭; 周旭
地址 北京市海淀区知春路76号8层; 北京市大兴区北京经济技术开发区科创十一街18号C座2层201室

专利主权项内容

1.一种文本标注方法,其特征在于,所述方法包括:获取待标注文本的各个分词和每一所述分词的预标注信息,其中,所述预标注信息包括自定义词性;根据所述分词中包含的各个字符,确定每一所述分词的关联分词,其中,关联分词为包括所述字符的分词;获取所述关联分词的预标注信息;根据获取到的每一所述分词的关联分词及所述关联分词的预标注信息,确定所述分词对应的标注特征;将每一所述分词和所述分词对应的标注特征,输入预设的分类模型,得到每一所述分词的目标标注信息;根据每一所述分词的目标标注信息对对应的分词进行标注。