一种短视频内容理解标注方法

申请号: CN202311421767.7

申请人: 北京头条易科技有限公司

申请日期: 2023/10/31

摘要文本

本发明公开了一种短视频内容理解标注方法，涉及视频内容标注技术领域，包括，步骤S1，读取待标注的视频流，利用设定参数对视频流进行解析，所述的设定参数包括滑动窗口的大小和滑动步幅。步骤S2，利用上述步骤中的滑动窗口作用于视频帧序列，从视频起始位置开始，逐步滑动窗口并获取每个窗口的视频帧。步骤S3，对每个窗口中的视频帧按时间序列进行呈现，标注员根据标注类型不同，依次对每个窗口的视频帧进行内容标注，产生标注时间轴上的标注事件。本发明通过标注方法，提高了标注员的标注效率，缩短标注消耗时间，提高标注内容的精度。

申请人信息

申请人:北京头条易科技有限公司
申请人地址:100000 北京市朝阳区光华路9号楼5层525室
发明人: 北京头条易科技有限公司

专利详细信息

项目	内容
专利名称	一种短视频内容理解标注方法
专利类型	发明授权
申请号	CN202311421767.7
申请日	2023/10/31
公告号	CN117156221B
公开日	2024/2/6
IPC主分类号	H04N21/83
权利人	北京头条易科技有限公司
发明人	张瑾; 文静; 袁泉; 郝文涛; 张鹏
地址	北京市朝阳区光华路9号楼5层525室

专利主权项内容

1.一种短视频内容理解标注方法，其特征在于：包括，步骤S1，读取待标注的视频流，利用设定参数对视频流进行解析，所述的设定参数包括滑动窗口的大小和滑动步幅；步骤S2，利用上述步骤中的滑动窗口作用于视频帧序列，从视频起始位置开始，逐步滑动窗口并获取每个窗口的视频帧；步骤S3，对每个窗口中的视频帧按时间序列进行呈现，标注员根据标注类型不同，依次对每个窗口的视频帧进行内容标注，产生标注时间轴上的标注事件；步骤S4，对标注后的视频帧进行加权整合，通过设定参数的参数值调整加权值；输出带有完整标注事件的标注时间轴的视频流；所述的标注类型包括关键帧标注、对象跟踪标注、情感和情绪标注、音频标注、事件标注，所述的关键帧标注对于特定时间点，选择关键帧并对其进行标注；所述的对象跟踪标注对视频帧中的可跟踪对象进行轨迹或运动标注；所述的情感和情绪标注对不同时间点出现的情绪变化进行标注；所述的事件标注对视频帧的内容事件进行标注；所述的音频标注对音频标注，识别音频中的语音内容、声音效果和音乐；针对事件标注类型的标注步骤，包括，步骤S101，设定标注类型为事件标注，对窗口中的视频帧进行语音转文本识别，并对文本数据进行清洗，利用文本分析生成技术生成内容摘要，在标注事件上显示内容摘要，供标注员查看；步骤S102，标注员对内容摘要进行标注评判，评判标准包括描述是否准确，是否存在同音词错误，是否包含需要人为修正；当需要人为修正时，标注员对内容摘要的副本进行修改，修改后的副本按时间序列作用在标注事件上；步骤S103，针对每个窗口视频帧的事件和情节，按设定参数进行加权整合，整合后的视频帧具有不同时间点出现的事件节点；所述的事件节点上包含标注的事件信息，所述的事件信息包括语音转文本修正内容、视频事件内容描述、内容摘要与视频匹配程度。

一种短视频内容理解标注方法

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

特别鸣谢

一种短视频内容理解标注方法

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种高频变压器串并联倍流输出的整流电路

沙发(HSN-6053)

时延对齐方法及装置

一种高脱色竹制活性碳及其制备工艺

床(HSN-B016)

座椅部件(GF-82733H)

热门技术领域

快速入口

专利技术资料

特别鸣谢