← 返回列表

数据处理方法和装置、用于数据处理的装置

申请号: CN201810394877.1
申请人: 北京搜狗科技发展有限公司
申请日期: 2018年4月27日

摘要文本

本发明实施例提供了一种数据处理方法和装置、用于数据处理的装置,其中的方法具体包括:确定待检测页面的页面内容;依据所述页面内容,对所述待检测页面进行检测,以得到第一检测结果页面;依据所述第一检测结果页面的属性信息,对所述第一检测结果页面进行过滤,以得到第二检测结果页面。本发明实施例可以检测出被新增的恶意推广内容,可以降低复核的工作量,节省人力成本,且可以提高复核的效率。 来自马-克-数-据-官网

专利详细信息

项目 内容
专利名称 数据处理方法和装置、用于数据处理的装置
专利类型 发明授权
申请号 CN201810394877.1
申请日 2018年4月27日
公告号 CN110413866B
公开日 2024年2月2日
IPC主分类号 G06F16/9535
权利人 北京搜狗科技发展有限公司
发明人 何筱妍
地址 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间

专利主权项内容

1.一种数据处理方法,其特征在于,所述方法包括:确定待检测页面的页面内容;依据所述页面内容,对所述待检测页面进行检测,以得到第一检测结果页面;依据所述第一检测结果页面的属性信息,对所述第一检测结果页面进行滤重,以得到第二检测结果页面;所述依据所述页面内容,对所述待检测页面进行检测,包括:对所述页面内容与关键词集合中关键词进行匹配;若所述页面内容中存在与所述关键词相匹配的内容,则将所述待检测页面作为所述第一检测结果页面;所述对所述第一检测结果页面进行滤重,包括:依据基于所述属性信息得到的第一过滤特征,对所述第一检测结果页面进行第一过滤,以得到第一过滤结果;依据基于所述属性信息得到的第二过滤特征,对所述第一过滤结果进行第二过滤,以得到第二检测结果页面;其中,所述第一过滤特征包括:页面地址和客户标识,所述第二过滤特征包括:客户标识和匹配关键词;或者所述第一过滤特征包括:客户标识和匹配关键词,所述第二过滤特征包括:页面地址和客户标识;根据所述第二检测结果页面对所述第一检测结果页面进行复核。