• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种文档的去重方法、设备及可读介质
有效
专利申请进度
申请
2019-05-06
申请公布
2019-08-16
授权
2021-05-28
预估到期
2039-05-06
专利基础信息
申请号 CN201910373004.7 申请日 2019-05-06
申请公布号 CN110134852A 申请公布日 2019-08-16
授权公布号 CN110134852B 授权公告日 2021-05-28
分类号 G06N3/04;G06F16/953;G06N3/08;G06K9/62;G06F16/332
分类 计算;推算;计数;
申请人名称 北京四维图新科技股份有限公司
申请人地址 北京市海淀区学院路7号弘彧大厦10层1002A室
专利法律状态
  • 2021-05-28
    授权
    状态信息
    授权
  • 2019-09-10
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06F16/953;申请日:20190506
  • 2019-08-16
    公布
    状态信息
    公布
摘要
本说明书实施例公开了一种文档的去重方法、设备及可读介质,其方案是,采用特征工程策略从第一文档和第二文档中提取来自特征工程的特征;采用神经网络策略从第一文档和第二文档中提取来自神经网络的特征;根据来自特征工程的特征和来自神经网络的特征计算第一文档和第二文档的综合相似度;根据综合相似度确定第一文档与第二文档是否重复,其中,来自特征工程的特征和来自神经网络的特征均为用于表示第一文档和第二文档之间相似程度的特征。