• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
基于核心词相似度判断企业中文名称重复的方法
有效
专利申请进度
申请
2014-04-14
申请公布
2014-06-25
授权
2015-02-25
预估到期
2034-04-14
专利基础信息
申请号 CN201410149132.0 申请日 2014-04-14
申请公布号 CN103885937A 申请公布日 2014-06-25
授权公布号 CN103885937B 授权公告日 2015-02-25
分类号 G06F17/27
分类 计算;推算;计数;
申请人名称 焦点科技股份有限公司
申请人地址 江苏省南京市高新区星火路软件大厦A座12F
专利法律状态
  • 2015-02-25
    授权
    状态信息
    授权
  • 2014-07-16
    实质审查的生效
    状态信息
    实质审查的生效IPC(主分类):G06F 17/27申请日:20140414
  • 2014-06-25
    公布
    状态信息
    公布
摘要
本发明公开了一种基于核心词相似度判断企业中文名称重复的方法,通过ETL,把B2B电子商务平台数据库中的企业中文名称,加载到企业名称数据集市中;对数据集市中保存的企业中文名称进行预处理;通过企业中文名称核心词提取方法来提取这些新增企业中文名称的核心词;根据核心词所对应的企业中文名称集,从而找到对应的未去除名称地域关键词的企业中文名称,通过考虑权重的文本相似度计算处理方法,计算新增企业中文名称与对应的去除名称地域关键词的企业中文名称的相似度。本发明减少了匹配工作的处理量,提高了整个方法的处理效率。