• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种基于多维度综合词库的分词方法
有效
专利申请进度
申请
2014-05-19
申请公布
2014-07-23
授权
2017-04-05
预估到期
2034-05-19
专利基础信息
申请号 CN201410212388.1 申请日 2014-05-19
申请公布号 CN103942347A 申请公布日 2014-07-23
授权公布号 CN103942347B 授权公告日 2017-04-05
分类号 G06F17/30;G06F17/27
分类 计算;推算;计数;
申请人名称 焦点科技股份有限公司
申请人地址 江苏省南京市高新区星火路软件大厦A座12F
专利法律状态
  • 2017-04-05
    授权
    状态信息
    授权
  • 2014-08-20
    实质审查的生效
    状态信息
    实质审查的生效IPC(主分类):G06F 17/30申请日:20140519
  • 2014-07-23
    公布
    状态信息
    公开
摘要
本发明一种基于多维度综合词库的构建方法,选择数据源,并进行使用量统计;根据约束条件选择关键词;为关键词创建多维的维护字段;根据共现关系,获得原始关键词的同义词、以及英文关键词复数的单数形式,完善词库内容;制定中心关键词识别规则,找出原始关键词中包含的中心关键词。本发明同时公开了一种基于多维度综合词库的搜索分词方法和中心关键词识别方法。在本发明通过构建一个具有多重维度的综合词库,在词库中采用语义识别技术,识别商品的中心关键词,从而使得匹配有较好的基础。本发明综合运用字符串匹配分词方法以及基于统计、词库的分词方法,结合自动和人工的方式同时参与词库的维护升级,提高分词准确性。