• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种建立数据分类模型的方法和装置
有效
专利申请进度
申请
2015-12-30
申请公布
2017-07-07
授权
2019-12-27
预估到期
2035-12-30
专利基础信息
申请号 CN201511020749.3 申请日 2015-12-30
申请公布号 CN106933847A 申请公布日 2017-07-07
授权公布号 CN106933847B 授权公告日 2019-12-27
分类号 G06F16/35
分类 计算;推算;计数;
申请人名称 北京神州泰岳软件股份有限公司
申请人地址 北京市海淀区海淀大街34号8层818室
专利法律状态
  • 2020-10-02
    专利权人的姓名或者名称、地址的变更
    状态信息
    专利权人的姓名或者名称、地址的变更;IPC(主分类):G06F16/35;变更事项:专利权人;变更前:北京神州泰岳软件股份有限公司;变更后:北京神州泰岳软件股份有限公司;变更事项:地址;变更前:100089 北京市海淀区万泉庄路28号万柳新贵大厦A座6层601室;变更后:100080 北京市海淀区海淀大街34号8层818室
  • 2019-12-27
    授权
    状态信息
    授权
  • 2017-08-01
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06F17/30;申请日:20151230
  • 2017-07-07
    公布
    状态信息
    公布
摘要
本发明公开了一种建立数据分类模型的方法和装置,包括:获取指定业务类型的源数据及该源数据的类别信息,建立多个分类模型;将测试分数最高的分类模型作为最优分类模型;其中,建立每个分类模型包括:从源数据中随机抽取部分数据;对所述部分数据进行分词;利用特征选择算法计算各词与各类别信息之间的关联值,将关联值高于第一预设值的词放入该类别信息的特征词集中;将各特征词集及其类别信息一同输入分类器中建立相应的分类模型。上述得到的多个分类模型之间的差别在于:从源数据中抽取出的数据、特征选择算法和/或分类器,因此从多个分类模型中选择得到的最优分类模型是综合考虑以上变化参数而得的最优分类策略,具有很高的准确性和稳定性。