• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种基于机器学习的数据分类方法及设备
有效
专利申请进度
申请
2017-01-23
申请公布
2017-06-09
授权
2021-04-13
预估到期
2037-01-23
专利基础信息
申请号 CN201710051325.6 申请日 2017-01-23
申请公布号 CN106815605A 申请公布日 2017-06-09
授权公布号 CN106815605B 授权公告日 2021-04-13
分类号 G06K9/62;G06N20/00
分类 计算;推算;计数;
申请人名称 上海上讯信息技术股份有限公司
申请人地址 上海市浦东新区张江高科技园区郭守敬路498号8幢20300室
专利法律状态
  • 2023-11-10
    专利权质押合同登记的生效、变更及注销
    状态信息
    专利权质押合同登记的生效;IPC(主分类):G06K9/62;专利号:ZL2017100513256;登记号:Y2023980062535;登记生效日:20231025;出质人:上海上讯信息技术股份有限公司;质权人:兴业银行股份有限公司上海金山支行;发明名称:一种基于机器学习的数据分类方法及设备;申请日:20170123;授权公告日:20210413
  • 2023-11-03
    专利权质押合同登记的生效、变更及注销
    状态信息
    专利权质押合同登记的注销;IPC(主分类):G06K9/62;授权公告日:20210413;申请日:20170123;登记号:Y2022310000279;出质人:上海上讯信息技术股份有限公司;质权人:兴业银行股份有限公司上海分行;解除日:20231017
  • 2022-10-25
    专利权质押合同登记的生效、变更及注销
    状态信息
    专利权质押合同登记的生效;IPC(主分类):G06K9/62;登记号:Y2022310000279;登记生效日:20221008;出质人:上海上讯信息技术股份有限公司;质权人:兴业银行股份有限公司上海分行;发明名称:一种基于机器学习的数据分类方法及设备;申请日:20170123;授权公告日:20210413
  • 2021-04-13
    授权
    状态信息
    授权
  • 2017-07-04
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06K9/62;申请日:20170123
  • 2017-06-09
    公布
    状态信息
    公布
摘要
本发明提出了一种基于机器学习的数据分类方法,包括如下步骤:S11,基于学习数据确定每种数据对应的第一特征词群;S12,根据特征词对学习数据进行分类;S13,判断学习数据的分类是否正确,如果是,至步骤S15;如果否,调整第一特征词群,至步骤S12;S15,基于第一特征词群建立数据分类模型;一种基于机器学习的数据分类设备包括第一特征词群确定模块、第一数据分类模块、判断分类模块、第二特征词群确定模块、建模模块。本发明对文件内容进行切词处理,采用TFIDF算法,算出词的权重,然后计算文件相似度,将同类文件进行聚类。特征词提取。特征词不同于关键字,特征词更具代表性,更适合作为敏感信息,来与其他类加以区分。