• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种基于聚类的大数据常态模式提取方法及系统
有效
专利申请进度
申请
2014-07-24
申请公布
2014-11-19
授权
2017-08-11
预估到期
2034-07-24
专利基础信息
申请号 CN201410356957.X 申请日 2014-07-24
申请公布号 CN104156403A 申请公布日 2014-11-19
授权公布号 CN104156403B 授权公告日 2017-08-11
分类号 G06F17/30
分类 计算;推算;计数;
申请人名称 中国软件与技术服务股份有限公司
申请人地址 北京市海淀区学院南路55号(中软大厦)
专利法律状态
  • 2017-08-11
    授权
    状态信息
    授权
  • 2016-06-22
    著录事项变更
    状态信息
    著录事项变更;IPC(主分类):G06F17/30;变更事项:发明人;变更前:王电 魏毅 黄煜可;变更后:王电 魏毅 黄煜可 王雷
  • 2014-12-17
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06F17/30;申请日:20140724
  • 2014-11-19
    公布
    状态信息
    公布
摘要
本发明公开了一种基于聚类的大数据常态模式提取方法。本方法为:1)服务器从各终端采集样本数据,得到一总样本数据集;2)从该总样本数据集中抽取若干样本,并对其聚类,将得到的簇作为样本的标签对样本进行标注,然后根据选取的属性降维指标计算所述抽样样本集合中已标注样本每一属性的属性值辨识度、属性辨识度和或属性值重要性、属性重要性四项指标;根据计算结果对属性进行排序,选取若干属性作为大数据降维后保留的属性;3)对属性降维后的全体样本数据聚类,将得到的簇作为样本的标签对样本进行标注;4)根据选取的属性划分指标计算已标注样本每一属性的四项指标,选取若干属性特征对该总样本数据集进行划分,将划分结果作为常态模式。