• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
基于分布式平台的BIRCH算法改进方法、装置及设备
有效
专利申请进度
申请
2019-07-08
申请公布
2021-01-08
授权
2024-02-27
预估到期
2039-07-08
专利基础信息
申请号 CN201910608916.8 申请日 2019-07-08
申请公布号 CN112200206A 申请公布日 2021-01-08
授权公布号 CN112200206B 授权公告日 2024-02-27
分类号 G06F18/231;G06F16/55
分类 计算;推算;计数;
申请人名称 浙江宇视科技有限公司
申请人地址 浙江省杭州市滨江区西兴街道江陵路88号10幢南座1-11层、2幢A区1-3楼、2幢B区2楼
专利法律状态
  • 2024-02-27
    授权
    状态信息
    授权
  • 2021-01-26
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06K9/62;申请日:20190708
  • 2021-01-08
    公布
    状态信息
    公布
摘要
本发明实施例公开了一种基于分布式平台的BIRCH算法改进方法、装置及设备。其中方法包括:将至少两组待处理数据分别存储至spark平台中弹性分布式数据集的分区中;根据所述分区中待处理数据,并行建立聚类特征树;重复执行如下操作:对上一层聚类特征树进行分组,根据每组中至少两个上一层聚类特征树的代表性数据,生成每组的当前层聚类特征树,直至建立目的聚类特征树;根据所述目的聚类特征树中所述代表性数据的聚类结果,对各层聚类特征树中所述代表性数据所属聚类特征中其他数据的聚类结果进行同步处理。本发明实施例通过对数据进行多轮并列聚类分析,不仅能够显著提高数据分析效率,还能确保数据分析的准确度,提高了用户体验。