• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种基于平滑短语主题模型的主题提取方法及装置
有效
专利申请进度
申请
2019-12-31
申请公布
2020-05-19
授权
2023-08-01
预估到期
2039-12-31
专利基础信息
申请号 CN201911421842.3 申请日 2019-12-31
申请公布号 CN111178048A 申请公布日 2020-05-19
授权公布号 CN111178048B 授权公告日 2023-08-01
分类号 G06F40/216;G06F40/289;G06F16/2458
分类 计算;推算;计数;
申请人名称 微梦创科网络科技(中国)有限公司
申请人地址 北京市海淀区东北旺西路中关村软件园二期(西扩)N-1、N-2地块新浪总部科研楼2层
专利法律状态
  • 2023-08-01
    授权
    状态信息
    授权
  • 2020-06-12
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06F40/216;申请日:20191231
  • 2020-05-19
    公布
    状态信息
    公布
摘要
本发明实施例提供一种基于平滑短语主题模型的主题提取方法及装置,包括:提取待处理数据集内的有效词,得到预处理数据集;通过Apriori关联算法自预处理数据集中提取出频繁短语,形成频繁短语数据集;根据频繁短语出现频率的高斯分布特性,将预处理数据集中符合预设要求的相邻的频繁短语组合成新的短语,并将新的短语加入到频繁短语数据集,形成候选短语数据集;通过SPLDA平滑短语主题模型对候选短语数据集进行分析,得到主题短语,通过主题短语形成相应的话题。通过平滑短语主题模型对候选短语数据集进行分析得到主题短语,通过主题短语形成相应的话题,提高了话题的可读性,更准确地表述了话题的真实信息。