首页
品牌
排行
问答
专题
特惠
资讯
展会
百科
热门行业
装修建材
家居生活
餐饮食品
母婴教育
电脑办公
服装首饰
汽车工具
家电数码
机械化工
休闲美容
热门行业
教育培训
板材
地板
涂料
家纺
集成吊顶
美缝剂
木门
硅藻泥
管材
指纹锁
橱柜
衣柜
床垫
电热水器
集成灶
暖气片
净水器
酒店
卫浴
装修建材
卫浴洁具
板材
地板
建筑陶瓷
天花板
涂料
瓷砖泥瓦
水电管材
火锅
快餐
生活用品
软装
装饰装潢
灯具
家纺
干洗服务
内衣
男装
女装
幼教
整体卫浴
地板砖
阻燃板
铝材
集成吊顶
美缝剂
硅藻泥
管材
烤鱼
汉堡
叶酸
婴儿用品
婴儿床
指纹锁
品牌首页
品牌资讯
企业信息
商标信息
专利信息
返回上一页
专利状态
一种中文短文本聚类方法
有效
专利申请进度
申请
2016-11-02
申请公布
2017-04-26
授权
2021-04-06
预估到期
2036-11-02
专利基础信息
申请号
CN201610952122.X
申请日
2016-11-02
申请公布号
CN106599029A
申请公布日
2017-04-26
授权公布号
CN106599029B
授权公告日
2021-04-06
分类号
G06F16/35;G06F40/30
分类
计算;推算;计数;
申请人名称
焦点科技股份有限公司
申请人地址
江苏省南京市仙林大学城文苑路3号
专利法律状态
2021-04-06
授权
状态信息
授权
2017-05-24
实质审查的生效
状态信息
实质审查的生效
2017-04-26
公布
状态信息
公布
摘要
本发明涉及一种中文短文本聚类方法,具体涉及一种基于词向量及其相似度计算的中文短文本聚类方法。具体步骤如下,利用Word2Vec词向量训练模型获得所需要的词向量;利用词权重计算算法获取短文本集中所有词的权重;根据词向量和所有词的权重通过短文本相似度算法计算短文本集中每两个文本之间的相似度值;根据短文本集中每两个文本之间的相似度值对短文本进行聚类。本发明提出一种“搬运优化”的短文本相似度计算方法,解决了短文本文法特征稀疏和语义缺失等问题;基于图模型不断迭代计算词的权重,提高句子相似度计算的准确度;选择基于密度峰值聚类方法应用到短文本的聚类中,有效地提高聚类方法的效率。
更多专利
1
一种易于快速迭代更新的Logo检测方法
2
一种基于视觉AI的智能运动指导方法及系统
3
一种针对电商产品的自动抠图与评分方法及系统
4
一种基于本地缓存快速建立索引的方法及系统
5
一种基于用户行为数据的客户忠诚度细分方法
6
一种针对海量大对象数据的高效能存储方法
7
一种基于相同开销网格的高效寻路的方法及系统
8
一种基于标签语义规范化推荐方法
9
一种云数据中心大规模异构集群节点快速定量分级方法
10
一种联合机器检索阅读的方法
11
一种含格式的html富文本数据的跨标签处理方法及系统
12
一种基于多维度综合词库的分词方法
13
一种构造人脸图库的方法
14
一种跨机房数据库的数据一致性校验方法
15
一种IP库质量评估及入库方法和系统
16
一种HTTP与WebSocket协同的分布式状态同步方法
17
高可靠性的大数据日志采集与传输方法
18
一种实现HDFS文件占用率自动监控的方法及系统
19
一种高可靠的实时日志收集及可视化检索方法
20
一种构建多语言网站实时翻译的方法
全国服务热线:
在线客服
1211389656
咨询
商务合作
85926368
咨询
媒体合作
921888730
咨询
在线客服
客服微信号
品牌网官方客服微信
打开微信扫一扫
客服微信
商务合作微信
商务合作详谈
打开微信扫一扫
商务合作
回到顶部