首页
品牌
排行
问答
专题
特惠
资讯
展会
百科
热门行业
装修建材
家居生活
餐饮食品
母婴教育
电脑办公
服装首饰
汽车工具
家电数码
机械化工
休闲美容
热门行业
教育培训
板材
地板
涂料
家纺
集成吊顶
美缝剂
木门
硅藻泥
管材
指纹锁
橱柜
衣柜
床垫
电热水器
集成灶
暖气片
净水器
酒店
卫浴
装修建材
卫浴洁具
板材
地板
建筑陶瓷
天花板
涂料
瓷砖泥瓦
水电管材
火锅
快餐
生活用品
软装
装饰装潢
灯具
家纺
干洗服务
内衣
男装
女装
幼教
整体卫浴
地板砖
阻燃板
铝材
集成吊顶
美缝剂
硅藻泥
管材
烤鱼
汉堡
叶酸
婴儿用品
婴儿床
指纹锁
品牌首页
品牌资讯
企业信息
商标信息
专利信息
返回上一页
专利状态
一种用于对文本文件进行智能聚类的方法及系统
有效
专利申请进度
申请
2020-12-25
申请公布
2021-04-06
授权
2023-06-16
预估到期
2040-12-25
专利基础信息
申请号
CN202011572805.5
申请日
2020-12-25
申请公布号
CN112612888A
申请公布日
2021-04-06
授权公布号
CN112612888B
授权公告日
2023-06-16
分类号
G06F16/35;G06F16/33;G06F40/284
分类
计算;推算;计数;
申请人名称
航天信息股份有限公司
申请人地址
北京市海淀区杏石口路甲18号
专利法律状态
2023-06-16
授权
状态信息
授权
2021-12-21
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F16/35;申请日:20201225
2021-04-06
公布
状态信息
公布
摘要
本发明涉及一种用于对文本文件进行智能聚类的方法及系统,方法包括:确定符合预设文件类型的每个文本文件的至少一个语言种类,将每个文本文件中不符合至少一个语言种类的符号块组进行删除;对去除了符号块组的每个文本文件中的内容进行分词,对分词所获得的所有词语进行停用词过滤,以去掉去除了符号块组的每个文本文件中的所有的停用词;为去除了停用词的每个文本文件构建文本向量,将去除了停用词的每个文本文件上传到文件服务器的临时文件夹内;将所上传的每个文本文件封装成报文,利用所述每个文本文件对应的文本向量对每个文本文件进行智能聚类,以生成初始的分类类型,根据用户输入从多个候选的分类类型中确定文本文件的目标分类类型。
更多专利
1
热擦写打印机及其工作控制方法
2
一种批量PDF文件数字签名方法及系统
3
一种分布式记账的方法和装置
4
一种财税区块链的账本建立方法、装置及计算机设备
5
故障诊断方法及装置,存储介质,电子设备
6
一种智能采集终端
7
一种基于发票判断的虚假交易预警方法及系统
8
一种区块链业务交易认证的方法及设备
9
一种确定克隆车辆的方法、装置及计算设备
10
扫码登录方法及系统
11
一种兼容多种被监控设备的监控方法及系统
12
一种信息传输方法、装置及系统
13
授权方法、装置、存储介质及服务器
14
一种自动翻页装置
15
打印机
16
一种用于自助通道紧急疏散控制的方法及系统
17
跨平台税务智能客服语料迁移方法及装置
18
共享密钥处理方法、装置、存储介质和电子设备
19
一种活体检测方法及装置
20
密钥存储及电子钱包恢复方法
全国服务热线:
在线客服
1211389656
咨询
商务合作
85926368
咨询
媒体合作
921888730
咨询
在线客服
客服微信号
品牌网官方客服微信
打开微信扫一扫
客服微信
商务合作微信
商务合作详谈
打开微信扫一扫
商务合作
回到顶部