首页
品牌
排行
问答
专题
特惠
资讯
展会
百科
热门行业
装修建材
家居生活
餐饮食品
母婴教育
电脑办公
服装首饰
汽车工具
家电数码
机械化工
休闲美容
热门行业
教育培训
板材
地板
涂料
家纺
集成吊顶
美缝剂
木门
硅藻泥
管材
指纹锁
橱柜
衣柜
床垫
电热水器
集成灶
暖气片
净水器
酒店
卫浴
装修建材
卫浴洁具
板材
地板
建筑陶瓷
天花板
涂料
瓷砖泥瓦
水电管材
火锅
快餐
生活用品
软装
装饰装潢
灯具
家纺
干洗服务
内衣
男装
女装
幼教
整体卫浴
地板砖
阻燃板
铝材
集成吊顶
美缝剂
硅藻泥
管材
烤鱼
汉堡
叶酸
婴儿用品
婴儿床
指纹锁
品牌首页
品牌资讯
企业信息
商标信息
专利信息
返回上一页
专利状态
一种用于对文本文件进行智能聚类的方法及系统
有效
专利申请进度
申请
2020-12-25
申请公布
2021-04-06
授权
2023-06-16
预估到期
2040-12-25
专利基础信息
申请号
CN202011572805.5
申请日
2020-12-25
申请公布号
CN112612888A
申请公布日
2021-04-06
授权公布号
CN112612888B
授权公告日
2023-06-16
分类号
G06F16/35;G06F16/33;G06F40/284
分类
计算;推算;计数;
申请人名称
航天信息股份有限公司
申请人地址
北京市海淀区杏石口路甲18号
专利法律状态
2023-06-16
授权
状态信息
授权
2021-12-21
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F16/35;申请日:20201225
2021-04-06
公布
状态信息
公布
摘要
本发明涉及一种用于对文本文件进行智能聚类的方法及系统,方法包括:确定符合预设文件类型的每个文本文件的至少一个语言种类,将每个文本文件中不符合至少一个语言种类的符号块组进行删除;对去除了符号块组的每个文本文件中的内容进行分词,对分词所获得的所有词语进行停用词过滤,以去掉去除了符号块组的每个文本文件中的所有的停用词;为去除了停用词的每个文本文件构建文本向量,将去除了停用词的每个文本文件上传到文件服务器的临时文件夹内;将所上传的每个文本文件封装成报文,利用所述每个文本文件对应的文本向量对每个文本文件进行智能聚类,以生成初始的分类类型,根据用户输入从多个候选的分类类型中确定文本文件的目标分类类型。
更多专利
1
基于RFID的车辆识别定位装置
2
一种用于管理区块链节点的管理装置及方法
3
扫码登录方法及系统
4
一种用于实现电子签章的方法及系统
5
一种确定实体语料之间的相似性的方法及装置
6
导税台
7
开票机
8
智能取件机
9
识别异常纳税行为的方法
10
一种活体检测方法及装置
11
一种确定带宽参数的系统、方法及装置
12
一种社区网格服务联动处置控制方法及系统
13
一种通过自动调度税控设备进行电子发票开具的方法及系统
14
一种基于中央随机的控索性软件测试方法及装置
15
一种通用发票模板设置方法及系统
16
基于具有生命周期的容器的大数据分级脱敏方法和系统
17
基于Hadoop的密钥管理方法及装置
18
一种时钟设备状态管理装置及方法
19
一种财税区块链的账本建立方法、装置及计算机设备
20
OFD文档签章方法、电子设备及介质
全国服务热线:
在线客服
1211389656
咨询
商务合作
85926368
咨询
媒体合作
921888730
咨询
在线客服
客服微信号
品牌网官方客服微信
打开微信扫一扫
客服微信
商务合作微信
商务合作详谈
打开微信扫一扫
商务合作
回到顶部