首页
品牌
排行
问答
专题
特惠
资讯
展会
百科
热门行业
装修建材
家居生活
餐饮食品
母婴教育
电脑办公
服装首饰
汽车工具
家电数码
机械化工
休闲美容
热门行业
教育培训
板材
地板
涂料
家纺
集成吊顶
美缝剂
木门
硅藻泥
管材
指纹锁
橱柜
衣柜
床垫
电热水器
集成灶
暖气片
净水器
酒店
卫浴
装修建材
卫浴洁具
板材
地板
建筑陶瓷
天花板
涂料
瓷砖泥瓦
水电管材
火锅
快餐
生活用品
软装
装饰装潢
灯具
家纺
干洗服务
内衣
男装
女装
幼教
整体卫浴
地板砖
阻燃板
铝材
集成吊顶
美缝剂
硅藻泥
管材
烤鱼
汉堡
叶酸
婴儿用品
婴儿床
指纹锁
品牌首页
品牌资讯
企业信息
商标信息
专利信息
返回上一页
专利状态
一种面向公共资源交易数据的清洗去重方法及其系统
有效
专利申请进度
申请
2019-04-09
申请公布
2019-09-03
授权
2022-04-12
预估到期
2039-04-09
专利基础信息
申请号
CN201910278683.X
申请日
2019-04-09
申请公布号
CN110196848A
申请公布日
2019-09-03
授权公布号
CN110196848B
授权公告日
2022-04-12
分类号
G06F16/215;G06F16/951
分类
计算;推算;计数;
申请人名称
广联达科技股份有限公司
申请人地址
北京市海淀区西北旺东路10号院东区13号楼广联达信息大厦
专利法律状态
2022-04-12
授权
状态信息
授权
2019-09-03
公布
状态信息
公布
摘要
本发明涉及一种面向公共资源交易数据的清洗去重方法及其系统,该公共资源交易数据所对应的文本以文本数据记录形式存储在数据集中;其中,按照预设规则对数据集进行分组,控制每个分组内的文本数据记录数量;基于最长公共子序列计算每一分组内各个文本数据记录之间的数据相似度;当两条文本数据记录之间的数据相似度大于预定阈值时,进一步对比这两条文本数据记录的命名实体信息,当这两条文本数据记录的命名实体信息相同时,判断属于重复数据,否则判断属于非重复数据。通过多维度的交叉验证方式来确定来自公共资源交易数据中的重复信息,能够在提高文本处理性能的基础上进一步防止误判重复数据。
更多专利
1
提升前端报表显示性能的方法及系统
2
可视化监控设备的充电装置及塔机
3
一种统一异构数据的方法和装置
4
带有预制墙参数设置图形用户界面的电脑
5
防护盖座的建模方法、装置、电子设备及可读存储介质
6
电脑的智能管理平台图形用户界面
7
用于电脑的查询工程进度的图形用户界面
8
建筑计价程序中项目快速自检方法、系统和计算机可读存储介质
9
带有建筑模型设计图形用户界面显示屏幕面板
10
模板支架排布的处理方法、装置和电子设备
11
分部分项清单页面的显示控制方法、系统和终端设备
12
一种目标材料匹配方法、装置、设备及可读存储介质
13
用于电脑的图形用户界面(造价业务系统)
14
用于电脑的构件工程量查看的图形用户界面
15
基于三维引擎的富文本编辑方法、编辑器及电子设备
16
用于电脑的远程开标系统图形用户界面
17
用于电脑的市政算量软件的图形用户界面
18
用于电脑的电力云计价图形用户界面
19
用于企业计价依据库的图形用户界面的显示屏幕面板
20
建设工程项目的动态成本管控方法、装置及电子设备
全国服务热线:
在线客服
1211389656
咨询
商务合作
85926368
咨询
媒体合作
921888730
咨询
在线客服
客服微信号
品牌网官方客服微信
打开微信扫一扫
客服微信
商务合作微信
商务合作详谈
打开微信扫一扫
商务合作
回到顶部