首页
品牌
排行
问答
专题
特惠
资讯
展会
百科
热门行业
装修建材
家居生活
餐饮食品
母婴教育
电脑办公
服装首饰
汽车工具
家电数码
机械化工
休闲美容
热门行业
教育培训
板材
地板
涂料
家纺
集成吊顶
美缝剂
木门
硅藻泥
管材
指纹锁
橱柜
衣柜
床垫
电热水器
集成灶
暖气片
净水器
酒店
卫浴
装修建材
卫浴洁具
板材
地板
建筑陶瓷
天花板
涂料
瓷砖泥瓦
水电管材
火锅
快餐
生活用品
软装
装饰装潢
灯具
家纺
干洗服务
内衣
男装
女装
幼教
整体卫浴
地板砖
阻燃板
铝材
集成吊顶
美缝剂
硅藻泥
管材
烤鱼
汉堡
叶酸
婴儿用品
婴儿床
指纹锁
品牌首页
品牌资讯
企业信息
商标信息
专利信息
返回上一页
专利状态
一种基于B2B平台的多线程数据抓取方法
有效
专利申请进度
申请
2016-04-28
申请公布
2016-08-17
授权
2019-05-03
预估到期
2036-04-28
专利基础信息
申请号
CN201610272886.4
申请日
2016-04-28
申请公布号
CN105868412A
申请公布日
2016-08-17
授权公布号
CN105868412B
授权公告日
2019-05-03
分类号
G06F16/9535
分类
计算;推算;计数;
申请人名称
焦点科技股份有限公司
申请人地址
江苏省南京市高新技术产业开发区星火路软件大厦A座8-12F
专利法律状态
2019-05-03
授权
状态信息
授权
2016-09-14
实质审查的生效
状态信息
实质审查的生效IPC(主分类):G06F 17/30申请日:20160428
2016-08-17
公布
状态信息
公开
摘要
本发明公开了一种基于B2B平台的多线程数据抓取方法,1)将B2B平台的首页、多级类型目录结构作为目标对象,对网页源文件进行分析;2)在URL处理器中分析出需要的目标规则;3)通过HTTP解析器,从隧道协议中获取一定格式的数据;4)对每次URL请求分配新的线程,通过多线程模式并发处理;5)通过分类管理器进行管理每一种商品大类到小类的规则;6)对该线程超时的设置;7)根据所述固定格式数据,将所有提取的商品数据内容保存至数据库;本发明提供的基于B2B平台的多线程数据抓取方法,在大数据并发实时采集、多线程数据抓取上有显著的效果。
更多专利
1
一种基于抽样的分布式搜索结果合并翻页方法及系统
2
一种B2B平台分布式应用调度与资源分配方法
3
一种基于机器学习的销售系统客户匹配方法
4
一种CDH自动化自动安装的方法
5
基于分布式的B2B平台的个性化推荐方法与系统
6
一种基于网站用户访问路径的流量预警方法
7
一种去除特定字符串水印的方法及系统
8
一种实现HDFS文件占用率自动监控的方法及系统
9
一种优化Hbase大数据查询的方法
10
一种组合文字和图片信息的网络资讯批量采集方法
11
一种深度多维度流量语义分析方法
12
一种基于容器的服务多版本共存实现方法
13
一种中文短文本聚类方法
14
一种诊断Oracle数据库大事务和热点事务的方法
15
一种跨机房的数据同步方法及系统
16
一种纠错重启以及自动判断启动的ETL调度系统及方法
17
一种快速实施的网站内专题模块引流效果展示方法
18
基于关系表的可配置信息抽取方法
19
一种日志文件的异常检测与处理的方法与装置
20
基于JMX的定制化实时监控及自动化异常处理的系统及方法
全国服务热线:
在线客服
1211389656
咨询
商务合作
85926368
咨询
媒体合作
921888730
咨询
在线客服
客服微信号
品牌网官方客服微信
打开微信扫一扫
客服微信
商务合作微信
商务合作详谈
打开微信扫一扫
商务合作
回到顶部