• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种网络恶意爬虫识别方法、系统、终端及存储介质
有效
专利申请进度
申请
2020-07-15
申请公布
2020-10-30
授权
2021-10-15
预估到期
2040-07-15
专利基础信息
申请号 CN202010678053.4 申请日 2020-07-15
申请公布号 CN111859069A 申请公布日 2020-10-30
授权公布号 CN111859069B 授权公告日 2021-10-15
分类号 G06F16/951;G06K9/62;G06N20/00
分类 计算;推算;计数;
申请人名称 北京市燃气集团有限责任公司
申请人地址 北京市西城区西直门南小街22号
专利法律状态
  • 2021-10-15
    授权
    状态信息
    授权
  • 2020-11-17
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06F16/951;申请日:20200715
  • 2020-10-30
    公布
    状态信息
    公布
摘要
本申请所提供的一种网络恶意爬虫识别方法、系统、终端及存储介质,所述方法包括:获取待检测网络地址及待检测网络地址对应的用户访问信息;根据所述用户访问信息提取访问源地址及访问特征;以访问源地址作为分组进行类别聚合,提取预设访问时间段内的特定访问源地址的访问特征,并利用DBSCAN算法训练无监督聚类机器学习模型,进行异常爬取账单识别;通过人工判定方式对异常爬取账单进行恶意账单爬虫识别;获取标记的恶意账单爬虫的访问源地址及访问特征,并利用XGBoost算法训练有监督机器学习模型,进行恶意账单爬虫的访问源地址识别;从而实现相同行为的访问源地址会自动进行恶意爬虫识别。