• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种基于关键词的产品分类方法
有效
专利申请进度
申请
2020-04-15
申请公布
2020-08-04
授权
2022-07-22
预估到期
2040-04-15
专利基础信息
申请号 CN202010295098.3 申请日 2020-04-15
申请公布号 CN111488459A 申请公布日 2020-08-04
授权公布号 CN111488459B 授权公告日 2022-07-22
分类号 G06F16/35;G06F16/33;G06N3/04;G06N3/08;G06K9/62
分类 计算;推算;计数;
申请人名称 焦点科技股份有限公司
申请人地址 江苏省南京市高新开发区星火路软件大厦A座12F
专利法律状态
  • 2022-07-22
    授权
    状态信息
    授权
  • 2020-08-04
    公布
    状态信息
    公布
摘要
本发明公开了一种基于关键词的产品分类方法,包括如下步骤:步骤一:准备训练集,从训练集中提取产品数据,标注产品数据的目录码,形成样本;步骤二:产品数据的预处理,所述预处理包括噪声样本过滤、词形变换、平衡样本;步骤三:采用预训练语言模型Bert搭建产品分类模型;步骤四:加载并微调预训练语言模型Bert;步骤五:基于语言模型Bert,预测产品的目录码。通过有监督的深度学习,能够克服关键词检索匹配技术的局限,智能解决具有相同关键词但所属不同类别、同一类别内有不同关键词的产品分类、细粒度产品目录分类较难等难题,达到同时采用多种数据预处理方案克服深度学习中样本不平衡、同义异形、标签错误等噪声干扰的效果。