• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
基于强化学习的推荐方法、装置、终端以及存储介质
有效
专利申请进度
申请
2019-12-05
申请公布
2020-10-30
授权
2021-08-31
预估到期
2039-12-05
专利基础信息
申请号 CN201911236964.5 申请日 2019-12-05
申请公布号 CN111859099A 申请公布日 2020-10-30
授权公布号 CN111859099B 授权公告日 2021-08-31
分类号 G06F16/9535;G06N20/00
分类 计算;推算;计数;
申请人名称 马上消费金融股份有限公司
申请人地址 重庆市渝北区黄山大道中段52号渝兴广场B2栋4至8楼
专利法律状态
  • 2021-08-31
    授权
    状态信息
    授权
  • 2020-11-17
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06F16/9535;申请日:20191205
  • 2020-10-30
    公布
    状态信息
    公布
摘要
本发明公开了一种基于强化学习的推荐方法及装置,包括:利用双核心Q‑learning强化学习模型更新在线Q值表的上一次推荐动作对应的累积收益值,其中,双核心Q‑learning强化学习模型包括在线Q值表和探索Q值表;判断上一次推荐意图的推荐类型是否为探索动作推荐类型;若是,则利用双核心Q‑learning强化学习模型更新探索Q值表的累积收益值;根据更新后的在线Q值表及预设规则得到本次推荐意图,并将本次推荐意图进行推荐,通过上述步骤,本发明提供的推荐方法能在不依赖用户个性化特征的情况下,作为智能推荐应用的兜底方案或平台型推荐服务的启动方案。