首页
品牌
排行
问答
专题
特惠
资讯
展会
百科
热门行业
装修建材
家居生活
餐饮食品
母婴教育
电脑办公
服装首饰
汽车工具
家电数码
机械化工
休闲美容
热门行业
教育培训
板材
地板
涂料
家纺
集成吊顶
美缝剂
木门
硅藻泥
管材
指纹锁
橱柜
衣柜
床垫
电热水器
集成灶
暖气片
净水器
酒店
卫浴
装修建材
卫浴洁具
板材
地板
建筑陶瓷
天花板
涂料
瓷砖泥瓦
水电管材
火锅
快餐
生活用品
软装
装饰装潢
灯具
家纺
干洗服务
内衣
男装
女装
幼教
整体卫浴
地板砖
阻燃板
铝材
集成吊顶
美缝剂
硅藻泥
管材
烤鱼
汉堡
叶酸
婴儿用品
婴儿床
指纹锁
品牌首页
品牌资讯
企业信息
商标信息
专利信息
返回上一页
专利状态
基于强化学习的推荐方法、装置、终端以及存储介质
有效
专利申请进度
申请
2019-12-05
申请公布
2020-10-30
授权
2021-08-31
预估到期
2039-12-05
专利基础信息
申请号
CN201911236964.5
申请日
2019-12-05
申请公布号
CN111859099A
申请公布日
2020-10-30
授权公布号
CN111859099B
授权公告日
2021-08-31
分类号
G06F16/9535;G06N20/00
分类
计算;推算;计数;
申请人名称
马上消费金融股份有限公司
申请人地址
重庆市渝北区黄山大道中段52号渝兴广场B2栋4至8楼
专利法律状态
2021-08-31
授权
状态信息
授权
2020-11-17
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F16/9535;申请日:20191205
2020-10-30
公布
状态信息
公布
摘要
本发明公开了一种基于强化学习的推荐方法及装置,包括:利用双核心Q‑learning强化学习模型更新在线Q值表的上一次推荐动作对应的累积收益值,其中,双核心Q‑learning强化学习模型包括在线Q值表和探索Q值表;判断上一次推荐意图的推荐类型是否为探索动作推荐类型;若是,则利用双核心Q‑learning强化学习模型更新探索Q值表的累积收益值;根据更新后的在线Q值表及预设规则得到本次推荐意图,并将本次推荐意图进行推荐,通过上述步骤,本发明提供的推荐方法能在不依赖用户个性化特征的情况下,作为智能推荐应用的兜底方案或平台型推荐服务的启动方案。
更多专利
1
一种数据评测、模型训练方法、装置、设备及存储介质
2
质检文件的方法、装置及服务器
3
语音转换方法、装置及服务器
4
微服务灰度发布方法及装置
5
数据库的切换方法、装置、设备及计算机可读存储介质
6
一种信息处理方法、装置、设备、系统及可读存储介质
7
结构化查询语言的处理方法及相关装置
8
一种数据处理方法、装置、计算机设备及存储介质
9
一种数据抽取方法及设备和相关装置
10
地理围栏的地址编码确定方法、位置确定方法及装置
11
信息处理方法、装置、设备和可读存储介质
12
问答匹配方法、文本匹配模型的训练方法和相关设备
13
特征融合模型的训练、文本处理方法及装置
14
一种数据处理方法、应用画像方法及装置
15
一种扣款指令发起方法及装置
16
动画效果的实现方法、装置及计算机可读存储介质
17
一种图像检测方法、身份验证方法、支付方法及装置
18
标点预测模型的训练方法、标点添加方法及装置
19
信息推荐方法、模型训练方法及相关设备
20
一种代码生成方法及代码生成装置
全国服务热线:
在线客服
1211389656
咨询
商务合作
85926368
咨询
媒体合作
921888730
咨询
在线客服
客服微信号
品牌网官方客服微信
打开微信扫一扫
客服微信
商务合作微信
商务合作详谈
打开微信扫一扫
商务合作
回到顶部