游戏智能体训练的优化方法、装置、终端设备与存储介质

热门行业
装修建材
家居生活
餐饮食品
母婴教育
电脑办公
服装首饰
汽车工具
家电数码
机械化工
休闲美容

热门行业

教育培训
板材
地板
涂料
家纺
集成吊顶
美缝剂
木门
硅藻泥
管材
指纹锁
橱柜
衣柜
床垫
电热水器
集成灶
暖气片
净水器
酒店
卫浴

返回上一页

专利状态

游戏智能体训练的优化方法、装置、终端设备与存储介质

有效

专利申请进度

申请

2018-12-06

申请公布

2019-04-23

授权

2022-03-25

预估到期

2038-12-06

专利基础信息

申请号	CN201811492348.1	申请日	2018-12-06
申请公布号	CN109663359A	申请公布日	2019-04-23
授权公布号	CN109663359B	授权公告日	2022-03-25
分类号	A63F13/67;G06N3/04;G06N3/08
分类	运动；游戏；娱乐活动;
申请人名称	广州多益网络股份有限公司
申请人地址	广东省广州市黄埔区伴河路90号

专利法律状态

2022-03-25

授权

状态信息

授权
2019-04-23

公布

状态信息

公布

摘要

本发明公开了一种游戏智能体训练的优化方法、装置、终端设备与存储介质，包括：根据游戏脚本获取第一观测序列，并设为当前观测序列；基于预先训练的自编码网络，根据当前观测序列获得下一观测序列和当前环境回报；基于预先训练的自编码网络和预先训练的预测网络，根据当前观测序列和下一观测序列获取当前自我驱动回报；将当前环境回报和当前自我驱动回报加入到累积回报中，并判断累积回报是否小于目标值；如果累积回报小于目标值，则将下一观测序列作为当前观测序列继续训练，直至累积回报达到目标值停止训练。本发明能够使游戏智能体获得额外的自我驱动回报进行训练，从而提高训练效率，节省运行资源。

更多专利

全国服务热线：

在线客服

1211389656 咨询

商务合作

85926368 咨询

媒体合作

921888730 咨询

在线客服
客服微信号

品牌网官方客服微信

打开微信扫一扫

客服微信
商务合作微信

商务合作详谈

打开微信扫一扫

商务合作
回到顶部

在线客服

商务合作

媒体合作

客服微信号

商务合作微信