首页
品牌
排行
问答
专题
特惠
资讯
展会
百科
热门行业
装修建材
家居生活
餐饮食品
母婴教育
电脑办公
服装首饰
汽车工具
家电数码
机械化工
休闲美容
热门行业
教育培训
板材
地板
涂料
家纺
集成吊顶
美缝剂
木门
硅藻泥
管材
指纹锁
橱柜
衣柜
床垫
电热水器
集成灶
暖气片
净水器
酒店
卫浴
装修建材
卫浴洁具
板材
地板
建筑陶瓷
天花板
涂料
瓷砖泥瓦
水电管材
火锅
快餐
生活用品
软装
装饰装潢
灯具
家纺
干洗服务
内衣
男装
女装
幼教
整体卫浴
地板砖
阻燃板
铝材
集成吊顶
美缝剂
硅藻泥
管材
烤鱼
汉堡
叶酸
婴儿用品
婴儿床
指纹锁
品牌首页
品牌资讯
企业信息
商标信息
专利信息
返回上一页
专利状态
车辆行驶决策模型的训练方法、行驶决策确定方法及装置
有效
专利申请进度
申请
2019-12-23
申请公布
2020-04-14
授权
2023-04-28
预估到期
2039-12-23
专利基础信息
申请号
CN201911338944.9
申请日
2019-12-23
申请公布号
CN111007858A
申请公布日
2020-04-14
授权公布号
CN111007858B
授权公告日
2023-04-28
分类号
G05D1/02
分类
控制;调节;
申请人名称
北京三快在线科技有限公司
申请人地址
北京市海淀区北四环西路9号2106-030
专利法律状态
2023-04-28
授权
状态信息
授权
2020-04-14
公布
状态信息
公布
摘要
本说明书公开了车辆行驶决策模型的训练方法、行驶决策确定方法及装置。本说明书实施例中的方法及装置,在训练决策模型的过程中,根据当前时刻的各信息得出当前时刻的额外奖励。额外奖励区别于一般奖励,该额外奖励是根据历史上的至少部分观测特征得到的。额外奖励与当前观测特征与预存的历史观测特征的可达性负相关。则训练后的决策模型更加关注历史上未被训练到的观测特征,能够对输入决策模型的数据进行更加全面的处理,也能够降低决策模型对历史上已经被训练到的观测特征的关注程度,提高决策模型的训练效率。此外,即使在某一方面的信息有限的情况下,通过训练后的决策模型也能够敏感的识别出该方面的信息并将其作为确定行驶决策的依据。
更多专利
1
一种图像处理方法及装置
2
接口调用方法、接口对接配置方法、装置、设备及介质
3
一种标识图像差异的方法及装置
4
订单调度方法、装置、存储介质和电子设备
5
螺旋桨及旋翼飞行器
6
一种无人设备的控制方法及装置
7
用于与用户交互及显示业务信息的带有显示屏的终端
8
实例组创建方法、装置、服务器及存储介质
9
一种模型训练、任务执行的方法及装置
10
商家评论管理系统、方法、服务器及存储介质
11
项目功能扩展方法、装置、电子设备和计算机可读介质
12
货物存取设备、货物存放的方法和货物取出的方法
13
资源调度方法、装置、服务器及存储介质
14
文本处理方法、装置、设备以及存储介质
15
上下位关系获取方法、装置、电子设备及存储介质
16
一种行驶轨迹的修复方法及修复装置
17
一种视觉惯性里程计VIO系统的初始化方法、装置
18
位置检测方法、装置、电子设备和计算机可读介质
19
用于与用户交互及显示业务信息的带有显示屏的终端
20
基于维度切片的变量分类方法、装置、设备及介质
全国服务热线:
在线客服
1211389656
咨询
商务合作
85926368
咨询
媒体合作
921888730
咨询
在线客服
客服微信号
品牌网官方客服微信
打开微信扫一扫
客服微信
商务合作微信
商务合作详谈
打开微信扫一扫
商务合作
回到顶部