• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
车辆行驶决策模型的训练方法、行驶决策确定方法及装置
有效
专利申请进度
申请
2019-12-23
申请公布
2020-04-14
授权
2023-04-28
预估到期
2039-12-23
专利基础信息
申请号 CN201911338944.9 申请日 2019-12-23
申请公布号 CN111007858A 申请公布日 2020-04-14
授权公布号 CN111007858B 授权公告日 2023-04-28
分类号 G05D1/02
分类 控制;调节;
申请人名称 北京三快在线科技有限公司
申请人地址 北京市海淀区北四环西路9号2106-030
专利法律状态
  • 2023-04-28
    授权
    状态信息
    授权
  • 2020-04-14
    公布
    状态信息
    公布
摘要
本说明书公开了车辆行驶决策模型的训练方法、行驶决策确定方法及装置。本说明书实施例中的方法及装置,在训练决策模型的过程中,根据当前时刻的各信息得出当前时刻的额外奖励。额外奖励区别于一般奖励,该额外奖励是根据历史上的至少部分观测特征得到的。额外奖励与当前观测特征与预存的历史观测特征的可达性负相关。则训练后的决策模型更加关注历史上未被训练到的观测特征,能够对输入决策模型的数据进行更加全面的处理,也能够降低决策模型对历史上已经被训练到的观测特征的关注程度,提高决策模型的训练效率。此外,即使在某一方面的信息有限的情况下,通过训练后的决策模型也能够敏感的识别出该方面的信息并将其作为确定行驶决策的依据。