• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
多模型知识蒸馏方法及装置、电子设备和存储介质
有效
专利申请进度
申请
2018-08-17
申请公布
2020-02-25
授权
2023-04-07
预估到期
2038-08-17
专利基础信息
申请号 CN201810940904.0 申请日 2018-08-17
申请公布号 CN110837761A 申请公布日 2020-02-25
授权公布号 CN110837761B 授权公告日 2023-04-07
分类号 G06V20/58;G06V10/774;G06V10/764;G06V10/771;G06V10/778;G06V10/82;G06N3/042;G06N3/084;G06N5/022
分类 计算;推算;计数;
申请人名称 北京市商汤科技开发有限公司
申请人地址 北京市海淀区中关村东路1号院3号楼7层710-712房间
专利法律状态
  • 2023-04-07
    授权
    状态信息
    授权
  • 2020-02-25
    公布
    状态信息
    公布
摘要
本公开涉及一种多模型知识蒸馏方法及装置、电子设备和存储介质,所述方法包括:提取训练图像的特征得到训练数据;将所述训练数据输入教师模型所包括的多个子模型进行运算,根据所述多个子模型输出的子特征得到所述教师模型输出的第一特征;将所述训练数据输入学生模型进行运算,得到所述学生模型输出的第二特征;根据所述第一特征和所述第二特征确定所述学生模型的损失函数;根据所述损失函数对所述学生模型进行反向传播。本公开实施例利用教师模型中的多个子模型,可以得到训练数据中的不同特征表示,学生模型可以利用知识蒸馏的方式学习到教师模型中的特征,克服单个模型表达能力有限的问题,提高学生模型的模型精度。