• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
文档图像方向识别方法、装置及模型的训练方法、装置
有效
专利申请进度
申请
2020-03-02
申请公布
2020-06-23
授权
2023-10-10
预估到期
2040-03-02
专利基础信息
申请号 CN202010136041.9 申请日 2020-03-02
申请公布号 CN111325205A 申请公布日 2020-06-23
授权公布号 CN111325205B 授权公告日 2023-10-10
分类号 G06V30/40;G06V30/146;G06V10/774;G06V10/80;G06V30/19
分类 计算;推算;计数;
申请人名称 北京三快在线科技有限公司
申请人地址 北京市海淀区北四环西路9号2106-030
专利法律状态
  • 2023-10-10
    授权
    状态信息
    授权
  • 2020-07-28
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06K9/32;申请日:20200302
  • 2020-06-23
    公布
    状态信息
    公布
摘要
本申请公开了文档图像方向识别方法、装置及模型的训练方法、装置。文档图像识别模型的训练方法包括:根据注意力机制,生成训练图像的注意力裁剪图像和注意力抹除图像,以及分别确定训练图像、注意力裁剪图像以及注意力抹除图像各自的注意力融合特征;根据各注意力融合特征分别识别相应图像的方向,得到相应的识别结果;根据各识别结果计算交叉熵损失值,以及根据各注意力融合特征计算中心损失值,根据交叉熵损失值和中心损失值对文档图像方向识别模型进行参数优化或停止训练。利用注意力裁剪和注意力抹除,让文档图像方向识别模型更容易聚焦至文档图像中有区分度的文字部分特征,并且通过减少类内距离,达到了更好的通用文档图像方向判断效果。