• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
基于预训练语言模型的任务处理方法、装置、设备及介质
有效
专利申请进度
申请
2023-10-12
申请公布
2023-12-12
授权
2024-02-02
预估到期
2043-10-12
专利基础信息
申请号 CN202311321072.1 申请日 2023-10-12
申请公布号 CN117217201A 申请公布日 2023-12-12
授权公布号 CN117217201B 授权公告日 2024-02-02
分类号 G06F40/20;G06F40/30;G06F40/58;G06F16/35;G06N3/092;G06N3/0442;G06F18/214
分类 计算;推算;计数;
申请人名称 北京声智科技有限公司
申请人地址 北京市海淀区北清路81号院一区1号楼6层601
专利法律状态
  • 2024-02-02
    授权
    状态信息
    授权
  • 2023-12-12
    公布
    状态信息
    公布
摘要
本申请公开了一种基于预训练语言模型的任务处理方法、装置、设备及介质,属于自然语言处理领域。本申请基于模块化的大模型来来执行NLP任务。详细来说,大模型采用模块化设计,包括多个功能模块,每个功能模块负责处理特定任务或具有特定功能,且不同功能模块之间共享知识。这种模块化设计不但使得模型具有更好的灵活性和扩展性,而且还有助于降低计算资源需求和能源消耗。另外,本申请还引入了模块激活门控机制,利用该机制能够控制每个功能模块的激活状态,即针对当前NLP任务,仅激活与当前NLP任务相关的功能模块,而关闭与当前任务无关的功能模块,进一步降低了计算资源需求和能源消耗,进而提高了模型在执行NLP任务时的执行效率。