• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种用于聊天机器人的数据处理方法及装置
有效
专利申请进度
申请
2018-04-28
申请公布
2018-10-26
授权
2023-12-01
预估到期
2038-04-28
专利基础信息
申请号 CN201810399933.0 申请日 2018-04-28
申请公布号 CN108710647A 申请公布日 2018-10-26
授权公布号 CN108710647B 授权公告日 2023-12-01
分类号 G06F16/332;G06F40/289;G06Q30/015
分类 计算;推算;计数;
申请人名称 苏宁易购集团股份有限公司
申请人地址 江苏省南京市玄武区苏宁大道1号
专利法律状态
  • 2023-12-01
    授权
    状态信息
    授权
  • 2019-11-29
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06F17/30;申请日:20180428
  • 2018-10-26
    公布
    状态信息
    公布
摘要
本发明实施例公开了一种用于聊天机器人的数据处理方法及装置,涉及大数据技术领域,能够扩大聊天机器人的应用范围。本发明包括:从对话的历史数据中提取语句,并剔除所提取语句中的标点和表情字符,其中,所提取语句包括至少一个问答对,问答对包括了至少一个问题和与所述至少一个问题对应的答案;根据预设的黑名单,过滤所述所提取语句中的字符,所述黑名单中记录了至少1个字符;对所述所提取语句进行切词处理,并将切词处理所得的字符中出现频率低于阈值的,转换为预设字符;利用切词处理后的语句作为训练集,训练深度学习模型。