• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
确定互译文本及文本间相似度分析方法、装置及设备
有效
专利申请进度
申请
2018-08-17
申请公布
2020-03-06
授权
2024-03-01
预估到期
2038-08-17
专利基础信息
申请号 CN201810942172.9 申请日 2018-08-17
申请公布号 CN110866407A 申请公布日 2020-03-06
授权公布号 CN110866407B 授权公告日 2024-03-01
分类号 G06F40/58;G06F40/216;G06F40/194
分类 计算;推算;计数;
申请人名称 阿里巴巴集团控股有限公司
申请人地址 英属开曼群岛大开曼资本大厦一座四层847号邮箱
专利法律状态
  • 2024-03-01
    授权
    状态信息
    授权
  • 2020-03-31
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06F40/58;申请日:20180817
  • 2020-03-06
    公布
    状态信息
    公布
摘要
本公开提出了一种确定互译文本及文本间相似度分析方法、装置及设备。获取第一文本集合和第二文本集合,第一文本集合使用第一语言编写且被翻译为第二语言,第二文本集合使用第二语言编写,第一文本集合和第二文本集合均包括多个文本,文本中包括多个字或词;分别以第一文本集合中的各个字或词为键,以字或词所在文本的文本标识符为值,构建第一索引;分别以第二文本集合中的各个字或词为键,以字或词所在文本的文本标识符为值,构建第二索引;将第一索引和第二索引中对应于相同键的文本标识符互相组成文本对,并统计各个文本对的出现次数;以及基于文本对的出现次数,确定属于互译关系的文本。由此,可以减少计算量,提高互译文本的识别效率。