• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
文本分词处理方法及其装置、设备与介质
有效
专利申请进度
申请
2021-09-28
申请公布
2021-12-24
授权
2023-07-18
预估到期
2041-09-28
专利基础信息
申请号 CN202111140912.5 申请日 2021-09-28
申请公布号 CN113836917A 申请公布日 2021-12-24
授权公布号 CN113836917B 授权公告日 2023-07-18
分类号 G06F40/289;G06F40/242
分类 计算;推算;计数;
申请人名称 广州华多网络科技有限公司
申请人地址 广东省广州市番禺区南村镇万达广场B1栋24层
专利法律状态
  • 2023-07-18
    授权
    状态信息
    授权
  • 2022-01-11
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06F40/289;申请日:20210928
  • 2021-12-24
    公布
    状态信息
    公布
摘要
本申请公开一种文本分词处理方法及其装置、设备与介质,所述方法包括:获取待分词文本,所述待分词文本包括相串接的多个疑似词,所述疑似词由表音字符构成;顺序遍历所述待分词文本中的所有字符,在遍历过程中,忽略所述疑似词中因连续重复形成的冗余字符,将其转换为词典树状图中的单词顺序添加至结果列表中,所述词典树状图包括自其根节点出发并分别到达不同末端节点的多条路径,每条路径所经过的节点按序储存单个所述的单词的各个字符;按序输出所述结果列表中的单词作为分词结果。本申请的切词器依照树状图进行分词处理,可在分词过程中处理非正常的重复字符,以忽略待分词文本中冗余的字符,具有较高地准确性,精确地提取出文本蕴含的单词。