Patent search ap:("中国科学院声学研究所" OR "国家计算机网络与信息安全管理中心") AND inv:"李成章" Page 1

1.

发明授权
文本处理模型训练方法、语音文本处理方法及装置有权

公开(公告)号：CN113420121B

公开(公告)日：2023-07-28

申请号：CN202110704938.1

申请日：2021-06-24

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 周军 , 张震 , 李成章 , 李鹏 , 刘建 , 石瑾 , 刘睿霖 , 颜永红

IPC: G06F16/33 , G06F16/332 , G06F16/951 , G06F18/214

Abstract: 本申请提供了一种文本处理模型训练方法、语音文本处理方法及装置，涉及自然语言处理技术领域。该方法包括：从互联网爬取对话文本，得到正样本；对对话文本中的语句进行变换操作，得到负样本和负样本的第一标签信息；将正样本和负样本对应输入至预先训练的第一文本处理模型中和待训练的第二文本处理模型中，生成第一文本处理模型的目标层的第一特征向量和第二文本处理模型的目标层的第二特征向量；根据第一特征向量、第二特征向量，对第二文本处理模型进行知识蒸馏，得到训练好的第二文本处理模型。根据本申请实施例，能够解决相关技术中对语音文本进行校对效率低、耗时长且计算资源占用大的问题。

2.

发明公开
文本处理模型训练方法、语音文本处理方法及装置有权

公开(公告)号：CN113420121A

公开(公告)日：2021-09-21

申请号：CN202110704938.1

申请日：2021-06-24

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 周军 , 张震 , 李成章 , 李鹏 , 刘建 , 石瑾 , 刘睿霖 , 颜永红

IPC: G06F16/33 , G06F16/332 , G06F16/951 , G06K9/62

Abstract: 本申请提供了一种文本处理模型训练方法、语音文本处理方法及装置，涉及自然语言处理技术领域。该方法包括：从互联网爬取对话文本，得到正样本；对对话文本中的语句进行变换操作，得到负样本和负样本的第一标签信息；将正样本和负样本对应输入至预先训练的第一文本处理模型中和待训练的第二文本处理模型中，生成第一文本处理模型的目标层的第一特征向量和第二文本处理模型的目标层的第二特征向量；根据第一特征向量、第二特征向量，对第二文本处理模型进行知识蒸馏，得到训练好的第二文本处理模型。根据本申请实施例，能够解决相关技术中对语音文本进行校对效率低、耗时长且计算资源占用大的问题。

Patent Agency Ranking