一种用于语种识别的建模方法及装置

    公开(公告)号:CN101894548A

    公开(公告)日:2010-11-24

    申请号:CN201010207237.9

    申请日:2010-06-23

    Applicant: 清华大学

    Inventor: 何亮 张卫强 刘加

    Abstract: 本发明的实施例提出了一种用于语种识别的建模方法,包括输入语音数据,对语音数据预处理得到特征序列,将特征矢量映射为超矢量,对超矢量进行投影补偿,通过支持向量机算法建立训练语种模型;对待测语音采用上述步骤得到待测超矢量,对待测超矢量进行投影补偿,利用语种模型对所述待测超矢量打分,识别待测语音的语言种类。本发明实施例还提出了一种用于语种识别的建模装置包括语音预处理模块、特征提取模块、多坐标系原点选择模块、特征矢量映射模块、子空间提取模块、子空间投影补偿模块、训练模块和识别模块。根据本发明实施例提供的方法及装置,去除高维统计量中对识别无效的信息,提高语种识别的正确率,降低在集成电路上的运算复杂度。

    基于语种对的鉴别式语种识别模型建立方法

    公开(公告)号:CN101702314A

    公开(公告)日:2010-05-05

    申请号:CN200910235393.3

    申请日:2009-10-13

    Applicant: 清华大学

    Inventor: 张卫强 刘加

    Abstract: 基于语种对的鉴别式语种识别模型建立方法涉及一种用于语种识别的建模方法,其特征在于所述方法首先对语音数据提取特征得到特征矢量,接着采用Baum-Welch算法进行ML训练得到初始GMM模型参数,然后利用GMM模型对特征矢量计算分子项和分母统计量,并对分子统计量进行平滑,由平滑后的分子统计量和分母统计量计算更新系数,最后按更新公式对GMM模型参数进行更新。该建模方法从语种对的局部入手,更能抓住语种间的鉴别性信息,从而获得更好的识别性能。可以用于语种识别模型的鉴别式建模。

    分类精度评价方法、装置、计算机设备和存储介质

    公开(公告)号:CN113052270B

    公开(公告)日:2024-12-24

    申请号:CN202110503779.9

    申请日:2021-05-10

    Abstract: 本申请涉及一种分类精度评价方法、装置、计算机设备和存储介质。所述方法包括:获取有害语音样本集;将有害语音样本集中的每个有害语音样本输入待评价的有害语音分类模型中进行分类,得到预测类别标签;在预设的分类层级中,确定与预测类别标签和有害语音样本的样本类别标签对应的目标分类;根据目标分类计算待评价的有害语音分类模型的分类精确程度。本方案中,对有害语音样本进行了多层次的分类(即分类层级),然后在分类层级中确定预测类别标签和样本类别标签共同所属的目标分类,目标分类可以反映预测类别标签和样本类别标签的匹配度,进而根据目标分类确定分类模型的分类精确程度,能够有效的提高分类模型评价的准确度。

    建筑结构效果图的生成方法、装置和计算机设备

    公开(公告)号:CN118485794A

    公开(公告)日:2024-08-13

    申请号:CN202410787584.5

    申请日:2024-06-18

    Abstract: 本申请涉及一种建筑结构效果图的生成方法、装置和计算机设备。所述方法包括:获取建筑结构的背景信息、图需求信息、建筑信息、和手绘图数据,并通过大语言模型,生成所述建筑信息对应的提示词模板,从而确定所述建筑结构的初始提示词;通过所述大语言模型、以及文生图提示词生成策略,生成所述建筑结构的文生图提示词;识别各所述文生图提示词的质量分数,并筛选大于分数阈值的文生图提示词,作为目标文生图提示词;基于各所述目标文生图提示词、以及所述手绘图数据,生成所述建筑结构的效果图,并调整各所述文生图提示词的质量分数,返回执行上述步骤,得到所述建筑结构的目标效果图。采用本方法能够提升建筑结构效果图的生成效率。

    一种话务质检方法及装置
    15.
    发明授权

    公开(公告)号:CN112580367B

    公开(公告)日:2023-10-27

    申请号:CN202011538859.X

    申请日:2020-12-23

    Abstract: 本发明公开了一种话务质检方法及装置,可以获得客户与客服的通话音频数据,对通话音频数据进行语音识别,获得至少一条对话文本,对话文本包括客户部分文本和客服部分文本,将一条对话文本输入至训练好的语义向量提取器中,获得语义向量提取器输出的客户文本语义向量和客服文本语义向量,将客户文本语义向量和客服文本语义向量进行拼接,获得上下文相关语义向量,将获得的上下文相关语义向量输入至训练好的话务质检模型中,获得话务质检模型输出的一条对话文本的话务质检结果。本发明可以对所有的待检话务工单进行全面质检,有效提高质检效率,避免对质检人员的人力消耗,避免对质检不合格话务工单的遗漏。

    对象识别模型的训练方法、装置和计算机设备

    公开(公告)号:CN115358345A

    公开(公告)日:2022-11-18

    申请号:CN202211102838.2

    申请日:2022-09-09

    Applicant: 清华大学

    Abstract: 本申请涉及一种对象识别模型的训练方法、装置、计算机设备。方法包括:获取训练样本集,基于编码网络对样本组进行编码处理,得到正样本对象对应的第一混合编码、负样本对象对应的第二混合编码和标准混合编码;将混合编码分别输入至特征提取模型中,得到第一对象特征、第二对象特征和标准对象特征;通过特征适配网络、第一对象特征、第二对象特征和标准对象特征,得到第一特征距离和第二特征距离;基于第一特征距离和第二特征距离训练距离判决阈值和特征适配网络,并根据编码网络、特征提取模型、训练后的特征适配网络和距离判决阈值,构建对象识别模型。采用本方法能够提升对象识别的准确度。

    有害语音的识别方法、装置、计算机设备和存储介质

    公开(公告)号:CN113327601A

    公开(公告)日:2021-08-31

    申请号:CN202110579536.3

    申请日:2021-05-26

    Applicant: 清华大学

    Abstract: 本申请涉及一种有害语音的识别方法、装置、计算机设备和存储介质。方法包括:将每一样本语音的置信度与预设阈值组进行比较,确定每一样本语音对应的判断结果,根据每一样本语音对应的判断结果及每一样本语音对应的标注结果,计算预设阈值组对应的代价函数值;对预设阈值组中的预设阈值进行调整,重复上述调整预设阈值及计算代价函数值的过程,确定满足预设条件的代价函数值;根据满足该预设条件的代价函数值所对应的预设阈值组,确定最终的预设阈值组;根据待判别的语音及所述最终的预设阈值组,对所有待判别的语音进行判断。相较于使用单阈值方式对有害语音进行识别,采用双阈值方式更便于对置信度阈值进行调整,进而提高有害语音识别的分类效果。

    一种话务质检方法及装置
    19.
    发明公开

    公开(公告)号:CN112580367A

    公开(公告)日:2021-03-30

    申请号:CN202011538859.X

    申请日:2020-12-23

    Abstract: 本发明公开了一种话务质检方法及装置,可以获得客户与客服的通话音频数据,对通话音频数据进行语音识别,获得至少一条对话文本,对话文本包括客户部分文本和客服部分文本,将一条对话文本输入至训练好的语义向量提取器中,获得语音向量提取器输出的客户文本语义向量和客服文本语义向量,将客户文本语义向量和客服文本语义向量进行拼接,获得上下文相关语义向量,将获得的上下文相关语义向量输入至训练好的话务质检模型中,获得话务质检模型输出的一条对话文本的话务质检结果。本发明可以对所有的待检话务工单进行全面质检,有效提高质检效率,避免对质检人员的人力消耗,避免对质检不合格话务工单的遗漏。

    基于识别模型的识别方法、模型训练方法及装置

    公开(公告)号:CN111539495A

    公开(公告)日:2020-08-14

    申请号:CN202010659647.0

    申请日:2020-07-10

    Abstract: 本公开涉及一种基于识别模型的识别方法、模型训练方法及装置。其中,基于识别模型的识别方法包括识别模型包括特征提取模块,特征提取模块包括多个LSTM单元。识别方法包括:获取待识别特征序列,待识别特征序列包括连续的特征;将多个特征依序分别输入至多个LSTM单元,通过每个LSTM单元得到特征对应的第一隐藏状态;基于多个特征,以及多个特征分别对应的第一隐藏状态,以及特征提取模块的前次输出结果,得到特征提取模块的当前输出结果;基于特征提取模块的当前输出结果,得到识别结果。通过本公开,使得特征提取模块的当前输出结果更加合理、准确。

Patent Agency Ranking