-
公开(公告)号:CN114428850A
公开(公告)日:2022-05-03
申请号:CN202210357952.3
申请日:2022-04-07
Applicant: 之江实验室
IPC: G06F16/335 , G06F16/33 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明属于人工智能领域,涉及一种文本检索匹配方法和系统,该方法包括:步骤一,采集不同领域的中文自然语言推理文本语料,作为句子表征模型的训练语料;步骤二,结合对比学习方法训练句子表征模型,再利用句子语义匹配基准数据集来测试并筛选出最佳句子表征模型;步骤三,使用筛选出的最佳句子表征模式,对要匹配的长短文本中的句子进行相似度计算;步骤四,根据相似度计算的结果,采用Sigmod函数得到句子的匹配分数,来判断是否为相似句子,完成文本检索。本发明根据文本的长度与各类模型的特性,利用最适合的模型架构进行文本检索的任务,解决了文本匹配遇到的缺乏考虑句子之间主题的相似性、模型长度限制等问题,提高了匹配的效果。
-
公开(公告)号:CN113934835B
公开(公告)日:2022-03-25
申请号:CN202111538357.1
申请日:2021-12-16
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/33 , G06F16/335
Abstract: 本发明公开了结合关键词和语义理解表征的检索式回复对话方法及系统,系统结合了两种层次粒度的向量表征,分别是词袋向量表征和语义理解表征,结合过程中不只考虑了对话中关键词的信息,还考虑了基于上下文的语义理解,极大地提升了检索式回复模型的性能。本发明中采取了中文预训练模型Bert网络模型获取句向量表征,不仅理解句意,并且排除了词向量加权引起的误差。该系统采取了Bert网络模型在自己的单轮对话上训练分类任务——对话是否匹配的任务,通过微调,学习到了Bert中线性层和激活函数的权重。该系统使用了精排模型LGMRanker,可以直接预测与query相关的回复相对顺序,返回一个排好序的列表回来。
-
公开(公告)号:CN113611286B
公开(公告)日:2022-01-18
申请号:CN202111169207.8
申请日:2021-10-08
Applicant: 之江实验室
Abstract: 本发明属于人工智能领域,涉及一种基于共性特征提取的跨语种语音情感识别方法和系统,该系统包括:语音信号采集模块,采用高保真单麦克风或者麦克风阵列采集用户语音信号;语音信号预处理模块,用于将采集到的语音信号进行预处理,对语音进行端点检测,去除语音前后静音段,生成可用于神经网络处理的数据;跨语种语音情感识别模块,用于通过设计的复数网络模型处理声谱图特征,预测用户音频的情感类型;分析存储模块,用于存储用户的语音数据和情感标签数据,并根据实际业务进行统计分析。本发明能够有效解决跨语种的语音情感识别问题,解决音频中的相位特征处理问题,从而提取音频中更加精细的发音特征,提升语音情感识别精度。
-
公开(公告)号:CN113611286A
公开(公告)日:2021-11-05
申请号:CN202111169207.8
申请日:2021-10-08
Applicant: 之江实验室
Abstract: 本发明属于人工智能领域,涉及一种基于共性特征提取的跨语种语音情感识别方法和系统,该系统包括:语音信号采集模块,采用高保真单麦克风或者麦克风阵列采集用户语音信号;语音信号预处理模块,用于将采集到的语音信号进行预处理,对语音进行端点检测,去除语音前后静音段,生成可用于神经网络处理的数据;跨语种语音情感识别模块,用于通过设计的复数网络模型处理声谱图特征,预测用户音频的情感类型;分析存储模块,用于存储用户的语音数据和情感标签数据,并根据实际业务进行统计分析。本发明能够有效解决跨语种的语音情感识别问题,解决音频中的相位特征处理问题,从而提取音频中更加精细的发音特征,提升语音情感识别精度。
-
公开(公告)号:CN115827880A
公开(公告)日:2023-03-21
申请号:CN202310126790.7
申请日:2023-02-10
Applicant: 之江实验室
Abstract: 本说明书公开一种基于情感分类的业务执行方法及装置,获取待识别文本,而后,可以通过预先训练的各识别模型,对待识别文本进行情感分类,得到每个识别模型输出的分类结果,并针对每个识别模型,确定该识别模型输出的分类结果与其他识别模型输出的分类结果之间的差异程度,作为该识别模型对应的冲突度量。进而根据各识别模型对应的冲突度量以及待确定的各识别模型对应的权重项,构建非线性函数,最后以非线性函数满足预设条件为优化目标,确定各识别模型对应的权重,并根据各识别模型对应的权重以及各识别模型对应的分类结果,确定综合分类结果,以及根据综合分类结果,进行业务执行,从而提高了情感分类的准确率。
-
公开(公告)号:CN114463688A
公开(公告)日:2022-05-10
申请号:CN202210377011.6
申请日:2022-04-12
Applicant: 之江实验室
Abstract: 本发明公开一种跨模态上下文编码的对话情感识别方法及系统,该方法包括:步骤S1,将多轮对话中每条语句对应的视频模态、音频模态及文本模态信息分别进行编码,得到各语句对应的视觉模态、语音模态及文本模态表征向量序列;步骤S2,将多轮对话的视觉模态表征向量序列、语音模态表征向量序列及文本模态表征向量序列分别进行模态内的上下文编码,得到对话中各语句的单模态上下文编码表征;步骤S3,将对话中各语句的单模态上下文编码表征进行两两组合编码,得到对话中各语句跨模态融合的上下文编码;步骤S4,将跨模态融合的上下文编码表征进行自适应的信息汇总,并对语句的情感类别进行判断。本发明能够有效提升对话情感的识别精度。
-
公开(公告)号:CN114428850B
公开(公告)日:2022-08-05
申请号:CN202210357952.3
申请日:2022-04-07
Applicant: 之江实验室
IPC: G06F16/335 , G06F16/33 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明属于人工智能领域,涉及一种文本检索匹配方法和系统,该方法包括:步骤一,采集不同领域的中文自然语言推理文本语料,作为句子表征模型的训练语料;步骤二,结合对比学习方法训练句子表征模型,再利用句子语义匹配基准数据集来测试并筛选出最佳句子表征模型;步骤三,使用筛选出的最佳句子表征模式,对要匹配的长短文本中的句子进行相似度计算;步骤四,根据相似度计算的结果,采用Sigmod函数得到句子的匹配分数,来判断是否为相似句子,完成文本检索。本发明根据文本的长度与各类模型的特性,利用最适合的模型架构进行文本检索的任务,解决了文本匹配遇到的缺乏考虑句子之间主题的相似性、模型长度限制等问题,提高了匹配的效果。
-
公开(公告)号:CN113934835A
公开(公告)日:2022-01-14
申请号:CN202111538357.1
申请日:2021-12-16
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/33 , G06F16/335
Abstract: 本发明公开了结合关键词和语义理解表征的检索式回复对话方法及系统,系统结合了两种层次粒度的向量表征,分别是词袋向量表征和语义理解表征,结合过程中不只考虑了对话中关键词的信息,还考虑了基于上下文的语义理解,极大地提升了检索式回复模型的性能。本发明中采取了中文预训练模型Bert网络模型获取句向量表征,不仅理解句意,并且排除了词向量加权引起的误差。该系统采取了Bert网络模型在自己的单轮对话上训练分类任务——对话是否匹配的任务,通过微调,学习到了Bert中线性层和激活函数的权重。该系统使用了精排模型LGMRanker,可以直接预测与query相关的回复相对顺序,返回一个排好序的列表回来。
-
公开(公告)号:CN115827880B
公开(公告)日:2023-05-16
申请号:CN202310126790.7
申请日:2023-02-10
Applicant: 之江实验室
Abstract: 本说明书公开一种基于情感分类的业务执行方法及装置,获取待识别文本,而后,可以通过预先训练的各识别模型,对待识别文本进行情感分类,得到每个识别模型输出的分类结果,并针对每个识别模型,确定该识别模型输出的分类结果与其他识别模型输出的分类结果之间的差异程度,作为该识别模型对应的冲突度量。进而根据各识别模型对应的冲突度量以及待确定的各识别模型对应的权重项,构建非线性函数,最后以非线性函数满足预设条件为优化目标,确定各识别模型对应的权重,并根据各识别模型对应的权重以及各识别模型对应的分类结果,确定综合分类结果,以及根据综合分类结果,进行业务执行,从而提高了情感分类的准确率。
-
-
-
-
-
-
-
-