-
公开(公告)号:CN108846138B
公开(公告)日:2022-06-07
申请号:CN201810750564.5
申请日:2018-07-10
Applicant: 苏州大学
Abstract: 本发明实施例公开了一种融合答案信息的问题分类模型构建方法、装置和计算机可读存储介质,获取待处理问题所对应的候选答案;每个待处理问题对应的候选答案个数往往为多个;依据各待处理问题和相应的候选答案之间的相关度,构建问题‑答案语料库;在该语料库中,每个问题有其对应的一个答案。按照预设的融合规则,将问题‑答案语料库中的每个待处理问题及其对应的答案进行融合处理,得到相应的融合结果;利用融合结果对初始问题分类模型进行训练,以得到问题分类模型。由于融合结果中包含有答案的特征信息,克服了现有技术中仅从问题本身出发,特征不丰富的问题。利用融合结果对初始问题分类模型进行训练时,可以有效提升问题分类模型的精度。
-
公开(公告)号:CN108846138A
公开(公告)日:2018-11-20
申请号:CN201810750564.5
申请日:2018-07-10
Applicant: 苏州大学
Abstract: 本发明实施例公开了一种融合答案信息的问题分类模型构建方法、装置和计算机可读存储介质,获取待处理问题所对应的候选答案;每个待处理问题对应的候选答案个数往往为多个;依据各待处理问题和相应的候选答案之间的相关度,构建问题-答案语料库;在该语料库中,每个问题有其对应的一个答案。按照预设的融合规则,将问题-答案语料库中的每个待处理问题及其对应的答案进行融合处理,得到相应的融合结果;利用融合结果对初始问题分类模型进行训练,以得到问题分类模型。由于融合结果中包含有答案的特征信息,克服了现有技术中仅从问题本身出发,特征不丰富的问题。利用融合结果对初始问题分类模型进行训练时,可以有效提升问题分类模型的精度。
-
公开(公告)号:CN110110088B
公开(公告)日:2023-11-24
申请号:CN201910412742.8
申请日:2019-05-17
Applicant: 苏州大学
IPC: G06F16/35
Abstract: 本申请公开了一种文本分类的方法,包括:接收输入的分类语料;利用分类语料构建多组句对语料;利用分类语料训练预设神经网络,得到文本分类模型;基于文本分类模型的特征抽取网络构建双输入二分类模型,并利用句对语料对双输入二分类模型进行训练;当双输入二分类模型训练完成后,利用双输入二分类模型对文本分类模型的特征抽取网络进行优化,并利用优化后的文本分类模型对待分类文本进行文本分类。本申请令文本分类模型能更可靠地抽取文本的深层语义特征,进一步提升了文本分类性能,解决了现有技术中基于神经网络的分类难以进一步优化特征抽取网络的问题。本申请同时还提供了一种文本分类的系统、设备及计算机可读存储介质,具有上述有益效果。
-
公开(公告)号:CN110110088A
公开(公告)日:2019-08-09
申请号:CN201910412742.8
申请日:2019-05-17
Applicant: 苏州大学
IPC: G06F16/35
Abstract: 本申请公开了一种文本分类的方法,包括:接收输入的分类语料;利用分类语料构建多组句对语料;利用分类语料训练预设神经网络,得到文本分类模型;基于文本分类模型的特征抽取网络构建双输入二分类模型,并利用句对语料对双输入二分类模型进行训练;当双输入二分类模型训练完成后,利用双输入二分类模型对文本分类模型的特征抽取网络进行优化,并利用优化后的文本分类模型对待分类文本进行文本分类。本申请令文本分类模型能更可靠地抽取文本的深层语义特征,进一步提升了文本分类性能,解决了现有技术中基于神经网络的分类难以进一步优化特征抽取网络的问题。本申请同时还提供了一种文本分类的系统、设备及计算机可读存储介质,具有上述有益效果。
-
公开(公告)号:CN109871448B
公开(公告)日:2023-08-15
申请号:CN201910191018.7
申请日:2019-03-12
Applicant: 苏州大学
IPC: G06F16/35 , G06F16/31 , G06N3/0464
Abstract: 本发明提供一种短文本分类的方法及系统,该方法为:对待分类短文本进行文本处理得到文本向量矩阵。基于卷积神经网络对文本向量矩阵进行特征抽取,得到多个不同角度对应的多维卷积特征,并对每一多维卷积特征进行压缩处理得到每一多维卷积特征对应的一维精要特征。针对每一一维精要特征,计算每一一维精要特征的权重值。针对每一多维卷积特征,基于一维精要特征对应的权重值,对多维卷积特征进行加权,利用得到的自适应的卷积特征确定待分类短文本的类别。在本方案中,通过从不同角度提取短文本的多维卷积特征,并计算不同角度的多维卷积特征在短文本中的权重。基于该权重计算得到用于确定短文本类别的自适应的卷积特征,提高短文本分类的准确度。
-
公开(公告)号:CN109871448A
公开(公告)日:2019-06-11
申请号:CN201910191018.7
申请日:2019-03-12
Applicant: 苏州大学
Abstract: 本发明提供一种短文本分类的方法及系统,该方法为:对待分类短文本进行文本处理得到文本向量矩阵。基于卷积神经网络对文本向量矩阵进行特征抽取,得到多个不同角度对应的多维卷积特征,并对每一多维卷积特征进行压缩处理得到每一多维卷积特征对应的一维精要特征。针对每一一维精要特征,计算每一一维精要特征的权重值。针对每一多维卷积特征,基于一维精要特征对应的权重值,对多维卷积特征进行加权,利用得到的自适应的卷积特征确定待分类短文本的类别。在本方案中,通过从不同角度提取短文本的多维卷积特征,并计算不同角度的多维卷积特征在短文本中的权重。基于该权重计算得到用于确定短文本类别的自适应的卷积特征,提高短文本分类的准确度。
-
-
-
-
-