-
公开(公告)号:CN109101494A
公开(公告)日:2018-12-28
申请号:CN201810909436.0
申请日:2018-08-10
Applicant: 哈尔滨工业大学(威海)
IPC: G06F17/27
Abstract: 本发明提供一种用于中文句子语义相似度计算的方法,设备以及计算机可读存储介质,对字级别词向量进行预训练;基于句子语义相似度训练集表示句子向量;提取手工特征;基于TCN的神经网络计算,输出句子之间的语义相似度结果。对中文句子不进行分词处理,构建字级别的词向量,用时间卷积网络分别对两个句子进行时间卷积操作提取特征向量,结合手工提取的特征,然后将两个句子的特征向量和手工特征拼接起来,最后计算出两个句子语义相似度。可以很好地避免分词结果的误差传播,也解决了lstm训练速度慢、cnn只有局部特征的问题,可以很好地完成中文句子语义相似度的计算。