-
公开(公告)号:CN110008323A
公开(公告)日:2019-07-12
申请号:CN201910236751.6
申请日:2019-03-27
Applicant: 北京百分点信息科技有限公司
IPC: G06F16/332 , G06F17/27 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种半监督学习结合集成学习的问题等价性判别的方法,包括S1、同义词归一化:1)词向量嵌入;2)词语相似度判断;3)人工判断;S2、语义等价性识别:基于LSTM的对偶网络的计算;基于CNN的对偶网络模型的计算;基于Match Pyramid模型的计算;人工提取特征。本发明通过半监督的方式生成并引入同义词,从而使得整个系统可以根据具体领域进行灵活调整,并通过集合学习四种不同模型对问题的语义等价性进行判断,从而发挥不同模型的优势。