-
公开(公告)号:CN110399385A
公开(公告)日:2019-11-01
申请号:CN201910549943.2
申请日:2019-06-24
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/242 , G06F16/332 , G06F17/27
Abstract: 本发明给出了一种用于小数据集的语义分析方法和系统,包括获取待匹配的文本;基于预先建立的分词词典库,对文本进行字符串分割,确定至少一个关键词;基于预先建立的索引库,将关键词与索引库中的词频表逐一检索比对,获取包含关键词或与关键词互为同义词的词频表对应的所有词条,生成初步匹配结果;利用余弦相似度算法进行文本相似度的二次校验,计算文本与初步匹配结果的相似度,获取相似度大于相似度阈值的最终匹配结果。利用关键词约束和相似度二次校验对语义分析进行辅助优化,提高了匹配的准确率。