一种用于小数据集的语义分析方法和系统

    公开(公告)号:CN110399385A

    公开(公告)日:2019-11-01

    申请号:CN201910549943.2

    申请日:2019-06-24

    Abstract: 本发明给出了一种用于小数据集的语义分析方法和系统,包括获取待匹配的文本;基于预先建立的分词词典库,对文本进行字符串分割,确定至少一个关键词;基于预先建立的索引库,将关键词与索引库中的词频表逐一检索比对,获取包含关键词或与关键词互为同义词的词频表对应的所有词条,生成初步匹配结果;利用余弦相似度算法进行文本相似度的二次校验,计算文本与初步匹配结果的相似度,获取相似度大于相似度阈值的最终匹配结果。利用关键词约束和相似度二次校验对语义分析进行辅助优化,提高了匹配的准确率。

Patent Agency Ranking