一种基于文本语义的概念生成模型的系统和方法

    公开(公告)号:CN105808711A

    公开(公告)日:2016-07-27

    申请号:CN201610126084.2

    申请日:2016-03-04

    Abstract: 本发明提出了一种基于文本语义的概念生成模型的系统和方法,属于文本知识获取领域,具体涉及概念的特征分析、语境的获取、候选概念的聚类、模式泛化、相似度计算与加权方法及系统。本发明首先提取出中文语料库中的已有概念,然后去除其前部特征和后部特征得到候选概念词构件,并利用基于统计的方法和基于上下文语境的方法对候选概念词构件进行了相似度的计算,然后进行聚类,在已有概念的基础上生成新的概念,扩充构词规则库。并且通过实验,验证了该发明的有效性。

    一种基于语义特征的语义关系模式获取方法和系统

    公开(公告)号:CN105808521A

    公开(公告)日:2016-07-27

    申请号:CN201610125852.2

    申请日:2016-03-04

    CPC classification number: G06F17/2785

    Abstract: 本发明涉及一种基于语义特征的语义关系模式获取方法和系统,属于文本信息处理领域,具体涉及关系语义模式表示、基于语义特征的语义关系模式获取方法。本发明首先给出了模式特征向量的定义,提出基于模式特征的语义关系模式种子的选取方法,用于模式获取的起始状态,然后给出基于语义特征的种子驱动的模式学习算法,获取的语义关系模式进一步用于语义关系获取。由于经过人工对候选模式进行修订,并进行了模式合并和泛化,避免了模式数量膨胀问题,模式正确率也控制在一定阈值之上。但由于语言模式的使用频率相对比较低,模式范围有限,使得关系获取的匹配率不高,如果采用大规模的语料库,并含有频度高的适合模式的句子,会获取到更好的匹配数目。

Patent Agency Ranking