-
公开(公告)号:CN108038106B
公开(公告)日:2021-07-02
申请号:CN201711404969.5
申请日:2017-12-22
Applicant: 北京工业大学
IPC: G06F40/211 , G06F16/33 , G06F16/36
Abstract: 为了解决现有基于大训练样本的文本术语学习方法难以满足较小实例样本的细粒度领域术语学习需求的问题,本发明提出了一种基于上下文语义的细粒度领域术语自学习方法,通过融合上下文语义信息,从候选术语上下文信息的复现次数角度上全面表现候选术语在语料库中的统计特征和语言特征,借鉴领域相关性与领域一致性思想,运用对数似然比,计算候选术语的领域依存偏向值,最后综合每个候选术语的隶属激活值自主发现领域新术语。本发明所述的基于上下文语义的细粒度领域术语自学习技术可实现术语集的自学习,促进特定领域本体构建,其不仅可以应用在诸如认知功能等领域的术语发现和抽取,还能够在概念抽取方法中作为候选概念产生工具使用。
-
公开(公告)号:CN108038106A
公开(公告)日:2018-05-15
申请号:CN201711404969.5
申请日:2017-12-22
Applicant: 北京工业大学
Abstract: 为了解决现有基于大训练样本的文本术语学习方法难以满足较小实例样本的细粒度领域术语学习需求的问题,本发明提出了一种基于上下文语义的细粒度领域术语自学习方法,通过融合上下文语义信息,从候选术语上下文信息的复现次数角度上全面表现候选术语在语料库中的统计特征和语言特征,借鉴领域相关性与领域一致性思想,运用对数似然比,计算候选术语的领域依存偏向值,最后综合每个候选术语的隶属激活值自主发现领域新术语。本发明所述的基于上下文语义的细粒度领域术语自学习技术可实现术语集的自学习,促进特定领域本体构建,其不仅可以应用在诸如认知功能等领域的术语发现和抽取,还能够在概念抽取方法中作为候选概念产生工具使用。
-