一种基于条件随机场的缩略词扩展解释识别方法

    公开(公告)号:CN103778142A

    公开(公告)日:2014-05-07

    申请号:CN201210404108.8

    申请日:2012-10-23

    Applicant: 南开大学

    CPC classification number: G06N5/025 G06F17/2765

    Abstract: 本发明公开了一种基于条件随机场的缩略词扩展解释识别方法,涉及机器学习领域和缩略词识别任务。本发明将传统的缩略词与扩展解释对的识别任务建模成一个序列标记任务,并采用条件随机场这一结构化模型来识别缩略词的扩展解释。针对缩略词识别任务的具体特点,发明设计并抽取了三类特征,包括拼写特征、与缩略词的对应特征、上下文相关特征,并对模型进行了改进。所设计的模型考虑了缩略词扩展解释的上下文信息和结构信息,并具有潜在稀疏特征学习能力,发明进一步设计了多种特征函数及其组合方法,从而更好地从文本序列中识别出可能的扩展解释。

Patent Agency Ranking