一种高精度汉语谓词识别方法

    公开(公告)号:CN103150381A

    公开(公告)日:2013-06-12

    申请号:CN201310080760.3

    申请日:2013-03-14

    Abstract: 本发明涉及一种基于规则和统计相结合的谓词识别方法,属于自然语言处理与机器学习领域,目的是为解决谓词高精度高效率识别问题。本发明采用分步识别方法,从已进行词法和句法标注的句子中识别谓词,首先对待测句子进行词法分析,得到可疑谓词及其个数;接着利用初步识别判定条件进行谓词初步识别;对不满足初步识别判定条件的可疑谓词提取相关词法和句法特征并利用C4.5训练得到的决策树判定模型对其进行判定;最终汇总两步识别结果给出每个待测句子中的谓词。本发明具有准确率高、识别速度快、对非动词性谓词识别率高等特点,适用于要求高精度的汉语谓词识别领域,对句义分析的发展具有很大的推动作用,具有很好的应用价值和推广价值。

    一种高精度汉语谓词识别方法

    公开(公告)号:CN103150381B

    公开(公告)日:2016-03-02

    申请号:CN201310080760.3

    申请日:2013-03-14

    Abstract: 本发明涉及一种基于规则和统计相结合的谓词识别方法,属于自然语言处理与机器学习领域,目的是为解决谓词高精度高效率识别问题。本发明采用分步识别方法,从已进行词法和句法标注的句子中识别谓词,首先对待测句子进行词法分析,得到可疑谓词及其个数;接着利用初步识别判定条件进行谓词初步识别;对不满足初步识别判定条件的可疑谓词提取相关词法和句法特征并利用C4.5训练得到的决策树判定模型对其进行判定;最终汇总两步识别结果给出每个待测句子中的谓词。本发明具有准确率高、识别速度快、对非动词性谓词识别率高等特点,适用于要求高精度的汉语谓词识别领域,对句义分析的发展具有很大的推动作用,具有很好的应用价值和推广价值。

Patent Agency Ranking