-
公开(公告)号:CN104281645B
公开(公告)日:2017-06-16
申请号:CN201410425148.X
申请日:2014-08-27
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于词汇语义和句法依存的情感关键句识别方法,属于自然语言处理应用技术领域,包括以下步骤:首先对语料及其分词结果进行规范化处理;然后基于一定规则扩展情感词典、创建关键词词典和提取依存结构模板,并通过扩展后的情感词典和关键词词典获取候选情感关键句;最后设计一种位置打分函数,辅以情感词特征、关键词特征和依存模板特征,利用这四种特征训练SVM分类器,并以之完成情感关键句的最终识别。对比现有技术,通过采用规则与统计相结合的策略,能够有效利用不同层级词汇语义和句法依存信息进行识别,使用户能够更快速而且准确地找到语料中置信度较高的情感关键句,提高中文情感关键句的识别率。
-
公开(公告)号:CN104268160A
公开(公告)日:2015-01-07
申请号:CN201410453074.0
申请日:2014-09-05
Applicant: 北京理工大学
CPC classification number: G06F17/30867 , G06F17/2735 , G06F17/2785
Abstract: 本发明涉及一种基于领域词典和语义角色的评价对象抽取方法,属于自然语言处理应用技术领域,包括以下步骤:首先根据词性、依存和语义角色信息,构建评价对象的领域词典DL,然后充分挖掘词汇、依存、相对位置和语义角色四方面的特征,与DL一起利用条件随机场(CRFs)进行模型训练和预测,从而完成评价对象的抽取工作。对比现有技术,根据中文句子特别是微博、论坛评论信息结构灵活多样、构成方法变化多、句子特征较少的特点,充分利用不同层级句法和语义信息,结合基于规则和机器学习的评价对象抽取方法的优点,自动快速而且准确地找到语料中置信度较高的评价对象,提高了中文句子评价对象抽取的准确率。
-
公开(公告)号:CN104268160B
公开(公告)日:2017-06-06
申请号:CN201410453074.0
申请日:2014-09-05
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于领域词典和语义角色的评价对象抽取方法,属于自然语言处理应用技术领域,包括以下步骤:首先根据词性、依存和语义角色信息,构建评价对象的领域词典DL,然后充分挖掘词汇、依存、相对位置和语义角色四方面的特征,与DL一起利用条件随机场(CRFs)进行模型训练和预测,从而完成评价对象的抽取工作。对比现有技术,根据中文句子特别是微博、论坛评论信息结构灵活多样、构成方法变化多、句子特征较少的特点,充分利用不同层级句法和语义信息,结合基于规则和机器学习的评价对象抽取方法的优点,自动快速而且准确地找到语料中置信度较高的评价对象,提高了中文句子评价对象抽取的准确率。
-
公开(公告)号:CN104281645A
公开(公告)日:2015-01-14
申请号:CN201410425148.X
申请日:2014-08-27
Applicant: 北京理工大学
CPC classification number: G06F17/277
Abstract: 本发明涉及一种基于词汇语义和句法依存的情感关键句识别方法,属于自然语言处理应用技术领域,包括以下步骤:首先对语料及其分词结果进行规范化处理;然后基于一定规则扩展情感词典、创建关键词词典和提取依存结构模板,并通过扩展后的情感词典和关键词词典获取候选情感关键句;最后设计一种位置打分函数,辅以情感词特征、关键词特征和依存模板特征,利用这四种特征训练SVM分类器,并以之完成情感关键句的最终识别。对比现有技术,通过采用规则与统计相结合的策略,能够有效利用不同层级词汇语义和句法依存信息进行识别,使用户能够更快速而且准确地找到语料中置信度较高的情感关键句,提高中文情感关键句的识别率。
-
公开(公告)号:CN104021115A
公开(公告)日:2014-09-03
申请号:CN201410264137.8
申请日:2014-06-13
Applicant: 北京理工大学
IPC: G06F17/27
Abstract: 本发明涉及一种基于神经网络的中文比较句识别方法及装置,包括以下步骤:首先对语料及其分词结果进行规范化处理,然后通过基于比较特征词词典与句法结构模板、依存关系相结合的方法进行粗粒度提取;最后设计一种类别序列规则(CSR)提取算法,并利用CRF挖掘实体对象信息即语义角色信息,辅以比较特征词与统计词特征,利用这四种特征构造BP神经网络,找到使性能达到最优的特征形式完成细粒度提取。对比现有技术,本发明能够有效利用不同层级语义信息进行识别,使用户能够更快速而且准确地找到语料中置信度较高的中文比较句,提高中文比较句的识别率。
-
-
-
-