-
公开(公告)号:CN103838712A
公开(公告)日:2014-06-04
申请号:CN201310576097.6
申请日:2013-11-18
Applicant: 北京理工大学
Abstract: 本发明公开了一种针对词语级别的汉语情感词极性强度量化方法,属于计算机自然语言处理领域。首先获取情感词典中每个字的情感倾向值,然后根据字的情感倾向值获取所测基础情感词的极性强度度量值,最后根据基础情感词的极性强度度量值获取复合情感词的极性强度度量值。本发明对比现有技术,通过采用高斯分布函数修正统计得出的字的情感倾向值误差,大幅提高了基础情感词极性强度度量的准确率。在此基础上对复合情感词详细分类,分别设计经Sigmoid函数倒推得出的计算公式,大幅提高了复合情感词的极性强度度量准确率。另外引入Sim(A,B)函数,利用HowNet对副词自动分类,减轻了手工标注的工作量,提高了工作效率。
-
公开(公告)号:CN103838712B
公开(公告)日:2017-01-04
申请号:CN201310576097.6
申请日:2013-11-18
Applicant: 北京理工大学
Abstract: 本发明公开了一种针对词语级别的汉语情感词极性强度量化方法,属于计算机自然语言处理领域。首先获取情感词典中每个字的情感倾向值,然后根据字的情感倾向值获取所测基础情感词的极性强度度量值,最后根据基础情感词的极性强度度量值获取复合情感词的极性强度度量值。本发明对比现有技术,通过采用高斯分布函数修正统计得出的字的情感倾向值误差,大幅提高了基础情感词极性强度度量的准确率。在此基础上对复合情感词详细分类,分别设计经Sigmoid函数倒推得出的计算公式,大幅提高了复合情感词的极性强度度量准确率。另外引入Sim(A,B)函数,利用HowNet对副词自动分类,减轻了手工标注的工作量,提高了工作效率。
-