-
公开(公告)号:CN114707516A
公开(公告)日:2022-07-05
申请号:CN202210322393.2
申请日:2022-03-29
Applicant: 北京理工大学
Abstract: 本发明公开了一种基于对比学习的长文本语义相似度计算方法,属于人工智能、自然语言处理技术领域。本发明主要解决的技术问题为小样本场景下长文本语义匹配问题。首先通过爬虫、人工采集手段构建通用、领域数据库。其次使用领域数据库和通用数据库中包含的主题、标题、关键短语等篇章结构信息构建模型,通过有监督的文本表示学习方法对比学习进行训练。最后使用该模型对待评价文本进行预测来获得相似度打分,经过人工修正模块对该语义打分进行修正,并决定是否将该文本加入领域数据库进一步扩大训练资源。定期使用领域资源库更新模型,实现小样本下高精度语义相似度计算。
-
公开(公告)号:CN110991167B
公开(公告)日:2021-10-08
申请号:CN201911233518.9
申请日:2019-12-05
Applicant: 北京理工大学
IPC: G06F40/247 , G06F40/30 , G06F40/279
Abstract: 本发明涉及一种基于情感层次体系的情感词典构建方法,属于情感分析领域。包含如下步骤:步骤一:将语料按照情感层次体系进行拆分,并提取出未知情感词;步骤二:按照未知情感词构字,计算未知情感词的权重,构建基于字的情感词典;步骤三:通过复合句推到未知情感值的单句的情感值并通过语境计算未知情感词的权重,构建基于语境的情感词典;步骤四:将二和三得情感词典融合;步骤六:利用新的情感词典重新迭代计算直到没有新的情感词。所述方法将语料划分六层层次体系,然后通过构字和语境方法计算权重,得到了更加准确、全面的情感词典;将得到的情感词典运用到情感分析任务中,可以提高情感分析的效率和准确率。
-
公开(公告)号:CN110991167A
公开(公告)日:2020-04-10
申请号:CN201911233518.9
申请日:2019-12-05
Applicant: 北京理工大学
IPC: G06F40/247 , G06F40/30 , G06F40/279
Abstract: 本发明涉及一种基于情感层次体系的情感词典构建方法,属于情感分析领域。包含如下步骤:步骤一:将语料按照情感层次体系进行拆分,并提取出未知情感词;步骤二:按照未知情感词构字,计算未知情感词的权重,构建基于字的情感词典;步骤三:通过复合句推到未知情感值的单句的情感值并通过语境计算未知情感词的权重,构建基于语境的情感词典;步骤四:将二和三得情感词典融合;步骤六:利用新的情感词典重新迭代计算直到没有新的情感词。所述方法将语料划分六层层次体系,然后通过构字和语境方法计算权重,得到了更加准确、全面的情感词典;将得到的情感词典运用到情感分析任务中,可以提高情感分析的效率和准确率。
-
-