-
公开(公告)号:CN112990353B
公开(公告)日:2021-07-30
申请号:CN202110402126.1
申请日:2021-04-14
Applicant: 中南大学
Abstract: 本发明涉及汉字易混淆集构建领域,公开了一种基于多模态模型的汉字易混淆集构建方法。S1:得到字形编码的相似度,S2:得到字音编码的相似度,S3:构建并训练出一个图像分类的神经网络模型,由图像分类的神经网络模型输出一个M维的向量,S4:构建并训练出一个音频分类的神经网络模型,由音频分类的神经网络模型输出一个M维的向量,S5:将汉字字符Ci的字形编码相似度向量、字音编码相似度向量、字形视觉易混淆向量、字音听觉易混淆向量,加权组合为一个向量,作为音形易混淆向量,从而依据音形易混淆向量中每个维度上的相似度,选择对应的字典Dic中的汉字,构成音形易混淆集。本发明能够模拟人的视觉和听觉构建易混淆集。
-
公开(公告)号:CN112015871B
公开(公告)日:2021-01-01
申请号:CN202011189911.5
申请日:2020-10-30
Applicant: 中南大学
IPC: G06F16/33 , G06F16/35 , G06F40/211 , G06F40/289
Abstract: 本发明涉及文本特征提取和关系标注,公开了一种基于事件集远程监督的人物关系自动标注方法,具体包括以下步骤:S1:构建事件集;S2:基于事件集进行语料文本人物关系的标注,人物关系标注完毕之后的数据格式为:[实体1,实体2,句子,决定事件,人物关系]。本发明能解决关系缺失的问题。
-
公开(公告)号:CN109933664A
公开(公告)日:2019-06-25
申请号:CN201910182419.6
申请日:2019-03-12
Applicant: 中南大学
Abstract: 本发明公开了一种基于情感词嵌入的细粒度情绪分析改进方法,包括:文本数据集的获取、人工标注及预处理。计算文本数据集中每个单词对应的语义词向量。获取情感词集合。计算训练数据集中每个单词对应的一组情感词组。计算训练数据集中每个单词对应的情绪词向量。构建训练数据集中每个单词对应的情感词嵌入。训练分类器得到细粒度情绪分析模型。本发明利用先验情感知识结合词嵌入模型,并构造适用于细粒度情绪分析的情感词嵌入进行情绪分析。本发明可以更好地识别词语级别的情绪信息,更加精准、细粒度的描述用户的情绪,可以用于细粒度的情绪分析任务,例如:用户的消费习惯分析,用户对商品的评论分析等。
-
公开(公告)号:CN108806767A
公开(公告)日:2018-11-13
申请号:CN201810619124.6
申请日:2018-06-15
Applicant: 中南大学
Abstract: 本发明公开了一种基于电子病历的疾病症状关联分析方法,包括获取电子病历的数据并处理;构建不平衡数据集的分类器;采用分类器对疾病症状进行关联分析。本发明通过对电子病历进行处理获取基础数据,然后根据基础数据构造相应的新型不平衡数据集的分类器,再利用该分类器进行疾病与症状的关联分析,因此本发明方法能够对疾病症状进行较为准确的关联,而且方法简答、科学和可靠。
-
-
-