-
公开(公告)号:CN118093874A
公开(公告)日:2024-05-28
申请号:CN202410275955.1
申请日:2024-03-12
IPC: G06F16/35 , G06F16/33 , G06F18/2415 , G06F40/30 , G06F40/284 , G06N3/0455 , G06N3/047 , G06N3/0442 , G06N3/084
Abstract: 本发明涉及一种低资源语言处理领域的情感分析方法。提出一种基于网格结构与多头注意力的新闻句子情感分析方法。包括以下步骤:通过将网格结构无损转换为扁平结构,实现音节序列中单词信息的引入;采用相对位置编码机制,编码音节和单词的位置和方向信息;使用多头自注意力机制,识别序列中音节和单词的关联关系和语义信息;最后通过全连接层进行分类得到低资源语言新闻句子情感类别。本发明解决了传统循环神经网络无法进行大规模并行计算以及卷积神经网络难以建模句子中的长距离依赖关系的问题,其中多头注意力机制的运用,丰富了词语间的关联关系,增强了句子语义和句法结构信息的理解,提高了低资源语言新闻句子情感分类效果。
-
公开(公告)号:CN118093874B
公开(公告)日:2025-05-16
申请号:CN202410275955.1
申请日:2024-03-12
IPC: G06F16/35 , G06F16/334 , G06F18/2415 , G06F40/30 , G06F40/284 , G06N3/0455 , G06N3/047 , G06N3/0442 , G06N3/084
Abstract: 本发明涉及一种低资源语言处理领域的情感分析方法。提出一种基于网格结构与多头注意力的新闻句子情感分析方法。包括以下步骤:通过将网格结构无损转换为扁平结构,实现音节序列中单词信息的引入;采用相对位置编码机制,编码音节和单词的位置和方向信息;使用多头自注意力机制,识别序列中音节和单词的关联关系和语义信息;最后通过全连接层进行分类得到低资源语言新闻句子情感类别。本发明解决了传统循环神经网络无法进行大规模并行计算以及卷积神经网络难以建模句子中的长距离依赖关系的问题,其中多头注意力机制的运用,丰富了词语间的关联关系,增强了句子语义和句法结构信息的理解,提高了低资源语言新闻句子情感分类效果。
-
公开(公告)号:CN114090863A
公开(公告)日:2022-02-25
申请号:CN202111212885.8
申请日:2021-10-19
Applicant: 北京信息科技大学
IPC: G06F16/9532 , G06F16/33 , G06F40/216 , G06F40/284 , G06F40/30 , G06K9/62
Abstract: 本申请公开了一种藏文热点事件检测方法,包括:获取热词;获取词对;对所述热词和所述词对进行聚类。获取热词包括:计算词频权重;计算词频增长率权重;计算网站影响力权重;融合所述词频权重、所述词频增长率权重以及所述网站影响力权重进行热词热度度量。本申请的方法通过在热度度量方法中融合词频、词频增长率、网站影响力特征,并经热度过滤,提高热词抽取的有效性;通过建立词对生成模型和词对语义引力模型,并经热度筛选,获得较高质量的词对集合;运用凝聚式层次聚类算法获得热点事件,采用热词和词对描述事件,进而满足事件描述细粒度的要求,能够较为有效地检测热点事件,具有较高的应用价值,达到的正确率、召回率和F值均较高。
-
-