-
公开(公告)号:CN111966810B
公开(公告)日:2021-03-09
申请号:CN202010910552.1
申请日:2020-09-02
Applicant: 中国矿业大学(北京)
IPC: G06F16/332 , G06F16/338
Abstract: 本发明公开了一种用于问答系统的问答对排序方法,涉及自然语言处理领域。该方法包括以下步骤:针对给定问题检索相关文档,并初步筛选出大概率具有所需回答的文档;将得到的文档按段落拆分为N个片段,分别放在给定问题的后边并向量化表示,得到N个向量化的问题‑片段对,N为整数;将N个向量化表示的问题‑片段对编码为N个统一大小的单个向量;对得到的N个统一大小的单个向量进行分类,得到问题‑片段对中“回答”是该“问题”的相关回答的概率,并进行排序;通过置信区间筛选出相关性较高的片段,作为最终答案。本发明可用于问答系统的问答对的准确排序。
-
公开(公告)号:CN111966810A
公开(公告)日:2020-11-20
申请号:CN202010910552.1
申请日:2020-09-02
Applicant: 中国矿业大学(北京)
IPC: G06F16/332 , G06F16/338
Abstract: 本发明公开了一种用于问答系统的问答对排序方法,涉及自然语言处理领域。该方法包括以下步骤:针对给定问题检索相关文档,并初步筛选出大概率具有所需回答的文档;将得到的文档按段落拆分为N个片段,分别放在给定问题的后边并向量化表示,得到N个向量化的问题-片段对,N为整数;将N个向量化表示的问题-片段对编码为N个统一大小的单个向量;对得到的N个统一大小的单个向量进行分类,得到问题-片段对中“回答”是该“问题”的相关回答的概率,并进行排序;通过置信区间筛选出相关性较高的片段,作为最终答案。本发明可用于问答系统的问答对的准确排序。
-
公开(公告)号:CN115099888A
公开(公告)日:2022-09-23
申请号:CN202210668460.6
申请日:2022-06-14
Applicant: 中国矿业大学(北京)
IPC: G06Q30/06 , G06F16/9535 , G06F40/20
Abstract: 一种基于注意力机制的用户评论有效性分析方法,包括以下步骤:步骤1:通过VGAE模型生成用户行为数据特征;步骤2:生成用户生成内容数据特征;步骤3:通过AGNN融合用户行为数据特征和用户生成内容数据特征,并基于胶囊网络设置有效特征向量和无效特征向量两个输出,通过计算有效特征特征向量模长与无效特征向量模长之比对用户的评论进行有效性分析;本发明设置一种基于注意力机制的用户评论有效性分析方法通过整合用户行为和用户生成内容,综合利用用户的历史评论及用户的标签,刻画了用户的特征,提升分析准确度,在评论有效性预测方面给出了一种新的思路。
-
公开(公告)号:CN117828072A
公开(公告)日:2024-04-05
申请号:CN202311463653.9
申请日:2023-11-06
Applicant: 中国矿业大学(北京)
IPC: G06F16/35 , G06N3/042 , G06F16/332 , G06N3/0455
Abstract: 本发明公开了一种基于异构图神经网络的对话分类方法和系统,包括:数据准备:收集对话数据集,并将对话划分为句子节点和词节点。根据对话数据集构建异构图;为每个节点初始化隐藏状态,使用基于BERT的嵌入来捕获丰富的语义信息,使用节点特征作为初始表示向量。构建异构图神经网络模型;更新节点;进行对话分类。本发明的优点是:具有捕捉细微差别的语言模式、上下文依赖关系和跨对话不断变化的用户意图的能力,提升了对话分类的准确性和效果。
-
公开(公告)号:CN113688634B
公开(公告)日:2022-02-11
申请号:CN202110945239.6
申请日:2021-08-17
Applicant: 中国矿业大学(北京)
IPC: G06F40/30 , G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种细粒度情感分析方法,涉及自然语言处理领域。该方法包括以下步骤:为数据集中每条样本生成序列标签和位置嵌入向量、添加“ ”和“ ”标志以标识样本的首尾、添加标签“ ”以补齐样本长度,之后将样本通过词典转化为整数编码序列,输入bert模型生成样本的嵌入向量;搭建实体数量预测模型、实体起始位置标注模型和实体长度预测模型,并将样本分别输入三个模型进行训练,完成评价对象提取(OTE);搭建情感预测模型,并将样本输入该模型进行训练,完成情感极性分析(OSC);顺次连接以上训练完毕的四个模型,输入待预测样本,抽取评价对象并分析评价对象的情感极性。本发明可用于抽取评论文本中的评价对象及对其进行情感分析。
-
公开(公告)号:CN113688634A
公开(公告)日:2021-11-23
申请号:CN202110945239.6
申请日:2021-08-17
Applicant: 中国矿业大学(北京)
IPC: G06F40/30 , G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种细粒度情感分析方法,涉及自然语言处理领域。该方法包括以下步骤:为数据集中每条样本生成序列标签和位置嵌入向量、添加“ ”和“ ”标志以标识样本的首尾、添加标签“ ”以补齐样本长度,之后将样本通过词典转化为整数编码序列,输入bert模型生成样本的嵌入向量;搭建实体数量预测模型、实体起始位置标注模型和实体长度预测模型,并将样本分别输入三个模型进行训练,完成评价对象提取(OTE);搭建情感预测模型,并将样本输入该模型进行训练,完成情感极性分析(OSC);顺次连接以上训练完毕的四个模型,输入待预测样本,抽取评价对象并分析评价对象的情感极性。本发明可用于抽取评论文本中的评价对象及对其进行情感分析。
-
公开(公告)号:CN119938924A
公开(公告)日:2025-05-06
申请号:CN202510020631.8
申请日:2025-01-07
Applicant: 中国矿业大学(北京)
IPC: G06F16/353 , G06F18/2415 , G06F40/30 , G06N3/045
Abstract: 本发明公开了一种基于标签关系的多标签文本分类方法,涉及自然语言处理技术领域,通过预训练模型捕获文本数据集中的文本特征,根据文本特征获得初始分类排名,得到第一标签序列S1;根据S1中的头部标签,得到第二标签序列S2;将S2与来自给定文本数据集的标签频率共现矩阵M相结合获得第三标签序列S3,由S2与S3取并集获取第四标签序列S4,通过标签频率分布信息对S4中的标签重新排序,得到频率整合的标签序列S,基于S产生一个标签特征序列#imgabs0#通过注意机制将#imgabs1#与文本建立语义关系获得最终特征fcat;采用最终特征fcat进行最终分类。本发明还公开了一种基于标签关系的多标签文本分类系统,本发明可有效缓解长尾问题,提高最终分类的准确性和相关性。
-
公开(公告)号:CN117131383A
公开(公告)日:2023-11-28
申请号:CN202310859637.5
申请日:2023-07-13
Applicant: 中国矿业大学(北京)
IPC: G06F18/22 , G06F18/214 , G06F16/33 , G06F40/30
Abstract: 一种提高双塔模型搜索精排性能的方法包括以下步骤:获取数据集,并对所述数据集进行预处理;搭建双塔模型,设定模型参数,并改进所述双塔模型的损失函数层;将所述步骤1中预处理后的数据集按照比例划分为训练集和测试集;将所述训练集应用至改进后的双塔模型,输出搜索精排结果;其中,所述数据集预处理的方法具体包括:语料库清洗,创建索引,建立答案文档,召回粗排,标签标注;所述改进双塔模型中的损失函数层的方法为在双塔模型损失函数层使用平衡所述数据集中正负样本比例的损失函数。本方法对原始双塔模型的损失函数层进行改造,使得所述双塔模型能够平衡数据集的正负样本,最大程度的提升双塔模型在精排任务中的精确度。
-
公开(公告)号:CN115759036B
公开(公告)日:2023-08-04
申请号:CN202211334721.7
申请日:2022-10-28
Applicant: 中国矿业大学(北京)
IPC: G06F40/205 , G06F40/242 , G06F40/284 , G06N3/08
Abstract: 一种基于推荐的事件检测模型的构建方法包括:对包含事件文本、触发词、事件类型的原始数据集进行预处理,构建初始的基于推荐的事件检测模型及初始参数,所述模型包括BERT层、触发词超图卷积层、触发词判别器、事件类型超图卷积层、注意力权重层、神经协同过滤层、预测层;对模型进行触发词和事件类型层面的训练;一种使用基于推荐的事件检测模型进行事件检测的方法为将包含事件类型、正采样事件文本及负采样事件文本输入至基于推荐的事件检测模型中根据交互分数推荐top‑k个事件文本;本发明提供的方法是无触发词的事件检测,因此消除了因人为标注触发词产生的人工成本,同时,本发明将推荐思想应用到事件检测中,能够更加精准的完成事件检测。
-
公开(公告)号:CN115759036A
公开(公告)日:2023-03-07
申请号:CN202211334721.7
申请日:2022-10-28
Applicant: 中国矿业大学(北京)
IPC: G06F40/205 , G06F40/242 , G06F40/284 , G06N3/08
Abstract: 一种基于推荐的事件检测模型的构建方法包括:对包含事件文本、触发词、事件类型的原始数据集进行预处理,构建初始的基于推荐的事件检测模型及初始参数,所述模型包括BERT层、触发词超图卷积层、触发词判别器、事件类型超图卷积层、注意力权重层、神经协同过滤层、预测层;对模型进行触发词和事件类型层面的训练;一种使用基于推荐的事件检测模型进行事件检测的方法为将包含事件类型、正采样事件文本及负采样事件文本输入至基于推荐的事件检测模型中根据交互分数推荐top‑k个事件文本;本发明提供的方法是无触发词的事件检测,因此消除了因人为标注触发词产生的人工成本,同时,本发明将推荐思想应用到事件检测中,能够更加精准的完成事件检测。
-
-
-
-
-
-
-
-
-