-
公开(公告)号:CN116431789A
公开(公告)日:2023-07-14
申请号:CN202310419495.0
申请日:2023-04-19
Applicant: 哈尔滨工业大学
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F16/35 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于因果事件抽取模型的因果事件抽取方法,包括以下步骤:基于事件抽取以及因果关系识别两个子任务,构建因果事件抽取模型;获取待输入语句;基于预训练语言模型,对待输入语句进行编码,基于序列标注解码器,对编码的待输入语句进行解码,抽取存在因果关联的事件;基于因果事件抽取模型,构建初始背景图;将事件插入到初始背景图,获得更新背景图;采用图神经网络,对更新背景图,进行编码以及更新,获得抽取的事件的表示;基于分类器以及抽取的事件的表示,获得事件之间的因果关系,实现因果事件的抽取。对不同因果事件对的句子的实验结果证明了本发明的方法抽取复杂因果关系的能力。
-
公开(公告)号:CN116431784A
公开(公告)日:2023-07-14
申请号:CN202310302845.5
申请日:2023-03-24
Applicant: 哈尔滨工业大学
IPC: G06F16/332 , G06F16/335 , G06F16/338
Abstract: 一种利用相邻信息增强对话式推荐系统的方法,它属于计算机人工智能技术领域。本发明解决了现有的对话式推荐系统存在稀疏用户偏好以及训练数据不足的问题。本发明检索相邻物品,利用当前对话和相邻物品来构建伪标签数据缓解训练集数据不足的问题,增强对话式推荐系统的训练过程;检索相邻对话,并利用相邻对话的信息来缓解用户稀疏偏好挑战,增强对话式推荐系统的预测物品的过程;本发明方法对缓解对话式推荐系统的稀疏用户偏好以及训练数据不足的挑战起到很好的作用,可以使对话式推荐系统的物品推荐和回复生成效果均有显著的提升。本发明方法可以应用于计算机人工智能领域用。
-
公开(公告)号:CN113392629B
公开(公告)日:2022-10-28
申请号:CN202110733081.6
申请日:2021-06-29
Applicant: 哈尔滨工业大学
IPC: G06F40/211 , G06F40/284 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 基于预训练模型的人称代词消解方法,涉及人工智能技术领域,针对现有技术中代词消解的准确率低问题,本申请模型使用基于排序的代词消解框架,对于一个待消解的代词,存在一个候选先行词的集合,对于每一个候选先行词进行消解打分,打分最高的候选先行词作为消解对象进行消解。本申请引入预训练模型,利用预训练模型使用大量无标注文本进行训练的特点,能够更好的捕捉上下文信息,有效提高代词消解的指标,从而更好的帮助下游任务,提高代词消解的准确率,并提高了代词消解的效率。
-
公开(公告)号:CN114510924A
公开(公告)日:2022-05-17
申请号:CN202210133050.1
申请日:2022-02-14
Applicant: 哈尔滨工业大学
IPC: G06F40/216 , G06F40/289 , G06F40/30 , G06F16/35
Abstract: 一种基于预训练语言模型的文本生成方法,它属于自然语言处理技术领域。本发明解决了现有加权解码的可控生成方法无法在保证生成文本质量的前提下达到理想风格强度的问题。本发明提出了能够动态调节控制器权重的加权解码框架,该框架使用了一个规整模块,能够根据当前解码位置的语言模型信息对控制器的行为进行约束。如果当前解码位置不适合生成包含目标风格的词语时,规整模块会抑制控制器并使其失效;如果当前解码位置可以生成与目标风格相关的词语时,规整模块会增强控制器并确保在该解码位置生成的词语包含目标风格。本发明方法可以应用于可控文本生成。
-
公开(公告)号:CN114444466A
公开(公告)日:2022-05-06
申请号:CN202011196905.2
申请日:2020-10-31
IPC: G06F40/211 , G06F40/284 , G06F40/30
Abstract: 本申请实施例公开了一种长句压缩方法,本申请实施例方法包括:数据处理设备获取原始长句后,根据BERT模型处理原始长句,得到BERT长句,其中BERT长句的内容和原始长句的内容一一对应,BERT长句的内容利用BERT模型中的多层数据,数据处理设备通过预置算法处理该BERT长句,得到压缩后的目标长句,根据本申请实施例提供的技术方案,对原始长句进行压缩时,利用BERT模型中的多层数据,提高了压缩后目标长句的准确率。
-
公开(公告)号:CN110609986B
公开(公告)日:2022-04-05
申请号:CN201910940399.4
申请日:2019-09-30
Applicant: 哈尔滨工业大学
IPC: G06F40/126 , G06F40/18 , G06F40/205 , G06N3/04 , G06N3/08
Abstract: 一种基于预训练的结构化数据生成文本的方法,本发明涉及结构化数据生成文本方法。本发明的目的是为了解决在结构化数据生成文本上,现有模型对表格数据进行建模时,没有考虑数据之间的内在隐含关系,导致文本生成准确率低的问题。过程为:一、随机MASK掉若干个三元组中一个三元组中的一个数据,用@代替;根据表格中数据间具有的计算序列关系得到表征@隐去的计算序列;二、得到表格中同一行的所有记录均值池化后的行向量;三、得到预训练模型,保留预训练模型的参数;四:得到表格行向量;五:验证步骤三的预训练模型;六:得到对表格中同一行的所有记录进行均值池化后的行向量;七:得到表格中数据代表的信息。本发明用于生成文本领域。
-
公开(公告)号:CN112132633B
公开(公告)日:2021-07-06
申请号:CN202011069677.2
申请日:2020-09-30
Applicant: 哈尔滨工业大学
IPC: G06Q30/02 , G06F16/951
Abstract: 一种基于消费事理图谱的消费意图识别和预测方法,它属于消费意图识别与预测技术领域。本发明解决了现有技术对消费意图识别和预测的准确率低的问题。本发明所采用的主要技术方案为:步骤一、基于预训练模型进行事件抽取;步骤二、基于预训练模型进行事件间关系抽取;步骤三、基于评论语料,采用无监督方法构建二分图作为弱监督信息;步骤四、基于二分图弱监督信息和标注数据,构建消费事理图谱;步骤五、使用训练数据训练同异质关系注意力模型,使用同异质关系注意力模型判断事件和消费意图的对应关系。本发明可以应用于消费意图识别与预测。
-
公开(公告)号:CN110083836B
公开(公告)日:2021-07-06
申请号:CN201910335219.X
申请日:2019-04-24
Applicant: 哈尔滨工业大学
IPC: G06F40/211 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种文本预测结果的关键证据抽取方法,本发明涉及文本预测结果的关键证据抽取方法。本发明的目的是为了解决现有技术在文本中抽取能解释预测结果的关键证据时依赖人工标注来寻找证据的问题。过程为:一、得到句子级向量;二、将句子级向量的平均值作为外部存储单元的初值;三、得到第一个句子级向量对应的更新后的外部存储单元;直至得到第n个句子级向量对应的最终的外部存储单元,即得到文档级向量;四、输出文档每个类别的概率;五、得到训练好的硬抽取网络模型;将待分类的文档输入到训练好的硬抽取网络模型,得到待分类的文档分为各个类别的概率以及文档被分为该类别的句子集合。本发明用于文本预测结果的证据抽取领域。
-
公开(公告)号:CN107679225B
公开(公告)日:2021-03-09
申请号:CN201710986821.0
申请日:2017-10-20
Applicant: 哈尔滨工业大学
IPC: G06F16/332
Abstract: 一种基于关键词的回复生成方法,本发明涉及基于关键词的回复生成方法。本发明为了解决现有方法灵活性差、容易产生语意损失,以及序列对序列模型倾向于生成一般性万能回复的问题。本发明包括:一:根据输入的消息生成关键词;二:将输入的消息转化成上下文向量,将第一个关键词和上下文向量送入解码器,若得到的预测结果与第一个关键词一致,则将第二个关键词和上下文向量送入解码器;若得到的预测结果与第一个关键词不一致,则仍将第一个关键词和上下文向量送入解码器,直至得到的预测结果与第一个关键词一致后,再将第二个关键词和上下文向量送入解码器,直至所有关键词按顺序送入解码器,并得到预测结果。本发明用于聊天机器人回复生成领域。
-
公开(公告)号:CN107967257B
公开(公告)日:2021-01-12
申请号:CN201711160875.8
申请日:2017-11-20
Applicant: 哈尔滨工业大学
IPC: G06F40/35 , G06F40/211 , G06F16/35
Abstract: 本发明涉及一种级联式作文生成方法,是为了解决现有技术仅针对作文评分进行研究,未出现关于作文生成方法的研究,以及已有的主题分析技术很难对作文的题目进行分析的缺点而提出的。本发明用一个或多个话题词表示待生成作文的中心思想;得到话题词后,将作文生成分解为话题词扩充、句子抽取和篇章组织;话题词扩展后,利用句子抽取模块寻找与话题词相关的句子,并最终使用篇章组织模块对抽取获得的句子排序,使之成为连贯的整体。本发明还可以从已抽取的句子集合中挖掘词语对已有的话题词进行补充。本发明适用于自动作文生成。
-
-
-
-
-
-
-
-
-