一种基于提示学习的对话情绪识别方法

    公开(公告)号:CN117972019A

    公开(公告)日:2024-05-03

    申请号:CN202410086131.X

    申请日:2024-01-22

    Applicant: 东北大学

    Abstract: 本发明提供一种基于提示学习的对话情绪识别方法,涉及人工智能技术领域。该方法在语句表征获取阶段,通过话语在token级别与语句级别的交互,获得包含上下文的语句表征;在对话情绪识别时,通过对对话的持续性和感染性进行建模,同时引入外部的常识知识,使得对话情绪识别模型能更加考虑对话者的情绪特征以及话语中所共有的隐式常识知识。该方法通过引入对话上下文和外部的常识知识,结合提示学习,提出了效果更好的对话情绪识别模型。可以实现对话情绪识别任务,为聊天机器人提供理解人类情绪的能力,在聊天机器人领域具有极其重要的价值。

    一种基于多线索交互的跨模态图像描述方法

    公开(公告)号:CN117935293A

    公开(公告)日:2024-04-26

    申请号:CN202211245140.6

    申请日:2022-10-12

    Applicant: 东北大学

    Abstract: 本发明提供一种基于多线索交互的跨模态图像描述方法,涉及图像描述生成技术领域。该方法首选获取包括图像和描述文本的图像数据集,并对数据集进行预处理;再对预处理后的数据集中的图像、描述文本分别进行单模态特征提取,得到图像的场景特征和目标特征以及描述文本的文本特征;构建多线索层次化Transformer模型作为图像描述模型;使用训练集中的样本提取的场景特征、目标特征和文本特征对多线索层次化Transformer模型进行训练,得到训练好的图像描述模型;最后使用训练好的图像描述模型对待描述图像进行描述。该方法解决了图像为场景特征或者图像中不存在显著性目标等问题导致的描述文本质量不佳的问题。

    一种用于远程监督关系抽取的基于BERT和MLM的降噪方法

    公开(公告)号:CN113254429A

    公开(公告)日:2021-08-13

    申请号:CN202110525465.9

    申请日:2021-05-13

    Applicant: 东北大学

    Abstract: 本发明公开了一种用于远程监督关系抽取的基于BERT和MLM的降噪方法,涉及远程监督关系抽取技术领域。将实体对定义为源实体和目标实体;从各类别对应的目标实体中筛选出单子词实体,并根据其对应的句子不是噪声句子的可能性对这些句子排序并构成句子集;从各句子集选取正负样本为各类别建立数据集;基于数据集中句子的实体在BERT模型最后一层编码器输出的隐藏状态,提取句子的MASK‑lhs特征;利用全连接层捕获噪声句子与非噪声句子的MASK‑lhs特征差异来训练二分类器,将训练好的二分类器作为各类别的专用降噪器;将训练集中的所有句子按类别送入对应的降噪器,找出并剔除噪声句子。降噪器是即插即用的,具有实用性。

    一种面向学者的用户画像构建及应用方法

    公开(公告)号:CN110968782A

    公开(公告)日:2020-04-07

    申请号:CN201910976349.1

    申请日:2019-10-15

    Applicant: 东北大学

    Abstract: 本发明提供一种面向学者的用户画像构建及应用方法。首先,从国内学者的个人主页上获取学者基本信息,从国内外著名学术网站上获取学者的研究信息,在此基础上对上述信息进行预处理,从而获得构建学者画像所需的语料库;之后,通过对学者基本属性和研究属性的挖掘,构建学者画像;最后,基于学者画像,实现学者搜索与专家发现、论文审稿人推荐、合作学者推荐等应用。该发明对于学者寻找项目和论文工作的合作者、学术会议和期刊主办者寻找论文审稿人、以及刚刚从事一个新的研究领域的入门者寻找领域的资深学者,均具有支持和帮助作用。

    一种基于工具学习的多模态共情回复生成方法

    公开(公告)号:CN119938994A

    公开(公告)日:2025-05-06

    申请号:CN202510027568.0

    申请日:2025-01-08

    Applicant: 东北大学

    Abstract: 本发明提供一种基于工具学习的多模态共情回复生成方法,涉及共情对话生成技术领域。该方法构建基于工具学习的多模态共情回复生成框架TOOL‑STCIKERCONV,包括数据改造模块、工具调用模块以及评估训练模块;该方法通过对构建的对话数据集进行改造,使用插入特殊token方法,在表情包内容描述字段Prompt中添加含有特殊token的片段使得多模态基座模型具有思考表情包生成的能力,实现在隐向量空间中思考,让多模态基座模型学习主动调用表情包生成工具,解决了多模态共情对话生成领域大模型缺乏自主思考能力导致的表情包发送频率异常问题;此外,该方法利用即插即用的表情包生成工具,实现了表情包生成模型的迭代更新和更换不同风格文生图模型。

    一种面向学者的用户画像构建及应用方法

    公开(公告)号:CN110968782B

    公开(公告)日:2023-04-07

    申请号:CN201910976349.1

    申请日:2019-10-15

    Applicant: 东北大学

    Abstract: 本发明提供一种面向学者的用户画像构建及应用方法。首先,从国内学者的个人主页上获取学者基本信息,从国内外著名学术网站上获取学者的研究信息,在此基础上对上述信息进行预处理,从而获得构建学者画像所需的语料库;之后,通过对学者基本属性和研究属性的挖掘,构建学者画像;最后,基于学者画像,实现学者搜索与专家发现、论文审稿人推荐、合作学者推荐等应用。该发明对于学者寻找项目和论文工作的合作者、学术会议和期刊主办者寻找论文审稿人、以及刚刚从事一个新的研究领域的入门者寻找领域的资深学者,均具有支持和帮助作用。

    一种基于层次化卷积神经网络的多标记情绪强度预测方法

    公开(公告)号:CN110472245B

    公开(公告)日:2022-11-29

    申请号:CN201910751989.2

    申请日:2019-08-15

    Applicant: 东北大学

    Abstract: 本发明提出一种基于层次化卷积神经网络的多标记情绪强度预测方法,包括:将原始多标记社会媒体短文分为训练集及测试集;对训练集中一段原始多标记社会媒体短文本数据进行预处理,得到训练集基本情绪单标记数据;构建基于层次卷积神经网络的单标记情绪分类模型;基于注意力卷积神经网络构建情绪强度值模型;针对多标记社会媒体短文本测试数据,使用层次卷积神经网络的单标记情绪分类模型进行预测,得到优化后的多标记情绪强度向量。采用本发明的基于层次化卷积神经网络的多标记情绪强度预测方法,可以进一步提高社会媒体文本情绪强度预测的准确率,特别适合文本中同时存在多种基本情绪的场景。

    一种多模态情绪知识图谱的构建及展示方法

    公开(公告)号:CN112417172A

    公开(公告)日:2021-02-26

    申请号:CN202011319237.8

    申请日:2020-11-23

    Applicant: 东北大学

    Abstract: 本发明提供一种多模态情绪知识图谱的构建及展示方法,涉及多模态知识管理技术领域。该方法首先收集、下载情绪词汇本体或词典、人脸表情和动物表情图像及社会媒体平台常用的表情符号;并对获取的文本和图像数据资源,分别进行预处理,使这些数据资源满足统一的抽象本体模型需求;然后基于文本情绪词、表情图像以及社交媒体表情符号的预处理结果,构建能够表达不同模态实体以及实体之间关系的多模态情绪知识图谱;最后通过采用前端的文本标记语言和前端页面的元素渲染语言的编程来实现对多模态情绪知识图谱的节点、图谱的边、图谱实体属性信息的展示和渲染;在此基础上实现图谱的用户交互功能;同时,通过图形可视化库增加知识图谱的动态效果。

    一种基于传递关系的本地自适应知识图谱优化方法

    公开(公告)号:CN109840283A

    公开(公告)日:2019-06-04

    申请号:CN201910154252.2

    申请日:2019-03-01

    Applicant: 东北大学

    Abstract: 本发明提出一种基于传递关系的本地自适应知识图谱优化方法,包括:设定训练样本集;设定任意ri和ei初始属于某一分布;归一化;组成新的训练样本集;初始化三元组集合为空集;设定正确的三元组,其对应错误的三元组,用错误的三元组头实体或者尾实体替换正确的三元组,组成错误训练样本集,并且合并到三元组集合中;获得其实体的边缘参数;获得关系的边缘参数;计算边缘参数随实体和关系进行变化的参数;得到新的基于传递关系的损失函数;进行判断并使用随机梯度下降函数SGD对每个实体或者关系向量进行优化;本发明可以弥补数据的不完全性,并能够更好地表达出关系与实体间潜在的不同语义,优化后所构建的新的知识图谱具有更高的准确率。

    一种基于模糊理论的知识图谱优化方法

    公开(公告)号:CN109840282A

    公开(公告)日:2019-06-04

    申请号:CN201910154244.8

    申请日:2019-03-01

    Applicant: 东北大学

    Abstract: 本发明提出一种基于模糊理论的知识图谱优化方法,包括:获取训练集三元组数据,并对所有三元组数据预处理;基于模糊关系合成的知识图谱构建,获得知识图谱的模糊关系;基于损失函数,最小化目标优化函数,获得优化后的三元组向量,即为优化后的知识图谱的三元组集合。本发明使用模糊向量的运算方法来对各维训练数据进行运算,将模糊逻辑中赋予数据的语义信息与深度学习理论相结合,实验表明,采用本发明的基于模糊理论的知识图谱优化方法,所获得的知识图谱更加全面和准确,优化后的知识图谱在链接预测和三元组分类方面具有更高的准确率。

Patent Agency Ranking