-
公开(公告)号:CN118332349A
公开(公告)日:2024-07-12
申请号:CN202410421125.5
申请日:2024-04-09
Applicant: 中国科学院自动化研究所
Abstract: 本申请公开了一种图文虚假信息检测方法、装置、介质、设备及产品,其中方法包括:将待检测文本划分为各个子文本;基于各个子文本和待检测文本得到检测模型输出的待检测文本与目标图片的文本匹配结果,以及各个子文本对应的检测变量;其中,任一子文本对应的检测变量用于表征任一子文本与目标图片的子文本匹配结果;检测模型是基于变分推断框架构建的。本申请提供的方法和装置,可以在得到整体文本的图文匹配结果的同时得到各个子文本与目标图片的匹配情况,能够有效地确定哪一部分文本与目标图片不匹配,提高了图文虚假信息的检测效果和检测准确度。
-
公开(公告)号:CN117764160A
公开(公告)日:2024-03-26
申请号:CN202311651011.1
申请日:2023-12-04
Applicant: 中国科学院自动化研究所
IPC: G06N5/025 , G06F18/213 , G06F18/241 , G06N3/06 , G06N3/08
Abstract: 本发明提供一种关系抽取模型的训练方法、装置、电子设备和存储介质,从样本数据集中,确定噪音样本文本和纯净样本文本;基于初始关系抽取模型,分别确定噪音样本文本的噪音隐藏特征,以及纯净样本文本的纯净隐藏特征,并基于噪音隐藏特征,确定噪音样本文本的预测实体关系;基于噪音样本文本的预测实体关系,以及纯净样本文本的纯净隐藏特征和样本实体关系,对初始关系抽取模型进行参数迭代,得到关系抽取模型,克服了目前噪音样本的丢弃导致了有用信息的丢失,以致模型训练不足,效果欠佳的缺陷,通过伪标签充分利用噪音样本文本中的信息,以使模型更好的学习关系特征,从而优化训练效果,实现了模型性能的提升。
-
公开(公告)号:CN116796001A
公开(公告)日:2023-09-22
申请号:CN202310628310.7
申请日:2023-05-30
Applicant: 中国科学院自动化研究所
IPC: G06F16/36 , G06F16/28 , G06F18/25 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及自然语言处理技术领域,提供一种动态知识图谱预测方法、装置、电子设备及存储介质,该方法获取历史事件语料;将历史事件语料输入至图谱构建模型,得到当前时刻的知识图谱。该图谱构建模型通过隐含关系提取模块及关系编码模块实现对历史事件语料中隐含关系的提取及编码,通过实体时序表征模块得到当前时刻的知识图谱,使得到的知识图谱不仅包含有历史事件语料中各实体已经存在的关系信息,还包含在历史事件语料中隐含的各实体的关联关系,知识图谱的准确性更高,使知识图谱后续应用效果更佳。而且,通过历史事件语料的不断更新,可以实现知识图谱的准确动态预测。本发明已受到了国家重点研发计划项目(2019YQ1601)的资助。
-
公开(公告)号:CN106844765A
公开(公告)日:2017-06-13
申请号:CN201710098500.7
申请日:2017-02-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于卷积神经网络的显著信息检测方法及装置。所述方法包括:对于所爬取的数据集,确定每个事件发展各个阶段的时间分布,并确定时间节点;对于每一个事件,根据所确定的时间节点将所述事件样本对应的所有的事件信息分成若干份,将每一个时间阶段内事件信息的文本内容拼接成一个段落,生成段落数据集;根据段落的分布表达算法学习所述段落数据集中每个段落的无监督表达向量;对于一个事件,将每个段落的无监督表达向量输入到深度卷积神经网络模型,利用多层卷积操作得到事件各个阶段的低层到高层的表达,通过k最大池化操作提取事件各个阶段的关键特征,最后通过一个全连接层对输入的信息进行不实信息的分类。
-
-
-