-
公开(公告)号:CN119513312A
公开(公告)日:2025-02-25
申请号:CN202411503651.2
申请日:2024-10-25
Applicant: 中国科学院计算技术研究所
IPC: G06F16/353 , G06F16/334 , G06F40/186 , G06F18/241
Abstract: 本发明提供了一种针对文本的讽刺检测方法,包括:获取待分析文本及其讽刺上下文信息,其中,讽刺上下文信息是指用于辅助判断待分析文本是否带有讽刺情绪的语境信息;根据待分析文本及其讽刺上下文信息,评估待分析文本的讽刺上下文信息的充足性;在待分析文本的讽刺上下文信息不充足的情况下,根据预设的上下文信息检索库提供补充的上下文信息,得到更新的讽刺上下文信息;根据待分析文本及其最新的讽刺上下文信息,确定待分析文本是否带有讽刺的情绪。
-
公开(公告)号:CN114997177B
公开(公告)日:2025-01-24
申请号:CN202210561797.7
申请日:2022-05-23
Applicant: 中国科学院计算技术研究所
IPC: G06F40/30 , G06F40/289 , G06F18/2433 , G06N3/0455 , G06N3/088 , G06N3/048
Abstract: 本发明提供一种基于多标签序列标注的指代消解方法,包括:S1、将待处理文本分割成预设长度且不重合的多个文本片段;S2、采用预训练模型对每个文本片段进行编码得到每个字符的语义表达;S3、基于每个字符的语义表达分别判断每个字符是否属于B I E标签;S4、基于每个字符对应的标签,在连续I标签序列中,基于预设的组合策略组合任意的BE标签对应的字符构成短语,其中,连续I标签序列表示一个连续的字符序列中的每个字符均具有I标签;S5、计算任意两个短语之间的相似性得分,为每个短语保留与其相似性得分排名靠前的预设个数的短语作为其前置候选短语;S6、采用排序模型将每个短语的前置候选短语进行排序并将得分第一的前置候选短语作为其互指对象。
-
公开(公告)号:CN119066217A
公开(公告)日:2024-12-03
申请号:CN202310643813.1
申请日:2023-06-01
Applicant: 中国科学院计算技术研究所
IPC: G06F16/53 , G06N3/0455 , G06N3/084
Abstract: 本发明提供了一种基于模态对比学习的跨模态实体召回方法和装置,所述方法包括以下步骤:T1、获取待查询实体,利用经训练的多模态编码神经网络和预设的归一化方式提取待查询实体的多维待查询实体向量,其中,多模态编码神经网络包括用于对文本模态的输入实体提取向量的文本编码模型以及用于对图像模态的输入实体提取向量的图像编码模型并且根据同模态的对比学习和跨模态的对比学习得到;T2、计算多维待查询实体向量与索引库中存储的各库内实体的多维库内实体向量的相似度,所述各库内实体的多维库内实体向量预先基于所述经训练的多模态编码神经网络和预设的归一化方式提取得到;T3、基于相似度,从索引库中召回多个库内实体作为候选实体。
-
公开(公告)号:CN118113883A
公开(公告)日:2024-05-31
申请号:CN202410278786.7
申请日:2024-03-12
Applicant: 湖南大学 , 北京大学 , 中国科学院计算技术研究所
Abstract: 本发明提供一种RDF知识图谱数据划分和分布式查询方法,提出了最小模式切作为一种新颖的RDF图工作负载感知的划分技术,然后基于内部模式将查询分解为一组独立可执行子查询,使得在给定的工作负载下,跨越分区模式数目最少,分区间连接的查询次数最小化,这将导致显著的查询执行性能的提高。
-
公开(公告)号:CN117764077A
公开(公告)日:2024-03-26
申请号:CN202311613359.1
申请日:2023-11-29
Applicant: 中国科学院计算技术研究所
IPC: G06F40/30 , G06F18/22 , G06N3/0455 , G06N3/0499 , G06F40/126
Abstract: 本发明提出一种基于提示学习的零样本可解释性立场检测方法、装置,所述方法包括:获取相关零样本立场检测的文本数据集并进行预处理;针对文本中的任一主题构造提示语,所述提示语中包含一立场标签,所述立场标签包含支持、反对和中立其中之一;将预处理的文本数据集以及所述提示语输入到预训练语言模型中进行编码,获得上下文表示向量和token词表示向量;使用上下文表示向量和token词表示向量进行相似度交互,计算出基于上下文的第一相似度和基于立场标签的第二相似度;利用所述第一相似度、第二相似度,对文本的立场标签进行预测。该方法提高了零样本立场检测的可解释性与检测精度。
-
公开(公告)号:CN112307278B
公开(公告)日:2024-02-23
申请号:CN202011154213.1
申请日:2020-10-26
Applicant: 中国科学院计算技术研究所
IPC: G06F16/903 , G06F16/901
Abstract: 本发明提出一种任意尺度的话题脉络实时生成方法及系统,包括:获取话题历史数据,该话题历史数据包括指定时间范围内预设时间单位的子话题及各子话题所包含的文档;以子话题作为节点,根据该指定时间范围内子话题间的相关性,建立节点间的连边,得到该话题历史数据的图数据;通过动态规划得到该指定时间范围内预设时间单位中各节点的路径权值最大的前k条路径,从所有的出度为0的各节点的该前k条路径中选出权值最大的前k条路径作为该话题历史数据的话题脉络,其中k为正整数。
-
公开(公告)号:CN117333738A
公开(公告)日:2024-01-02
申请号:CN202311308831.0
申请日:2023-10-10
Applicant: 中国科学院计算技术研究所
IPC: G06V10/774 , G06V10/764 , G06V10/40
Abstract: 本发明实施例提供了一种图像分类模型训练方法,该方法包括:S1、获取包括多个图像样本的原始图像数据集及其对应的特征矩阵;S2、对原始图像数据集对应的特征矩阵进行降维处理,并将降维处理后的特征矩阵进行高斯建模以获得特征矩阵中每个特征值的高斯分布;S3、基于步骤S2中每个特征值的高斯分布对其依次进行高斯采样,以使高斯采样所得的所有特征值构成新的特征矩阵,并基于新的特征矩阵生成新的图像数据集;S4、采用新的图像数据集和原始图像数据集构成增强图像训练集训练图像分类模型至收敛。该方法提高了图像分类模型在少样本情况下的性能。
-
公开(公告)号:CN117076598A
公开(公告)日:2023-11-17
申请号:CN202310518172.7
申请日:2023-05-09
Applicant: 中国科学院计算技术研究所
IPC: G06F16/33 , G06F16/953 , G06F40/30 , G06F18/25
Abstract: 本发明提出一种基于自适应权重的语义检索模型融合方法,包括:以检索信息进行稀疏检索,获取稀疏检索结果及对应的稀疏排序分值;以该检索信息进行稠密检索,获取稠密检索结果及对应的稠密排序分值;构建权重预测模型,基于该检索信息、该稀疏检索结果和该稠密检索结果通过该权重预测模型获取融合权重;以该融合权重、该稀疏排序分值和该稠密排序分值,生成融合排序分值;根据该融合排序分值,将该稀疏检索结果和该稠密检索结果进行排序,生成最终检索结果。本发明还提出一种基于自适应权重的语义检索模型融合系统,以及一种用于基于自适应权重的语义检索模型融合的数据处理装置。
-
公开(公告)号:CN116595406A
公开(公告)日:2023-08-15
申请号:CN202310385316.6
申请日:2023-04-12
Applicant: 中国科学院计算技术研究所
IPC: G06F18/24 , G06F18/214 , G06F16/23 , G06F40/289 , G06F18/25 , G06F17/16 , G06N3/0455 , G06N3/08
Abstract: 本发明提出一种基于角色一致性的事件论元角色分类方法及系统,采用图神经网络结构,将每个论元的预估角色概率分布融入事件触发词与事件论元的关联特征建模中,通过在触发词与各论元连接的星形图上进行多阶图神经网络交互,使得每个论元感知其他论元的角色信息,从而提高事件内所有论元角色整体的一致性。
-
公开(公告)号:CN116126553A
公开(公告)日:2023-05-16
申请号:CN202211689339.8
申请日:2022-12-27
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于编排执行的信息获取方法,包括:根据对目标信源的多层树状采集需求生成任务树,编排该任务树的初始配置;将该初始配置放入任务队列;由原子采集器获取该初始配置,根据该初始配置生成根采集任务;执行该根采集任务,生成该根采集任务的子任务的任务配置,将该任务配置放入任务队列,并输出该根采集任务的采集结果;由原子采集器获取任务配置,根据该任务配置生成当前任务;执行该当前任务,生成该当前任务的子任务的任务配置,将该任务配置放入任务队列,并输出该当前任务的采集结果;重复本步骤,直到完成该任务树。本发明还提出一种基于编排执行的信息获取系统,以及一种用于实现基于编排执行的信息获取的数据处理装置。
-
-
-
-
-
-
-
-
-