-
公开(公告)号:CN119294469A
公开(公告)日:2025-01-10
申请号:CN202411219818.2
申请日:2024-09-02
Applicant: 中国科学院计算技术研究所 , 苏州空天信息研究院
IPC: G06N3/091 , G06N3/045 , G06F18/214
Abstract: 本发明提供一种面向知识获取的主动学习方法,用于对知识获取模型进行多次迭代训练,每次迭代包括:获取有多个有标签的样本的第一训练集和有多个未标注标签的样本的候选数据集,每个样本为一段文本数据,标签为在知识获取任务中为样本设置的知识类别标签;获取预设的查询函数,该函数用于计算样本对训练模型的价值量化值,样本的价值量化值是预设的不确定性指标和多个预设指标的加权和,多个预设指标包括动量指标、方差指标和损失值指标中任意两个或三个;根据利用查询函数计算的多个未标注标签的样本各自的价值量化值,选择有价值的样本,对其标注标签后添加到第一训练集,得到第二训练集;利用第二训练集训练模型根据文本数据进行知识类别预测。
-
公开(公告)号:CN119204013A
公开(公告)日:2024-12-27
申请号:CN202411218721.X
申请日:2024-09-02
Applicant: 中国科学院计算技术研究所 , 苏州空天信息研究院
IPC: G06F40/295 , G06F40/284 , G06F16/35 , G06F18/241 , G06N3/042 , G06N3/0455 , G06N3/048 , G06N3/096 , G06N3/0442
Abstract: 本发明提供了一种基于原型网络门控机制的类增量知识获取方法,包括获取待预测的文本;将文本输入经知识获取领域的类增量学习方法训练得到的编码模块,得到各词元的特征向量,并各词元的特征向量构建每个知识单元的单元表示;利用预设的原型网络门控机制确定各知识单元所属的类别,包括:获取每个知识单元的单元表示与各类别的原型表示之间的相似度,根据相似度筛选部分匹配的专家网络对知识单元进行预测,得到筛选出的专家网络对知识单元是否属于该专家网络对应类别的预测值;对于重叠的知识单元,仅保留其中具有最高预测值的知识单元的预测值;如果一个知识单元在所有类别的预测值都小于预设阈值,则该知识单元不属于任何专家网络所对应的类别。
-
公开(公告)号:CN114581230B
公开(公告)日:2025-04-04
申请号:CN202210044130.X
申请日:2022-01-14
Applicant: 中国科学院计算技术研究所
IPC: G06Q40/04 , G06Q20/40 , G06N20/00 , G06F16/901
Abstract: 本发明提出一种流式图中的洗钱行为检测方法、装置、介质,所述方法包括获取洗钱场景中的资金交易信息作为图数据通过有向图表示;在每一条所述资金流到达时,判断所述发生源账户是否在转出资金后达到资金平衡状态,且所述目标账户是否在转入资金后到达资金平衡状态;分别统计当前时刻时所述发生源账户与目标账户达到资金平衡状态的次数以及从初始时刻到当前时刻最近一次达到资金平衡状态之间累积的资金有效转入次数,作为统计特征输入至异常账户评估模型进行异常评估。该方法能够快速并且准确地检测出不同模式的洗钱行为,并且找到可疑的洗钱账户。
-
公开(公告)号:CN113569539B
公开(公告)日:2025-04-04
申请号:CN202110164573.8
申请日:2021-02-05
Applicant: 中国科学院计算技术研究所 , 腾讯科技(深圳)有限公司
IPC: G06F40/166 , G06F40/279
Abstract: 本申请的实施例提供了一种文本内容的衍生方法、装置、计算机可读介质及电子设备。该文本内容的衍生方法包括:获取原始文本内容,基于原始文本内容以及与原始条件相对应的反事实条件,从原始结尾中识别出与原始条件相关的因果内容;基于原始结尾以及原始结尾中的因果内容,确定表示原始结尾的文本架构的结尾框架;基于前提、反事实条件以及结尾框架构成的序列,生成原始结尾对应的反事实结尾;本实施例中生成的反事实结尾在原始结尾的基础上,基于原始文本内容中的因果内容生成,在因果内容与原始文本内容一致性的前提下,使得生成的反事实结尾更加符合因果逻辑,增加表达的流畅性。
-
公开(公告)号:CN119089890A
公开(公告)日:2024-12-06
申请号:CN202410585948.1
申请日:2024-05-13
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种推荐系统评论区的群体极化问题检测方法和装置,包括:对推荐系统指定的评论主帖进行话题观点提取,得到主帖观点;对评论主帖的评论区进行立场检测,得到评论区各条评论相对主帖观点的立场类别;通过提取各条评论的关键词,得到各条评论的立场类别对应的强烈程度;按照评论时间将评论区的评论排序,统计评论初始时间段内各立场类别的评论数量,并根据初始时间段内各条评论的强烈程度,得到各立场类别的平均极化程度,作为基准;持续抽取与初始时间段相同长度但时间靠后的后续时间段,计算后续时间段各立场类别的平均极化程度,并与基准进行对比,得到立场的极化偏离程度,当极化偏离程度超出阈值时进行报警。
-
公开(公告)号:CN117131189A
公开(公告)日:2023-11-28
申请号:CN202310294820.5
申请日:2023-03-23
Applicant: 中国科学院计算技术研究所
IPC: G06F16/35 , G06F16/31 , G06F16/332 , G06F40/35 , G06N3/0499 , G06N3/08
Abstract: 本发明提出一种基于语义的开放域网页知识抽取方法,包括:获取开放域网页的骨架树,对该骨架树的骨架节点进行分裂,得到该骨架节点的骨架子节点,生成骨架子节点序列;对该骨架子节点和该骨架节点标注分类标签,根据该分类标签对该骨架树进行关系抽取,获得抽取任务的关系子节点序列,并生成关系片段;基于该关系片段对该骨架树进行客体抽取,以抽取到的骨架子节点序列为客体片段;以该关系片段和其对应的客体片段为该抽取任务的抽取结果。本发明还提出一种基于语义的开放域网页知识抽取系统,以及一种用于开放域网页知识抽取的数据处理装置。
-
公开(公告)号:CN113392139B
公开(公告)日:2023-10-20
申请号:CN202110624648.6
申请日:2021-06-04
Applicant: 中国科学院计算技术研究所
IPC: G06F16/2458 , G06F16/901 , G06N3/0442 , G06N3/045 , G06N3/08
Abstract: 本发明提出一种基于关联融合的环境监测数据补全方法和系统,包括:获取数据存在缺失的环境监测数据及其对应的标记矩阵;根据环境监测数据中每个时间点的各个属性,得到属性间的关联系数,以构建图G,图G中节点对应属性,节点间的边对应属性间的属性关联系数;通过将图G和待补全矩阵按位相乘,得到中间矩阵,通过神经网络对中间矩阵进行时序处理,得到环境监测数据中各时间点的隐藏状态;根据各时间点的隐藏状态,计算环境监测数据的时间关联性系数;通过将时间关联性系数和各时间点的隐藏状态按位相乘,得到环境监测数据中各时间点的中间状态;在环境监测数据中,对中间状态采用生成式的非线性变换,得到环境监测数据的重构补全数据。
-
公开(公告)号:CN113190733B
公开(公告)日:2023-09-12
申请号:CN202110459851.2
申请日:2021-04-27
Applicant: 中国科学院计算技术研究所
IPC: G06F16/951 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明公开一种基于多平台的网络事件流行度预测方法,包括以下步骤:分别获取多个平台的网络事件的流行度预测序列,并融合多个流行度预测序列形成网络事件的流行度联合预测序列;分别获取多个平台的网络事件的流行度历史序列,并融合多个流行度历史序列形成网络事件的流行度联合历史序列;利用生成式对抗网络将流行度联合预测序列与流行度联合历史序列进行对齐,得到网络事件的流行度最终预测序列。
-
公开(公告)号:CN116595407A
公开(公告)日:2023-08-15
申请号:CN202310388963.2
申请日:2023-04-12
Applicant: 中国科学院计算技术研究所
IPC: G06F18/24 , G06F18/214 , G06F18/25 , G06F40/289 , G06N3/0455 , G06N3/08
Abstract: 本发明提出一种基于标签序列一致性建模的事件论元检测方法及系统。主要包括词序列语义编码、词标签序列标注、易错标签序列生成、对比学习正则化。词序列语义编码对预处理后的词采用BERT与训练语言模型进行语义表示学习,并将事件类型信息融入表示向量中;词标签序列标注使用全连接网络来对每个词对应的标签概率分布做出预估;易错标签序列生成则是根据一定策略按照词标签序列概率分布生成易错标签序列;对比学习正则化则是基于易错标签序列和正确标签序列的对比学习构建正则化损失,提高词序列标签的一致性。
-
公开(公告)号:CN112287272B
公开(公告)日:2023-05-23
申请号:CN202011161424.8
申请日:2020-10-27
Applicant: 中国科学院计算技术研究所
IPC: G06F16/958 , G06F16/35 , G06F16/957 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种网站列表页面的分类方法,所述分类方法基于超文本标记语言标签(HTML Tag),所述分类方法包括:步骤100、获取一组网站网页;步骤200、分别针对每一所述网站网页提取所述网站网页的统计特征和结构特征,得到每一所述网站网页对应的特征序列;步骤300、将所述特征序列输入神经网络进行所述神经网络的训练,得到网站列表页面分类器;步骤400、获取待分类的网站网页,根据所述步骤200得到所述待分类的网站网页的特征序列,将所述待分类的网站网页的特征序列输入所述步骤300得到的所述网站列表页面分类器,判断该待分类的网站网页是否为网站列表页面。
-
-
-
-
-
-
-
-
-