-
公开(公告)号:CN118228819A
公开(公告)日:2024-06-21
申请号:CN202211649130.9
申请日:2022-12-20
Applicant: 中国科学院信息工程研究所 , 新华融合媒体科技发展(北京)有限公司
IPC: G06N5/04 , G06N5/022 , G06N3/048 , G06N3/08 , G06N3/0464
Abstract: 本发明涉及一种外部事件知识增强的事件时序序列预测方法和装置。该方法包括:利用基于启发式规则的知识检索方法,从外部事件知识库中获取相关事件知识;利用知识集成策略,对已知事件与从外部事件知识库中获取的相关事件知识之间的交互进行建模,获得外部知识增强的事件时序序列嵌入;根据外部知识增强的事件时序序列嵌入,计算每个候选事件的相似度分数,选择相似度分数最高的候选事件作为预测的可能发生的下一个事件。本发明引入包含图结构信息的外部事件知识对已知事件时序序列进行嵌入增强,达到更好的效果;通过使用不同的知识集成策略,利用图卷积神经网络编码事件图中的多跳知识,实现对事件特征的高效编码,从而有效解决多跳推理问题。
-
公开(公告)号:CN118227782A
公开(公告)日:2024-06-21
申请号:CN202211643171.7
申请日:2022-12-20
Applicant: 中国科学院信息工程研究所 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35 , G06F16/33 , G06F40/242 , G06F40/186 , G06N3/047 , G06N3/049 , G06N3/09
Abstract: 本发明涉及一种基于提示学习范式的少样本事件时序关系抽取方法和装置。该方法的第一阶段为事件时序关系模板配置阶段;第二阶段为时序标签映射器配置阶段,通过硬映射与软映射方式实现从预训练语言模型的词典到事件时序关系标签集合的映射;第三阶段为事件时序关系分类器训练阶段,分类器包含事件时序关系模板和时序标签映射器两个主要部件;第四阶段为事件时序关系预测阶段,利用训练完成的事件时序关系分类器判断事件之间的时序关系。本发明能够有效降低时序关系的抽取难度,减少训练所需的数据规模,达到很好的时序关系抽取效果,并且能够实现对事件时序关系识别任务的快速建模和数据适应,有效地缓解训练语料缺乏导致的模型训练不足的问题。
-
公开(公告)号:CN114510319B
公开(公告)日:2025-05-02
申请号:CN202111635865.1
申请日:2021-12-29
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于Kubernetes集群GPU空间共享的方法,涉及计算机技术领域,针对当前数据处理集群中GPU资源利用率低的问题,提出了关于GPU显存与活跃线程相结合的打分规则,并为了能够有效调度GPU资源,在集群中添加了Scheduler Extender和Device Plugin,进一步改变了以往调度策略中的静态调度方案,使用改进的蚁群算法,能够有效提高集群资源利用率,降低企业使用成本,提高效益。
-
公开(公告)号:CN118760896A
公开(公告)日:2024-10-11
申请号:CN202410943944.6
申请日:2024-07-15
Applicant: 中国科学院信息工程研究所
IPC: G06F18/214 , G06F18/2451 , G06F18/20
Abstract: 本发明公开一种基于条件信息流最大化的大模型内容安全检测方法及系统,属于大模型安全技术领域。所述方法包括:利用预训练语言模型提取待检测内容文本的高阶隐向量表示;基于所述高阶隐向量表示,利用线性分类器获取待检测内容文本的安全检测结果;其中,所述预训练语言模型和所述线性分类器的网络参数的获取是通过条件信息流最大化优化目标来最大化输入‑表示信息流和表示‑任务信息流。本发明不仅可以提升预训练模型在大模型内容安全检测任务的泛化性能,也能增强对训练样本较少类别的有效判别能力,提供了模型在噪声场景下的鲁棒性。
-
公开(公告)号:CN117609936A
公开(公告)日:2024-02-27
申请号:CN202311409148.6
申请日:2023-10-27
Applicant: 中国科学院信息工程研究所
IPC: G06F18/25 , G06F18/2131 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/0442 , G06Q20/06 , G06Q20/38 , G06Q40/04 , G06F123/02
Abstract: 本发明公开了一种基于多维特征融合的以太坊账户画像构建方法,其步骤包括:1)根据以太坊的全量账户交易信息以及以太坊中各账户节点的标签信息,构建出具有标签的以太坊账户地址交易图G={V,E,X,Y,R};2)对于节点集合V中的每一节点vi,根据以太坊账户地址交易图G获取节点vi的中心子图gi;3)获取以太坊中每一账户节点的账户静态特征和交易统计特征;4)根据中心子图获取以太坊中每一账户节点的交易结构特征、交易时序特征,根据图G交易社区特征;5)基于账户静态特征、交易统计特征、交易结构特征、交易时序特征和交易社区特征构建该账户节点的以太坊账户画像。本发明提供全面、深入、准确的加密数字货币账户画像。
-
公开(公告)号:CN116796830A
公开(公告)日:2023-09-22
申请号:CN202310514953.9
申请日:2023-05-09
Applicant: 中国科学院信息工程研究所
Abstract: 本公开涉及一种基于区块链的拜占庭鲁棒联邦学习方法及系统,所述方法不仅基于反馈机制的委员会聚合算法,通过在每一轮的学习过程中选出一个委员会节点进行模型更新的贡献度计算,且依据每个节点的贡献度决定聚合策略从而降低恶意模型更新对全局模型的影响,还在聚合阶段完成后会增加一轮反馈验证,只有大部分节点验证认可了本次聚合的全局模型,训练才会正式进入下一轮。本发明解决了中央服务器的不可信问题,并可以用于抵御恶意客户端的中毒攻击。
-
公开(公告)号:CN110008307B
公开(公告)日:2021-12-28
申请号:CN201910048233.1
申请日:2019-01-18
Applicant: 中国科学院信息工程研究所
IPC: G06F16/33 , G06F16/35 , G06F40/289
Abstract: 本发明涉及一种基于规则和统计学习的变形实体识别方法和装置。该方法定义目标实体生成变形实体的规则,并且通过这些规则定义演绎生成算法,为每个目标实体生成大量的候选变形实体集合;利用目标实体和变形实体所在文本的上下文语义相似性,提出基于统计学习的方法来识别出上面候选变形实体集合中真正对应于目标实体的变形实体。本发明既可以找到尽可能多的变形实体,又通过识别模型保证了最终识别出的变形实体的准确性,具有良好的实用性。
-
公开(公告)号:CN113626685A
公开(公告)日:2021-11-09
申请号:CN202110773341.2
申请日:2021-07-08
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9535 , G06F16/9536 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明涉及一种面向传播不确定性的谣言检测方法及装置,包括:获取社交网络中源博文与转发博文的文本数据及若干传播数据;基于文本数据提取的文本特征,利用传播数据分别构建传播方向的初始传播图G′TD及扩散方向的初始传播图G′BU;对于初始传播图G′TD与初始传播图G′BU,分别利用图卷积网络对边的可靠性进行评估,生成传播图GTD与传播图GBU;基于传播图GTD与传播图GBU中的节点表示HTD与HBU,生成源博文的最终特征表示,以获取谣言检测结果。本发明能够缓解传播结构中不可靠传播关系带来的不确定性问题,有效提高谣言检测的准确率和F1值。
-
公开(公告)号:CN110136016A
公开(公告)日:2019-08-16
申请号:CN201910270828.1
申请日:2019-04-04
Applicant: 中国科学院信息工程研究所
IPC: G06Q50/00 , G06F16/901
Abstract: 本发明涉及一种基于隐式关联的多标签传播方法及系统。该方法包括:对给定的网络构建局部网络结构图,其中部分节点的标签信息已知,并计算概率转移矩阵;基于标签共现方法挖掘多标签之间的隐式关联信息;生成节点-标签矩阵并初始化未知节点的标签信息;根据概率转移矩阵以及隐式关联信息对每一个未知节点的标签进行更新;基于节点-标签矩阵计算更新停止条件;反复执行上述更新步骤直到满足更新停止条件或者达到给定的迭代次数;根据节点-标签矩阵生成网络中未知标签信息的节点的标签信息。本发明能够更好的挖掘标签之间的关联关系,加速方法的收敛速度,从而更准确全面的分析大型网络用户的标签信息。
-
公开(公告)号:CN109902145A
公开(公告)日:2019-06-18
申请号:CN201910048837.6
申请日:2019-01-18
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于注意力机制的实体关系联合抽取方法和系统。该方法的步骤包括:将训练数据中标注的实体和关系的三元组,转化为每个词对应一个预定义类型的标签的形式;将训练数据的句子中的每个词映射成对应的词向量,输入基于注意力机制的神经网络模型,并通过反向传播算法进行训练,得到标签预测模型;将需进行实体关系抽取的句子输入训练完成的标签预测模型,预测出每个词对应的标签,根据标签和三元组中每个词的对应关系,得到句子中存在的实体关系三元组。该系统包括预处理模块、模型训练模块和结果处理模块。本发明通过更有效的利用句子中的关键信息,提升了关系实体联合抽取的性能,具有良好的实用性。
-
-
-
-
-
-
-
-
-