-
公开(公告)号:CN119293233A
公开(公告)日:2025-01-10
申请号:CN202411210233.4
申请日:2024-08-30
Applicant: 中国科学院信息工程研究所
IPC: G06F16/35 , G06F16/31 , G06N3/0455 , G06N3/0985
Abstract: 本发明属于语言模型处理领域,涉及一种基于渐进式学习的模型微调方法和系统。该方法在预训练模型的微调过程中,根据Transformer块对模型性能的不同贡献,将对预训练模型的性能贡献大的Transformer块进行着重训练,将对预训练模型的性能贡献小的Transformer块进行少量训练。本发明将渐进式学习的思想引入到模型微调中,在微调过程中逐渐减少参与更新的Transformer块,实现了对计算资源消耗的节约,同时减少了参数的过度训练,在减少更新参数量、训练时间的同时,能够减少计算资源的浪费及对训练数据的过拟合现象。
-
公开(公告)号:CN119067199A
公开(公告)日:2024-12-03
申请号:CN202411005467.5
申请日:2024-07-25
Applicant: 中国科学院信息工程研究所
IPC: G06N3/098 , G06N3/0464 , G06N3/042 , G06N3/045 , G06V10/82 , G06V10/44 , G06V10/764 , G06V10/94
Abstract: 本发明公开了一种基于构建客户端间协作图的个性化联邦学习训练方法,属于联邦学习技术领域。本发明的核心步骤包括:1)基于KL散度计算客户端之间的特征分布距离,2)基于计算的邻接矩阵归一化后构建有向协作图,3)基于有向图的聚合带有结构信息的模型,4)本地优化。本发明主要涉及数据分布异质面临的挑战,特别涉及客户端数据分布之间的潜在关系建模,实现了通过构建客户端协作图和提出协作图辅助的个性化聚合与训练方法,缓解了数据异质等挑战,促进了个性化联邦学习中的知识共享。
-
公开(公告)号:CN109145582B
公开(公告)日:2021-07-23
申请号:CN201810568923.5
申请日:2018-06-05
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于字节对编码的密码猜测集生成方法、密码破解方法及装置。该方法首先采用字节对编码对训练集密码进行分词,然后根据分词的结果,采用马尔可夫模型生成密码猜测集。进一步地,使用所述密码猜测集,通过进行字符串匹配来破解明文密码。本发明完全利用统计概率的思想对密码进行切分,并借用马尔可夫模型探究密码组成之间的关联,进而提高密码猜测效果和密码破解效率;用本发明生成的密码猜测集直接进行字符串匹配,可以更好地生成密码猜测集和评估密码的安全强度。
-
公开(公告)号:CN108881369A
公开(公告)日:2018-11-23
申请号:CN201810373966.8
申请日:2018-04-24
Applicant: 中国科学院信息工程研究所
IPC: H04L29/08 , H04L12/947
Abstract: 本发明涉及一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统。该方法包括:1)在不同的管理机站部署基于云消息中间件的节点,由各个所述节点构成消息传输网络;2)在所述消息传输网络的各节点中部署基于数据内容的流触发器;3)通过所述消息传输网络实现跨IDC的数据交换,并通过所述流触发器实现面向内容的数据交换。本发明可以高效、稳定的进行跨IDC数据交换,同时利用基于内容的流触发器进行数据订阅,能根据数据内容进行按需转发,使消费者可以自主决定数据的流向并细粒度地获得所需的数据,提高了网络传输的质量,减小了网络负担。本发明提供的多种工作模式均能稳定使用,能够支撑起不同的应用场景。
-
公开(公告)号:CN104794170B
公开(公告)日:2018-05-01
申请号:CN201510147426.4
申请日:2015-03-30
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于指纹多重哈希布隆过滤器的网络取证内容溯源方法。该方法对捕获的原始网络流量数据包进行重组并构建应用层的会话;在每一个时间间隔内,将会话内容分块存储到增强版指纹多重哈希布隆过滤器中,并保存会话索引表,每一个分块不仅存储到基本布隆过滤器中,还串联会话索引存储到带会话索引的布隆过滤器中;收到查询请求后,使用相同的方法对所查询的摘录进行分块,然后在可能的时间间隔内的所有存档单元中检索,首先将得到的分块在基本布隆过滤器中查询,若能够查询到这些分块,则将得到的分块串联候选的会话索引,并在带会话索引的布隆过滤器中查询,得到传输该摘录的应用层信息。本发明能够提高网络取证内容溯源能力和准确性。
-
公开(公告)号:CN103152222B
公开(公告)日:2015-11-18
申请号:CN201310063228.0
申请日:2013-02-28
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于主机群特征检测速变攻击域名的方法,主要包括步骤:1)网络数据包的抓取和DNS报文特征提取;2)速变攻击域名检测;3)误判检测。其中,速变攻击域名检测包括域名对应主机群的IP分散程序计算、服务可用性评估和网络波动检测,为本发明的核心;误判检测排除速变攻击域名检测过程中正常的大型网络域名和在线率探测中本地网络不佳时的检测结果。本发明分析局域网内DNS报文的集合,基于域名对应的主机群IP分散程度和在线率等特征,避免了对单个DNS报文进行分析的准确率问题,且在计算IP距离时考虑域名对应主机群的规模,从而避免大型良性速变网络被误判。
-
公开(公告)号:CN104966051A
公开(公告)日:2015-10-07
申请号:CN201510297257.2
申请日:2015-06-03
Applicant: 中国科学院信息工程研究所
IPC: G06K9/00
CPC classification number: G06K9/00469
Abstract: 本发明公开了一种文档图像的版式识别方法,首先设计了一个版式入库功能,库中会保存版式内容,以及由版式内容相对字高、对齐方式生成的版式序列号,如果一张未知图片经过版式分析,得到的版式序列号与库中的某个版式序列号一样,那么将通过库中的提示信息去提取该未知图片的版式信息。本发明通过高效以及准确的版面分析方法来识别文档图片,尤其适用于中文公文文档图像的版式识别。
-
公开(公告)号:CN103036743B
公开(公告)日:2015-10-07
申请号:CN201210555371.7
申请日:2012-12-19
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种窃密木马的TCP心跳行为的检测方法,包括:步骤1,抓取网络数据包,还原成TCP数据流;步骤2,检测是否有TCP保活心跳行为;步骤3,检测是否有TCP连接内心跳行为;步骤4,检测是否有TCP连接级心跳行为:步骤5,对检测出的窃密木马心跳行为进行误判检测。本发明基于网络数据包大小、方向和时间等特征,能计算出心跳的周期及其波动的范围,方法简单,检测结果准确全面,能运用在实时检测窃密木马的系统中,具有较好的检测效果。
-
公开(公告)号:CN103152222A
公开(公告)日:2013-06-12
申请号:CN201310063228.0
申请日:2013-02-28
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于主机群特征检测速变攻击域名的方法,主要包括步骤:1)网络数据包的抓取和DNS报文特征提取;2)速变攻击域名检测;3)误判检测。其中,速变攻击域名检测包括域名对应主机群的IP分散程序计算、服务可用性评估和网络波动检测,为本发明的核心;误判检测排除速变攻击域名检测过程中正常的大型网络域名和在线率探测中本地网络不佳时的检测结果。本发明分析局域网内DNS报文的集合,基于域名对应的主机群IP分散程度和在线率等特征,避免了对单个DNS报文进行分析的准确率问题,且在计算IP距离时考虑域名对应主机群的规模,从而避免大型良性速变网络被误判。
-
公开(公告)号:CN118887686A
公开(公告)日:2024-11-01
申请号:CN202411085718.5
申请日:2024-08-08
Applicant: 中国科学院信息工程研究所
IPC: G06V30/19 , G06F40/126 , G06F40/30
Abstract: 本发明公开了一种文生图模型训练及通过该模型生成目标图像的方法,属于网络安全技术领域。以第一文本编码器和第二文本编码器建立文本模型,以潜空间扩散模型和图像解码器建立图像模型;获取良性提示词数据集、对抗提示词数据集和目标提示词;利用数据投毒技术和后门攻击技术微调文本嵌入之间的损失函数,以完成文生图模型的训练。本发明有效消除了文生图模型生成的图像中的敏感内容,保证文生图模型生成目标图像过程的内容安全性和鲁棒性,保障涉及敏感信息的图像不被生成和传播。
-
-
-
-
-
-
-
-
-