一种基于渐进式学习的模型微调方法和系统

    公开(公告)号:CN119293233A

    公开(公告)日:2025-01-10

    申请号:CN202411210233.4

    申请日:2024-08-30

    Abstract: 本发明属于语言模型处理领域,涉及一种基于渐进式学习的模型微调方法和系统。该方法在预训练模型的微调过程中,根据Transformer块对模型性能的不同贡献,将对预训练模型的性能贡献大的Transformer块进行着重训练,将对预训练模型的性能贡献小的Transformer块进行少量训练。本发明将渐进式学习的思想引入到模型微调中,在微调过程中逐渐减少参与更新的Transformer块,实现了对计算资源消耗的节约,同时减少了参数的过度训练,在减少更新参数量、训练时间的同时,能够减少计算资源的浪费及对训练数据的过拟合现象。

    一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统

    公开(公告)号:CN108881369A

    公开(公告)日:2018-11-23

    申请号:CN201810373966.8

    申请日:2018-04-24

    Abstract: 本发明涉及一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统。该方法包括:1)在不同的管理机站部署基于云消息中间件的节点,由各个所述节点构成消息传输网络;2)在所述消息传输网络的各节点中部署基于数据内容的流触发器;3)通过所述消息传输网络实现跨IDC的数据交换,并通过所述流触发器实现面向内容的数据交换。本发明可以高效、稳定的进行跨IDC数据交换,同时利用基于内容的流触发器进行数据订阅,能根据数据内容进行按需转发,使消费者可以自主决定数据的流向并细粒度地获得所需的数据,提高了网络传输的质量,减小了网络负担。本发明提供的多种工作模式均能稳定使用,能够支撑起不同的应用场景。

    基于指纹多重哈希布隆过滤器的网络取证内容溯源方法和系统

    公开(公告)号:CN104794170B

    公开(公告)日:2018-05-01

    申请号:CN201510147426.4

    申请日:2015-03-30

    Abstract: 本发明涉及一种基于指纹多重哈希布隆过滤器的网络取证内容溯源方法。该方法对捕获的原始网络流量数据包进行重组并构建应用层的会话;在每一个时间间隔内,将会话内容分块存储到增强版指纹多重哈希布隆过滤器中,并保存会话索引表,每一个分块不仅存储到基本布隆过滤器中,还串联会话索引存储到带会话索引的布隆过滤器中;收到查询请求后,使用相同的方法对所查询的摘录进行分块,然后在可能的时间间隔内的所有存档单元中检索,首先将得到的分块在基本布隆过滤器中查询,若能够查询到这些分块,则将得到的分块串联候选的会话索引,并在带会话索引的布隆过滤器中查询,得到传输该摘录的应用层信息。本发明能够提高网络取证内容溯源能力和准确性。

    一种基于主机群特征检测速变攻击域名的方法

    公开(公告)号:CN103152222B

    公开(公告)日:2015-11-18

    申请号:CN201310063228.0

    申请日:2013-02-28

    Abstract: 本发明涉及一种基于主机群特征检测速变攻击域名的方法,主要包括步骤:1)网络数据包的抓取和DNS报文特征提取;2)速变攻击域名检测;3)误判检测。其中,速变攻击域名检测包括域名对应主机群的IP分散程序计算、服务可用性评估和网络波动检测,为本发明的核心;误判检测排除速变攻击域名检测过程中正常的大型网络域名和在线率探测中本地网络不佳时的检测结果。本发明分析局域网内DNS报文的集合,基于域名对应的主机群IP分散程度和在线率等特征,避免了对单个DNS报文进行分析的准确率问题,且在计算IP距离时考虑域名对应主机群的规模,从而避免大型良性速变网络被误判。

    一种文档图像的版式识别方法

    公开(公告)号:CN104966051A

    公开(公告)日:2015-10-07

    申请号:CN201510297257.2

    申请日:2015-06-03

    CPC classification number: G06K9/00469

    Abstract: 本发明公开了一种文档图像的版式识别方法,首先设计了一个版式入库功能,库中会保存版式内容,以及由版式内容相对字高、对齐方式生成的版式序列号,如果一张未知图片经过版式分析,得到的版式序列号与库中的某个版式序列号一样,那么将通过库中的提示信息去提取该未知图片的版式信息。本发明通过高效以及准确的版面分析方法来识别文档图片,尤其适用于中文公文文档图像的版式识别。

    一种窃密木马的TCP心跳行为的检测方法

    公开(公告)号:CN103036743B

    公开(公告)日:2015-10-07

    申请号:CN201210555371.7

    申请日:2012-12-19

    Abstract: 本发明涉及一种窃密木马的TCP心跳行为的检测方法,包括:步骤1,抓取网络数据包,还原成TCP数据流;步骤2,检测是否有TCP保活心跳行为;步骤3,检测是否有TCP连接内心跳行为;步骤4,检测是否有TCP连接级心跳行为:步骤5,对检测出的窃密木马心跳行为进行误判检测。本发明基于网络数据包大小、方向和时间等特征,能计算出心跳的周期及其波动的范围,方法简单,检测结果准确全面,能运用在实时检测窃密木马的系统中,具有较好的检测效果。

    一种基于主机群特征检测速变攻击域名的方法

    公开(公告)号:CN103152222A

    公开(公告)日:2013-06-12

    申请号:CN201310063228.0

    申请日:2013-02-28

    Abstract: 本发明涉及一种基于主机群特征检测速变攻击域名的方法,主要包括步骤:1)网络数据包的抓取和DNS报文特征提取;2)速变攻击域名检测;3)误判检测。其中,速变攻击域名检测包括域名对应主机群的IP分散程序计算、服务可用性评估和网络波动检测,为本发明的核心;误判检测排除速变攻击域名检测过程中正常的大型网络域名和在线率探测中本地网络不佳时的检测结果。本发明分析局域网内DNS报文的集合,基于域名对应的主机群IP分散程度和在线率等特征,避免了对单个DNS报文进行分析的准确率问题,且在计算IP距离时考虑域名对应主机群的规模,从而避免大型良性速变网络被误判。

    一种文生图模型训练及通过该模型生成目标图像的方法

    公开(公告)号:CN118887686A

    公开(公告)日:2024-11-01

    申请号:CN202411085718.5

    申请日:2024-08-08

    Abstract: 本发明公开了一种文生图模型训练及通过该模型生成目标图像的方法,属于网络安全技术领域。以第一文本编码器和第二文本编码器建立文本模型,以潜空间扩散模型和图像解码器建立图像模型;获取良性提示词数据集、对抗提示词数据集和目标提示词;利用数据投毒技术和后门攻击技术微调文本嵌入之间的损失函数,以完成文生图模型的训练。本发明有效消除了文生图模型生成的图像中的敏感内容,保证文生图模型生成目标图像过程的内容安全性和鲁棒性,保障涉及敏感信息的图像不被生成和传播。

Patent Agency Ranking