-
公开(公告)号:CN118094563A
公开(公告)日:2024-05-28
申请号:CN202410326466.4
申请日:2024-03-21
Applicant: 浙江大学 , 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
Abstract: 本发明提出了一种基于大语言模型和版本提交过滤的开源软件漏洞补丁检测方法及装置。首先,从漏洞数据库和开源代码仓库收集开源软件漏洞信息及代码仓库信息,之后得到代码仓库修复版本上一版本到修复版本的所有代码提交,用以在更小的候选提交集合中找到正确补丁提交,再按照预定规则筛选版本代码提交集得到候选代码提交集,根据漏洞信息和候选提交信息,构建自洽性思维链生成提示词,调用大语言模型,得到关于漏洞补丁的输出序列和对应的推理路径,最后基于多数投票的原则得到漏洞代码补丁提交集。基于安全可靠的本发明在泛化能力、准确性、成本、效率、延迟性等方面优于现有方法,且在不同规模和领域的项目上表现稳定。
-
公开(公告)号:CN118626517A
公开(公告)日:2024-09-10
申请号:CN202410918721.4
申请日:2024-07-10
Applicant: 浙江大学 , 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
IPC: G06F16/2453 , G06F16/28 , G06F16/242 , G06F16/27
Abstract: 本发明公开了一种基于区块链数据不可篡改特性的高效分类检索结构及其衔接查询方法。本发明中的数据属性按特征进行分类,每个数据是否具有某一个特征用二进制的一个比特标识,其最终索引的数据保持区块链上数据的时序性;检索过程中以位运算和数学运算为主,最终检索得到的结果是满足条件的数据相对于第一个数据的相对偏移量,最后在数据文件中通过计算偏移量移动磁头进行精确I/O。本发明基于区块链上数据不可篡改的独特特性,能以常数数量级进行维护,具有极高的可扩展性;检索单个数据的复杂度也能降为常数数量级。同时提出了衔接查询,可以极大地减少检索开销,解决了现有区块链检索结构随着区块链上数据规模增大而导致的性能下降问题。
-
公开(公告)号:CN119473952A
公开(公告)日:2025-02-18
申请号:CN202411447447.3
申请日:2024-10-16
Applicant: 浙江大学 , 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
Abstract: 本发明公开了一种基于CXL内存架构的两级数据池数据加载方法,本发明将CXL内存作为冷数据池存储使用频率较低的数据,服务器节点的DRAM内存作为热数据池存储使用频率较高的数据。当一个CXL内存上的数据多次被使用时,数据监控器将通过延迟缓存策略判断是否能将其转移为热数据,并将其缓存。本发明还采用了自适应的缓存策略将热数据通过热数据池在服务器保留一定时间,提升应用性能。热数据池动态的学习缓存策略。每次添加热数据或驱逐热数据时,都将根据LRU‑S、LFU‑S和FIFO专家权重来选择缓存策略。同时热数据池包含历史列表,允许缓存策略的驱逐决策后悔行为,并对错误决策进行惩罚。
-
公开(公告)号:CN118316623A
公开(公告)日:2024-07-09
申请号:CN202410496169.4
申请日:2024-04-24
Applicant: 浙江大学软件学院(宁波)管理中心(宁波软件教育中心) , 浙江大学
Abstract: 本发明公开了一种AIGC模型联邦学习训练的全阶段可信保障方法。本发明以区块链作为技术和Nostr协议为基础,设计基于Nostr协议的多方数据验证机制保障数据准备阶段可信,设计链上和链下相结合的验证策略保证适配器更新可信,设计链上选举,链下合并模型,链上验证策略保证模型合并可信,旨在保证以大语言模型为代表的AIGC模型联邦学习训练的全流程可信。
-
公开(公告)号:CN119473650A
公开(公告)日:2025-02-18
申请号:CN202411447448.8
申请日:2024-10-16
Applicant: 浙江大学 , 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
IPC: G06F9/54 , G06F12/02 , G06F16/22 , G06F16/245
Abstract: 本发明公开了一种基于CXL内存架构的多节点高性能数据共享索引方法,本发明中主服务器节点用于构建CXL数据索引区和数据存储区。各服务器节点连接CXL内存设备后,通过NUMA绑定方式将CXL内存设备挂载到服务器节点,并指定共享区域,实现多节点对CXL物理内存数据的共享访问。连接到CXL内存后,主服务器节点构建CXL数据索引区和共享存储区,并通过哈希索引表支持多节点的数据存储和查询。查询请求时,通过哈希函数定位数据在哈希表中的位置,并在数据哈希索引表中进行查询和匹配,最终定位数据所在内存区域。找到数据后,服务器节点将数据从CXL内存加载到本地内存中使用,实现了跨服务器节点的数据共享。
-
公开(公告)号:CN119271489A
公开(公告)日:2025-01-07
申请号:CN202411294446.X
申请日:2024-09-14
Applicant: 浙江大学 , 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
IPC: G06F11/30
Abstract: 本发明公开了一种库操作系统系统级别事件检测与控制方法,Unikernel作为单核操作系统,传统监控方式需要使用一个线程,会使监控线程和主线程进行资源抢占,极大的影响主程序的执行。而本发明是一种无线程的监控方式,能够在不干扰主线程的情况下,对Unikernel的运行状态进行实时的采集和分析,提高监控的效率和准确性。现有堆栈监控方式不够灵活,如果栈上有重要事件,必须通过不断轮询才能直到它的情况。没有一种自动触发的机制来通知栈上行为,可控性不强。本发明构建了基于事件驱动的堆栈监控方式,能够在栈上发生变化时,自动触发相应的回调函数,实现对栈上事件的及时响应和处理,提高堆栈监控的灵活性和可控性。
-
公开(公告)号:CN118736751A
公开(公告)日:2024-10-01
申请号:CN202411216753.6
申请日:2024-09-02
Applicant: 杭州善瑟科技有限公司 , 浙江大学滨江研究院
Abstract: 本发明公开了便携式电气火灾风险快速检测设备,基于具有早期研究、误报源识别功能的超前预警技术为特征,与高误报的现有电气火灾报警技术技术相比,具有隐患早发现、识别误报源的显著实用价值,具备隐患早发现、不漏报、不误报的关键能力。基于过程参数的超前预警技术具有检测精度数量级提升的理论基础,其连续时间段的多维度参数描述使其具有显著的行为跟踪的技术特征,可成为实施电气火灾数字化风险普查的关键技术手段。
-
公开(公告)号:CN118503125A
公开(公告)日:2024-08-16
申请号:CN202410689201.0
申请日:2024-05-30
Applicant: 浙江大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于思维链提示的单元测试自动生成方法及装置,包括:(1)对待测项目进行解析,构建抽象语法树;(2)根据抽象语法树节点之间的关联,构建系统依赖图;(3)利用系统依赖图,定位出待测方法最为相关的上下文信息;(4)利用待测方法最为相关的上下文信息,构建精简上下文代码;(5)建立对象构建图,自底向上地结合思维链提示技术,引导大语言模型为待测方法生成对象创建代码;(6)结合对象创建代码和精简上下文代码,指导大语言模型生成正确的测试用例,并进行验证修复。本发明能有效改进大模型生成测试用例的正确性,利用大模型的交互能力来改进生成的测试用例,最终在正确率、覆盖率、断言质量等方面优于现有方法。
-
公开(公告)号:CN117591172A
公开(公告)日:2024-02-23
申请号:CN202311546640.8
申请日:2023-11-20
Applicant: 浙江大学 , 恒生电子股份有限公司
Abstract: 本发明公开了一种基于向量数据库的特征融合代码克隆检测方法及装置,能够对代码的函数级别进行解析,得到融合了词法、语法和特征信息的代码指纹,并采用了向量数据库进行存储和查找,大大加快了对于相似代码的查询和检测;随后根据查询到的相似代码函数进行阈值筛选和基于token的最长公共子序列计算得到细粒度的相似度结果,并根据细粒度的相似结果作为函数级别的代码相似结果;最后,根据函数级别的代码相似结果反推出文件级别的相似度结果,通过文件级别的相似度结果反推出项目级别的相似度结果。本发明可以实现在海量数据(亿级别及以上)的情况下快速筛选出最为相似的代码克隆结果,既能保证检测速度,又能保证细粒度情况下检测结果的准确性。
-
公开(公告)号:CN117407242A
公开(公告)日:2024-01-16
申请号:CN202311303412.8
申请日:2023-10-10
Applicant: 浙江大学
IPC: G06F11/30
Abstract: 本发明公开了一种基于大语言模型的低成本、零样本的在线日志解析方法,首先,使用正则表达式提取日志消息中的日志内容;然后与数据库中的日志模板进行正则匹配;匹配成功,更新对应日志模板的日志样本;匹配失败,则与大语言模型进行对话获得新的日志模板;并进行模板纠正,防止大语言模型生成的日志模板不能正则匹配日志消息;当产生新的模板时,进行模板合并;当更新日志样本时,进行模板拆分;对于所有即将加入数据库的日志模板,首先通过后处理进行日志模板规范化,然后将日志模板保存到数据库中。本发明生成的日志模板在单词的解析准确度上要优于传统方法,在速度和花费上相比于直接使用大语言模型执行日志解析任务具有显著优势。
-
-
-
-
-
-
-
-
-