-
公开(公告)号:CN117313105A
公开(公告)日:2023-12-29
申请号:CN202311257110.1
申请日:2023-09-27
Applicant: 哈尔滨工程大学 , 哈尔滨工程大学三亚南海创新发展基地 , 价值链技术(深圳)有限公司
Inventor: 冯光升 , 李冰洋 , 张熠哲 , 蔡成涛 , 王巍 , 陆蓓婷 , 蒋文创 , 王小芳 , 王一 , 杨玉东 , 董宇欣 , 郎大鹏 , 李思照 , 刘泽超 , 马志强 , 申林山 , 宋洪涛 , 王兴梅 , 王也
Abstract: 本发明公开了面向智能合约漏洞数据集的不平衡数据集处理系统及方法,系统包括:数据读取模块:用于依次读取不同类别的漏洞样本集,将所述不同类别的漏洞样本集输入子集划分模块中;子集划分模块:用于对所述不同类别的漏洞数据集中的少数类样本进行划分,获取若干样本子集,并将所述样本子集发送至数据生成模块;数据生成模块:用于分别对不同类别的所述样本子集进行处理,生成新数据;数据读取模块、子集划分模块、数据生成模块依次连接。本发明减小了边界模糊的问题,在一定程度上提升了样本的质量,同时对于多种样本进行了扩充,适用于多类数据的样本集。
-
公开(公告)号:CN117033941A
公开(公告)日:2023-11-10
申请号:CN202311056107.3
申请日:2023-08-22
Applicant: 哈尔滨工程大学 , 哈尔滨工程大学三亚南海创新发展基地 , 价值链技术(深圳)有限公司
Inventor: 王巍 , 韩子屹 , 蔡成涛 , 陆蓓婷 , 蒋文创 , 杨玉东 , 曲晓威 , 杨东梅 , 张海涛 , 王小芳 , 张万松 , 张越 , 庄园 , 苘大鹏 , 李伟 , 玄世昌 , 郭方方
Abstract: 本发明公开一种基于HMM和降噪自编码器的中文对抗样本恢复方法,涉及对抗文本处理技术领域,包括,获取对抗文本,对对抗文本进行符号清洗;基于隐马尔可夫模型将所述对抗文本中的拼音串转换为汉字序列,并将汉字序列拼接为汉字串;通过降噪自编码器对所述对抗文本中的汉字字符及汉字串进行噪声去除,得到候选词序列;通过置信度‑相似度解码器对所述候选词序列进行解码,得到修正文本;通过双向机器翻译对所述修正文本进行处理,生成恢复汉字文本。本发明能够实现中文对抗样本的高效恢复。
-