一种面向卫星监测数据智能异常感知的时序预测方法

    公开(公告)号:CN118364388B

    公开(公告)日:2025-04-11

    申请号:CN202410466031.X

    申请日:2024-04-18

    Abstract: 本发明涉及一种面向卫星监测数据智能异常感知的时序预测方法,通过可逆实例归一化来处理卫星时间序列数据中普遍存在的分布偏移问题,从而提高时间序列预测的性能。采用将Autoformer和FEDformer中使用的分解方案与TSMixer全MLP架构线性层相结合的DTSMixer模型对历史时间序列进行回归,直接预测未来的时间序列。由于RevIN‑DTSMixer方法是一个简单的全MLP架构线性模型,因此其运行效率和参数数量都远远优于基于Transformer的预测方法。在真实数据集上的实验结果表明,RevIN‑DTSMixer方法能显著提高时序数据预测的准确性,具有简单,高效且精确的优势。

    一种基于代码变更大模型的漏洞检测方法

    公开(公告)号:CN119646819A

    公开(公告)日:2025-03-18

    申请号:CN202411687424.X

    申请日:2024-11-25

    Applicant: 重庆大学

    Abstract: 本发明提出了一种基于代码变更大模型的漏洞检测方法。包括如下步骤:对数据集进行预处理,删除重复样本和注释,仅保留代码文本,对代码文本进行token化并去除重复token。然后,遍历无漏洞特征的代码文本,计算与目标代码的Jaccard相似度,选择与无漏洞特征的代码文本中相似度最高的一个组成数据样本对。将无漏洞特征的代码文本视为变更前片段,目标代码视为变更后片段,提取代码间差异部分并标记为增加或删除的代码片段。使用基于代码变更的大模型CCT5的预训练权重初始化模型,调整模型结构,设置关键参数,在训练集上微调模型并更新参数,用于检测代码漏洞;将一段代码文本输入在微调任务中表现最佳的CCT5模型,该模型输出其是否具有漏洞的预测值。

    一种基于大模型的代码静态分析警告自动修复方法

    公开(公告)号:CN118838824A

    公开(公告)日:2024-10-25

    申请号:CN202410873114.0

    申请日:2024-07-01

    Abstract: 本发明涉及一种基于大模型的代码静态分析警告自动修复方法,该方法利用基于代码的大模型,通过模型在预训练阶段学习到的代码理解能力和生成能力,结合静态代码扫描分析工具对潜在异味的精准定位,能够有效地识别和修复软件代码中的潜在异味。这种方法可以显著提高软件开发的效率和代码质量,减少人工干预,同时确保更高的代码安全性和可维护性。该技术不仅适用于传统的软件开发过程,也适应于持续集成和持续部署(CI/CD)环境中的动态代码。通过这种方式,可以有效地管理和优化大规模软件项目的代码库。

    一种面向深度神经网络模型的测试用例选择方法

    公开(公告)号:CN118245382A

    公开(公告)日:2024-06-25

    申请号:CN202410452033.3

    申请日:2024-04-16

    Applicant: 重庆大学

    Abstract: 本发明涉及一种面向深度神经网络模型的测试用例选择方法,属于计算机软件测试技术领域,该发明的核心思想是,度量循环神经网络对每个测试用例的置信度与测试用例之间的相似程度,选择出具有代表性的低置信度测试用例。该发明主要由状态向量空间构建、不确定性与相似性度量和测试优先级排序三个步骤组成。1)对于给定的测试集输入,提取循环神经网络在每个时间步下输出的概率向量。2)在此向量空间内度量模型对每条测试用例的不确定性和模型状态改变的相似性。3)根据不确定性对测试用例集排序,根据相似性决定测试用例的去留。本发明适用于从大规模未标记的数据集中筛选出易引发循环神经网络错误行为的数据子集,以降低数据标注的成本。

    一种基于时序数据预测的异常检测方法

    公开(公告)号:CN118171214A

    公开(公告)日:2024-06-11

    申请号:CN202410349385.6

    申请日:2024-03-26

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于时序数据预测的异常检测方法,它包括利用维度独立解耦多维时间序列的复杂性,得到多个单变量的时间序列;利用平均池化方法进行序列分解,得到有更准确知识的趋势性序列和可能带有噪声和异常的季节性序列;对于趋势性序列和季节性序列采用相同的标准化和分割操作,得到标准化后的数据块;结合对趋势性数据块使用基于点积注意力的全量预测和对季节性序列使用基于稀疏注意力的稀疏预测结果,得到最终预测值;计算实际值与预测值之间的预测误差,并基于极值理论生成动态阈值,从而通过对比阈值与预测误差实现异常检测。该方法在无标记的情况下实现了对多维时间序列的异常检测且检测准确率高。

    一种基于共同注意力表征学习的代码搜索方法

    公开(公告)号:CN111488137B

    公开(公告)日:2023-04-18

    申请号:CN202010267172.0

    申请日:2020-04-07

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于共同注意力表征学习的代码搜索方法,包括取每个代码特征和该代码所对应的描述;分别采用三个独立的CNN神经网络嵌入方法名、词语和描述,用LSTM网络嵌入API序列得到相应的特征矩阵;然后将方法名,API序列和词语对应的特征矩阵合并为一个矩阵作为每个代码的特征矩阵;引入经神经网络学习的参数矩阵,得到用于代码和其描述的共同注意力表征;将大量相互匹配的代码和描述作为模型输入,同步更新网络参数,得到优化的模型;代码搜索预测,将相关度排在前k个的向量c所对应的代码作为推荐列表输出。该方法在MRR方面表现优异,而且本发明模型结构简单,在模型训练上的运行速度和相应速度上都很快。

    一种基于命名模式的方法名称推荐方法

    公开(公告)号:CN115826947A

    公开(公告)日:2023-03-21

    申请号:CN202211547271.X

    申请日:2022-12-05

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于命名模式的方法名称推荐方法,该方法包括如下步骤:首先利用大规模数据集构建检索库,输入目标项目方法,通过代码的令牌级相似度,从检索库中检索出与目标项目方法最相似的方法;然后,使用搜索引擎得到上下文序列,使用最相似的方法的名称作为模式指导器,提供目标方法名称的命名模式;采用NamPat将目标方法的上下文信息与模式指导器相结合,进行方法名称推荐。本方法可以使得对未知的方法进行更准确的名称推荐。

    一种基于上下文感知的缺陷定位方法

    公开(公告)号:CN112965894A

    公开(公告)日:2021-06-15

    申请号:CN202110152656.5

    申请日:2021-02-04

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于上下文感知的缺陷定位方法,该方法利用程序切片技术构建一个缺陷上下文,该上下文可表示为一个用程序依赖图表示的有向图,图中节点为和失败有直接或间接关联关系的语句,边为这些语句之间的关联关系。基于该图,CAN将图中的每一个节点均采用one‑hot编码嵌入节点表示向量,并且利用GNN来获取语句之间的依赖关系,CAN在这些节点表示向量的基础上通过利用测试用例进行训练,从而可以获得更精确的节点表示向量。最后,通过将有缺陷的目标程序的缺陷上下文语句中的每一条语句均只被一个测试用例覆盖且一个测试用例也只覆盖一条缺陷上下文语句的方法,构建一个虚拟测试用例集。将这个测试用例集输入训练好的GNN中得到每个语句的可疑值。本方法以分析缺陷上下文并将其纳入可疑性评估以改善缺陷定位,经过试验分析可知本发明方法可以显着提高缺陷定位的有效性。

    一种针对软件变更日志生成方法的自动化质量保证框架

    公开(公告)号:CN112527769A

    公开(公告)日:2021-03-19

    申请号:CN202011426108.9

    申请日:2020-12-09

    Applicant: 重庆大学

    Abstract: 本发明公开了一种针对软件变更日志生成方法的自动化质量保证框架。包括如下步骤:基于软件历史变更数据,生成diffh的单词wd和msgref的单词wm的单词向量和基于协同过滤算法,计算单词wd和wm之间的关联性Rel(wd,wm);构建单词wd的单词映射表基于已构建的单词映射表,分别计算两个质量分数Precisioni和Recalli;基于词频‑逆文档频率(TF‑IDF),生成变更差异向量di;计算待测软件变更日志和历史软件变更之间的相似程度选择与待测软件变更Ci相似度最高的前n个历史软件变更至计算相关性分数RetScorei;设置阈值Prect、Rect和Rett,对待测软件变更Ci的生成日志的语义相关性进行预测;基于预测结果对软件变更日志进行过滤或者保留。

    一种基于聚类和高斯LDA的服务发现方法

    公开(公告)号:CN111832289A

    公开(公告)日:2020-10-27

    申请号:CN202010668037.7

    申请日:2020-07-13

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于聚类和高斯LDA的服务发现方法,包括如下步骤:对服务数据集进行数据解析,使用Doc2Vec和Word2Vec训练段落嵌入和词嵌入;使用修改的K-Means算法将Doc2Vec向量集合聚类;基于词嵌入向量集扩展查询得到扩展的查询语句Qe和扩展的查询向量Vqe;基于扩展的查询语句计算其与聚类所得的每一个聚类簇的Doc2Vec矩阵的平均余弦相似度,将相似度最高的簇作为目标簇;基于所选目标簇和训练所得的词嵌入向量,构建高斯LDA模型,得到“文档-主题分布”和“主题的高斯分布”;使用两个分布计算目标簇中的各个服务与扩展后的用户查询匹配的概率并降序排列。本方法服务匹配准确性高。

Patent Agency Ranking