一种基于大模型数据增强的项目域代码摘要自动生成方法

    公开(公告)号:CN119166211A

    公开(公告)日:2024-12-20

    申请号:CN202411320547.X

    申请日:2024-09-23

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于大模型数据增强的项目域代码摘要自动生成方法,该方法包括项目相似度数据增强、项目域元学习微调、项目域代码摘要生成。首先通过对比学习构造正负样本从函数粒度的源代码中计算代码相似度分数并基于项目相似度计算生成项目域增强数据,其次通过元学习技术进行项目域微调,通过项目域子任务来学习多元项目特征信息,以保证对项目域中增强数据的噪声的抗噪性能,最后目标项目域数据上进行微调,将步骤二的元学习模型参数嵌入目标域任务以整合项目域数据信息,使用解码器进行代码摘要生成。本发明能够通过与代码预训练模型相结合来增强代码摘要方法在处理少样本项目域数据信息方面的能力,从而提高代码摘要生成的性能和效率。

    一种预训练代码增强的编程问答社区答案推荐方法

    公开(公告)号:CN117591647A

    公开(公告)日:2024-02-23

    申请号:CN202311555457.4

    申请日:2023-11-21

    Applicant: 重庆大学

    Abstract: 本发明涉及一种预训练代码增强的编程问答社区答案推荐方法,分为两个阶段,训练阶段和推荐阶段。训练阶段可分为标签推荐预训练阶段和问答分类微调阶段,其中标签推荐预训练模型使用问题中的标题、主体、代码信息作为输入,以问题标签作为真值进行学习;在微调阶段,复用预训练模型,分别对问题和答案中的信息进行编码,最后将问题和答案的特征向量映射到分类空间中。推荐阶段对于一个新问题,先使用搜索引擎查询相似的问题标题,取前Q个作为候选问题,并确定候选答案,将候选答案与新问题作为微调过的模型的输入,得到每对问答的分类的置信概率,通过加权求和的方式计算问答的匹配得分,排序之后前Q’为最终的推荐答案。

    一种基于纠删码自适应编码的数据可靠存储方法

    公开(公告)号:CN117435387A

    公开(公告)日:2024-01-23

    申请号:CN202311362620.5

    申请日:2023-10-20

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于纠删码自适应编码的数据可靠存储方法,该发明通过将数据编码为纠删码进行保存,并且在不同的工作负载下,转换不同的编码策略,从而使存储系统能适应不同的工作环境,维持数据的可靠性。该发明由改良纠删码和自适应编码两个组件构成,改良纠删码基于现有纠删码进行改良,本发明提出的一种异或分组编码XGC,增强现有纠删码的性能,为自适应编码提供基础。组件二基于数据的冷热特点,以及存储系统的使用率,进行工作负载判断并改变编码策略。

    一种基于标签嵌入的多标签少样本图像分类方法

    公开(公告)号:CN116721279A

    公开(公告)日:2023-09-08

    申请号:CN202310539501.6

    申请日:2023-05-15

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于标签嵌入的多标签少样本图像分类方法,该方法通过类似化学过程中的精馏操作,针对多标签少样本类视觉特征到标签的映射问题进行处理。该方法使用原型生成模块来根据词嵌入生成类语义原型,并将其投影到视觉‑语义联合特征空间中。在联合特征空间中,通过特征精馏模块中的自注意力机制和梯度回流机制,完成视觉‑语义聚合特征精馏,并对词嵌入提供的标签关系进行建模,优化生成的语义原型的判别性和对视觉特征的引导能力,从而有效利用标签嵌入作为多标签少样本图像分类任务中的信息补充。通过试验表明,该方法具有良好的分类性能和对于不可见类的泛化能力,能够处理多标签少样本图像分类任务中的类特征与标签之间的映射和多标签关系建模两大难题。

    一种基于知识蒸馏的弱监督视频时序行为定位方法

    公开(公告)号:CN113591731B

    公开(公告)日:2023-09-05

    申请号:CN202110887042.1

    申请日:2021-08-03

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于知识蒸馏的弱监督视频时序行为定位方法。包括具体步骤如下:构建分类器模型,选定一个行为类别的已剪切视频,对该视频进行视频特征提取和嵌入特征计算;利用嵌入特征计算Pcls和W0,之后计算出Pscore;通过Pscore计算交叉熵损失来更新分类器模型中各个模块的相关参数。构建教师学生网络模型,选择一个该行为类别的未剪切视频,通过特征提取模块提取特征,通过嵌入特征模块计算该未剪切视频的嵌入特征,然后将该嵌入特征通过背景干扰抑制模块和特征对齐模块处理后得到其增强特征;将增强特征通过非极大值抑制法计算出最终的定位结果。通过本方法可以降低背景信息带来的干扰和提高行为信息表达的完整性,使最终的定位结果更加准确。

    一种基于组件感知的日志异常检测方法

    公开(公告)号:CN111949480B

    公开(公告)日:2023-08-11

    申请号:CN202010795863.8

    申请日:2020-08-10

    Applicant: 重庆大学

    Abstract: 本发明涉及基于组件感知的日志异常检测方法,该方法将目标软件的日志消息转换为日志模板序列和组件序列,然后进行模型训练,将两个LSTM模型组合使用,两个LSTM模型训练使用相同的损失函数,采用梯度下降优化算法更行参数值,训练完成得到由日志检测模型和组件检测模型构成的组合模型;将t‑h到t‑1时刻的所有日志数据的参考日志模板序列和参考组件序列输入组合模型得到可能日志模板集和可能组件模板集;当t时刻日志消息mt的待测日志模板序列在可能日志模板集中,且t时刻日志消息mt的待测组件序列在可能组件模板集Cg中,则认为日志消息mt为正常日志,否则产生系统告。试验结果表明,本发明方法的召回率和F值更高,表现更好。

    一种基于聚类和高斯LDA的服务发现方法

    公开(公告)号:CN111832289B

    公开(公告)日:2023-08-11

    申请号:CN202010668037.7

    申请日:2020-07-13

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于聚类和高斯LDA的服务发现方法,包括如下步骤:对服务数据集进行数据解析,使用Doc2Vec和Word2Vec训练段落嵌入和词嵌入;使用修改的K‑Means算法将Doc2Vec向量集合聚类;基于词嵌入向量集扩展查询得到扩展的查询语句Qe和扩展的查询向量Vqe;基于扩展的查询语句计算其与聚类所得的每一个聚类簇的Doc2Vec矩阵的平均余弦相似度,将相似度最高的簇作为目标簇;基于所选目标簇和训练所得的词嵌入向量,构建高斯LDA模型,得到“文档‑主题分布”和“主题的高斯分布”;使用两个分布计算目标簇中的各个服务与扩展后的用户查询匹配的概率并降序排列。本方法服务匹配准确性高。

    一种基于上下文感知的缺陷定位方法

    公开(公告)号:CN112965894B

    公开(公告)日:2023-07-07

    申请号:CN202110152656.5

    申请日:2021-02-04

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于上下文感知的缺陷定位方法,该方法利用程序切片技术构建一个缺陷上下文,该上下文可表示为一个用程序依赖图表示的有向图,图中节点为和失败有直接或间接关联关系的语句,边为这些语句之间的关联关系。基于该图,CAN将图中的每一个节点均采用one‑hot编码嵌入节点表示向量,并且利用GNN来获取语句之间的依赖关系,CAN在这些节点表示向量的基础上通过利用测试用例进行训练,从而可以获得更精确的节点表示向量。最后,通过将有缺陷的目标程序的缺陷上下文语句中的每一条语句均只被一个测试用例覆盖且一个测试用例也只覆盖一条缺陷上下文语句的方法,构建一个虚拟测试用例集。将这个测试用例集输入训练好的GNN中得到每个语句的可疑值。本方法以分析缺陷上下文并将其纳入可疑性评估以改善缺陷定位,经过试验分析可知本发明方法可以显着提高缺陷定位的有效性。

    一种模型域的失败测试用例生成方法

    公开(公告)号:CN112685327B

    公开(公告)日:2023-06-27

    申请号:CN202110115994.1

    申请日:2021-01-28

    Applicant: 重庆大学

    Abstract: 本发明涉及一种模型域的失败测试用例生成方法,该方法首先定义了一个最小可疑集合,从所有失败测试用例中抽取共同的特征,之后对于模型域中每一个失败的测试用例在保留失败测试用例的共同特征的基础上对非共同特征的信息进行变异,从而产生新的模型域的失败测试用例。最后,将新增的模型域的失败测试用例融入原有测试用例集中并进行缺陷的定位。本发明方法使用变异的最近邻算法来生成模型域的失败测试用例向量,从而达到提升缺陷定位效果的目的,和传统的从输入域生成测试用例的方法不同,本发明方法要更加简单有效,它不用通过程序执行来获取一个失败的标签。

Patent Agency Ranking