基于代码预训练模型的测试断言语句自动化生成方法

    公开(公告)号:CN117520142A

    公开(公告)日:2024-02-06

    申请号:CN202311058291.5

    申请日:2023-08-22

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于代码预训练模型的测试断言语句自动化生成方法,清洗筛选得到包含测试代码和被测代码的代码数据集;然后构建微调数据集:对代码数据集的测试代码中的所有断言数据替换为占位符,和测试代码结合作为微调数据集中的输入部分,断言语句序列作为微调数据集中的输出部分;根据预训练模型所需输入对微调数据集中的输入数据形式进行调整,之后进行训练,得到的预训练模型,生成断言语句序列。本发明生成的断言语句支持用户自定义断言位置和数量,并且可读性可解释性强。在功能上,也能辅助测试开发人员找到现实场景中的程序缺陷和错误。

Patent Agency Ranking