动态自适应的模型基准测试的方法及装置、测试设备

    公开(公告)号:CN118626354A

    公开(公告)日:2024-09-10

    申请号:CN202410724666.5

    申请日:2024-06-05

    Abstract: 本申请涉及模型测试技术领域,公开一种动态自适应的模型基准测试的方法及装置、测试设备,方法包括:在动态数据库中选取多个测试题目作为第一测试数据集;将第一测试数据集输入目标待测模型,获得目标待测模型的输出结果;根据输出结果,确定目标待测模型的适应度函数结果;若适应度函数结果满足阈值条件,则对输出结果进行分析,获得目标待测模型的能力测试结果;否则,基于演进策略对第一测试数据集进行更新,并利用更新后的第二测试数据集对目标待测模型进行迭代测试。本申请能够更有效地避免遍历全部测试数据集,能够避免“刷榜”问题,能够提高模型能力测试结果的准确性和可信度,能更高效地更精准地挖掘模型缺陷。

    一种面向人工智能的数据集质量通用评估方法

    公开(公告)号:CN118297444A

    公开(公告)日:2024-07-05

    申请号:CN202410727463.1

    申请日:2024-06-06

    Abstract: 本发明公开了一种面向人工智能的数据集质量通用评估方法,涉及数据评估技术领域,包括S1、参数初始化;S2、自动化检测;S3、人工检测;S4、模型验证;S5、消融实验;S6、质量评分;S7、出具报告。该面向人工智能的数据集质量通用评估方法,提出了新的评估方法和平台框架体系,能对人工智能数据集质量进行标准化规范,帮助提升人工智能模型的训练效率,并通过自动化检测和人工检测结合,提升评估效率以及评估结果的准确性,使其更加适用于大规模数据集的质量评估,同时提供有质量评分计算公式,以获得直观的评估结果,此外,能够根据具体的数据集和应用场景进行定制和调整,具有较强的自适应性和灵活性,以便满足实际应用的需求。

    一种语音数据集质量评估方法和装置

    公开(公告)号:CN112562736B

    公开(公告)日:2024-06-21

    申请号:CN202011459130.3

    申请日:2020-12-11

    Inventor: 李荪 张蔚敏 刘硕

    Abstract: 本申请提供了一种语音数据集质量评估方法和装置。所述方法包括:获取待评估的语音数据集,以及所述语音数据集对应的应用场景;基于所述应用场景对应的质量评估模型获取所述语音数据集的评估值;根据所述评估值评估所述语音数据集的语音质量;其中,所述质量评估模型用于计算输入的语音数据集的语言要素覆盖度、随机信息量、信号有效度,所述语音数据集的特征与所述应用场景要求的特征匹配度,以及所述语音数据集与所述应用场景预设数据集之间的内容相似度;并按照配置的权重对所述覆盖度、随机信息量、信号有效度、特征匹配度和内容相似度进行加权求和获得所述语音数据集的评估值。该方法能够全面、客观、量化地对语音数据集的质量进行评估。

    一种语音数据集质量评估方法和装置

    公开(公告)号:CN112562736A

    公开(公告)日:2021-03-26

    申请号:CN202011459130.3

    申请日:2020-12-11

    Inventor: 李荪 张蔚敏 刘硕

    Abstract: 本申请提供了一种语音数据集质量评估方法和装置。所述方法包括:获取待评估的语音数据集,以及所述语音数据集对应的应用场景;基于所述应用场景对应的质量评估模型获取所述语音数据集的评估值;根据所述评估值评估所述语音数据集的语音质量;其中,所述质量评估模型用于计算输入的语音数据集的语言要素覆盖度、随机信息量、信号有效度,所述语音数据集的特征与所述应用场景要求的特征匹配度,以及所述语音数据集与所述应用场景预设数据集之间的内容相似度;并按照配置的权重对所述覆盖度、随机信息量、信号有效度、特征匹配度和内容相似度进行加权求和获得所述语音数据集的评估值。该方法能够全面、客观、量化地对语音数据集的质量进行评估。

Patent Agency Ranking