-
公开(公告)号:CN110941701B
公开(公告)日:2023-02-28
申请号:CN201911183006.6
申请日:2019-11-27
Applicant: 珠海格力电器股份有限公司 , 珠海联云科技有限公司
IPC: G06F16/33 , G06F40/30 , G06F40/211 , G06F40/247
Abstract: 本申请公开一种语义分析样本集的优化方法、存储介质和计算设备,该方法包括:S200:获取样本集;S400:利用语义相似度分析模型获取每个样本中两个语句的测试相似度;S600:比较参考相似度与测试相似度,判断语义分析是否错误,确定所属的错误类型以及相应的错误率;S800:判断每个错误类型的错误率是否均低于或等于预设阈值:若至少一个错误类型的错误率高于预设阈值,执行S1000;若每个错误类型的错误率均低于或等于预设阈值,执行S1200;S1000:错误率高于预设阈值的错误类型,基于其样本特征向样本集中添加具有相同特征的新的样本,以建立新的样本集,返回执行S400至S800;S1200:当前样本集即优化后的样本集。本实施例能够快速得到优化后的符合要求的样本集。
-
公开(公告)号:CN110941701A
公开(公告)日:2020-03-31
申请号:CN201911183006.6
申请日:2019-11-27
Applicant: 珠海格力电器股份有限公司 , 珠海联云科技有限公司
IPC: G06F16/33 , G06F40/30 , G06F40/211 , G06F40/247
Abstract: 本申请公开一种语义分析样本集的优化方法、存储介质和计算设备,该方法包括:S200:获取样本集;S400:利用语义相似度分析模型获取每个样本中两个语句的测试相似度;S600:比较参考相似度与测试相似度,判断语义分析是否错误,确定所属的错误类型以及相应的错误率;S800:判断每个错误类型的错误率是否均低于或等于预设阈值:若至少一个错误类型的错误率高于预设阈值,执行S1000;若每个错误类型的错误率均低于或等于预设阈值,执行S1200;S1000:错误率高于预设阈值的错误类型,基于其样本特征向样本集中添加具有相同特征的新的样本,以建立新的样本集,返回执行S400至S800;S1200:当前样本集即优化后的样本集。本实施例能够快速得到优化后的符合要求的样本集。
-