-
公开(公告)号:CN117668150A
公开(公告)日:2024-03-08
申请号:CN202211025484.6
申请日:2022-08-25
Applicant: 上海上湖信息技术有限公司
IPC: G06F16/33 , G06F16/35 , G06Q10/063 , G06Q30/015
Abstract: 本申请涉及数据处理技术领域,尤其涉及一种对话质检方法、介质和设备。其中方法包括:获取对话文本;对对话文本中的各文字进行向量化处理,得到各文字对应的各文字向量;针对任意一个文字向量,根据文字向量与其他各文字向量的第一相关性获取文字向量对应的特征向量;对各文字向量对应的特征向量进行合并处理,得到与对话文本对应的特征向量矩阵;基于特征向量矩阵确定对话文本是否违规。通过上述方法在对各个文字向量合并处理后,通过与对话文本对应的特征向量矩阵判断对话文本是否违规,把整个对话看做一个整体,通过特征向量对对话文本中的违规信息进行放大,而不是只着眼于对话中多个孤立的词信息,提高了对话质检的效率。
-
公开(公告)号:CN115525746A
公开(公告)日:2022-12-27
申请号:CN202211163403.9
申请日:2022-09-23
Applicant: 上海上湖信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/289 , G06K9/62
Abstract: 一种生成摘要的方法及装置,用以准确精炼地提取对话摘要,该方法包括:抽取待处理对话中与待分析对象的语句相关的M个对话片段;所述M为正整数;将所述M个对话片段的分词编码分别输入抽取模型,确定所述M个对话片段中的N个保留对话片段;将所述N个保留对话片段的分词编码输入生成模型,得到所述N个保留对话片段中每个保留对话片段对应的子摘要编码;所述N为正整数;将所述N个保留对话片段对应的N个子摘要编码进行解码,得到所述待处理对话的N个子摘要。
-
公开(公告)号:CN119293501A
公开(公告)日:2025-01-10
申请号:CN202411315755.0
申请日:2024-09-20
Applicant: 上海上湖信息技术有限公司 , 海南上湖信息技术有限公司 , 上海耳序信息技术有限公司
IPC: G06F18/214 , G06F16/3329 , G06F16/35 , G06N3/045 , G06N3/092 , G06Q30/015
Abstract: 本发明实施例提供的一种基于多轮对话的偏好数据集构建方法及装置,包括:获取多条对话历史信息,其中任一条对话历史信息中包括至少一轮坐席与用户的对话信息;从所述多条对话历史信息中确定多个目标用户话术,所述目标用户话术所属的至少两条对话历史信息分别具有正反馈指标及负反馈指标;针对所述多个目标用户话术中至少一个目标用户话术,构建每个目标用户话术对应的偏好数据样本从而得到偏好数据集;任一偏好数据样本包括目标用户话术的前序对话轮、正反馈坐席话术和负反馈坐席话术,所述正反馈坐席话术和所述负反馈坐席话术均与所述目标用户话术属于同一轮对话信息。
-
-