-
公开(公告)号:CN117441165A
公开(公告)日:2024-01-23
申请号:CN202280040623.4
申请日:2022-05-10
Applicant: 微软技术许可有限责任公司
IPC: G06F16/34
Abstract: 本文的公开描述了减少由生成语言模型生成的输出中的训练偏差。与通信相关联的通信段由生成语言模型的至少一个处理器获得。与通信段相关联的输出值由生成语言模型生成。输出值被映射到与生成语言模型相关联的训练偏差值集合,并且基于输出值到该训练偏差值集合中的训练偏差值的映射,备选输出值被生成。备选输出值被使用在用于通信段的生成的段输出中。通过减少或消除生成语言模型的训练偏差,由生成语言模型生成的段输出的准确性被提高。
-
公开(公告)号:CN117413262A
公开(公告)日:2024-01-16
申请号:CN202280039393.X
申请日:2022-05-06
Applicant: 微软技术许可有限责任公司
IPC: G06F16/35
Abstract: 本文的公开描述了使用经训练的摘要模型来确定通信转录的主题。与第一通信相关联的第一通信转录被获取,并被划分为第一通信分段集合。基于第一通信分段集合,通过用生成式语言模型分析第一通信分段集合中的每个通信分段,第一主题描述集合被生成。使用第一通信分段集合和相关联的第一主题描述集合作为训练数据,来训练摘要模型。经训练的摘要模型然后被应用于第二通信转录,以及基于将经训练的摘要模型应用于第二通信转录,第二通信转录的第二主题描述集合被生成。通过基于生成式语言模型的输出来训练摘要模型,使得能够高效、准确地从通信转录中生成主题描述。
-