基于特征编码器的训练方法及装置、分类方法及装置

    公开(公告)号:CN112115268A

    公开(公告)日:2020-12-22

    申请号:CN202011039098.3

    申请日:2020-09-28

    Inventor: 陈晓军 崔恒斌

    Abstract: 本说明书实施例提供了一种基于特征编码器的训练方法及装置、分类方法及装置。在该方法中,获取当前训练样本,将当前训练样本以及用于分类的多个文本类别分别输入特征编码器,输出各个当前训练样本对应的样本特征向量以及多个文本类别对应的分类矩阵;基于输出的样本特征向量以及分类矩阵得到当前训练样本针对各个文本类别的预测值;以及在不满足循环结束条件时,根据所得到的预测值和当前训练样本的真实分类类别对特征编码器的编码器参数进行调整,调整后的特征编码器作为下一次循环的特征编码器。

    一种问题生成方法及装置
    82.
    发明授权

    公开(公告)号:CN111737439B

    公开(公告)日:2020-12-11

    申请号:CN202010757542.9

    申请日:2020-07-31

    Inventor: 彭爽 崔恒斌

    Abstract: 一种问题生成方法及装置,该方法包括:将原始问题样本和目标问题样本作为训练样本,对由机器阅读模型和评分函数构成的判别器进行逆强化学习训练;其中,所述目标问题样本,为将所述原始问题样本输入问题生成模型生成的语义相似的问题;将所述评分函数输出的重合度评分作为回报,将所述原始问题样本作为训练样本,对由所述问题生成模型构成的生成器进行强化学习训练,以进一步形成所述生成器和所述判别器之间的,以所述目标问题样本作为与所述原始问题样本对应的对抗样本的对抗训练;对抗训练完成的问题生成模型即可用于语义相似的目标问题的生成。

    一种问题生成方法及装置
    84.
    发明公开

    公开(公告)号:CN111737440A

    公开(公告)日:2020-10-02

    申请号:CN202010759189.8

    申请日:2020-07-31

    Inventor: 彭爽 崔恒斌

    Abstract: 一种问题生成方法及装置,所述方法包括:基于预设的原始问题库与参考问题库中的问题样本,对问题生成模型进行模仿学习训练;其中,所述问题生成模型用于根据输入的原始问题,生成语义相似的目标问题;所述参考问题库用于在所述模仿学习训练过程中,提供与原始问题语义相似的问题样本作为模仿对象;获取原始问题;将所述原始问题输入模仿学习训练完成的所述问题生成模型,生成与所述原始问题语义相似的目标问题。

    一种模拟用户发言的方法和系统

    公开(公告)号:CN111651582A

    公开(公告)日:2020-09-11

    申请号:CN202010587169.7

    申请日:2020-06-24

    Abstract: 本说明书的实施例公开了一种模拟用户发言的方法和系统,该方法包括:获取待模拟对话,基于所述待模拟对话确定待模拟客服对话策略。基于所述待模拟客服对话策略从对话字典中确定至少一条目标用户发言;所述对话字典基于历史对话中任意轮对话生成,所述对话字典包括历史客服对话策略和历史用户发言之间的映射关系;在所述对话字典中所述目标用户发言对应的历史客服对话策略与所述待模拟客服对话策略匹配。将所述至少一条目标用户发言作为所述待模拟对话的用户发言的模拟结果。

    针对用户问题提供客服答案的方法及装置

    公开(公告)号:CN111339283B

    公开(公告)日:2020-08-21

    申请号:CN202010410440.X

    申请日:2020-05-15

    Inventor: 彭爽 崔恒斌

    Abstract: 本说明书实施例提供一种针对用户问题提供客服答案的方法,根据一个实施方式,在获取用户的当前问题后,可以基于当前问题,从知识库中获取多个历史对话记录中的第一对话记录,然后利用预先训练的预测模型,处理当前问题和第一对话记录的拼接文本,得到第一处理结果,接着根据第一处理结果,确定当前问题对应于第一对话记录的第一候选答案,并基于第一候选答案,针对当前问题提供客服答案。其中,用于机器阅读的预测模型,在机器阅读任务中,充分考虑客服场景下对话记录的文本具有交互性的特点,融入轮次特征和/或角色特征,提升机器阅读的性能。

    语义补全方法、装置和电子设备

    公开(公告)号:CN111475635A

    公开(公告)日:2020-07-31

    申请号:CN202010420180.4

    申请日:2020-05-18

    Abstract: 本说明书提出了一种语义补全方法、装置和电子设备,其中,上述方法包括:获取待语义补全的第一语句,对所述第一语句进行向量转换,得到第一语句向量;获取第一文本,对所述第一文本进行向量转换,得到第一文本向量;将所述第一语句向量和所述第一文本向量输入预置注意力模型进行注意力计算,得到所述第一语句向量的注意力分布,根据所述注意力分布计算获得第一语句隐向量;根据所述第一语句隐向量进行归一化计算,得到语义补全后的第二语句;通过上述方法可以对语句进行语义补全,由此可以提高语句的清晰度,进而提高文本的可读性。

    一种模型训练的方法和系统

    公开(公告)号:CN111461353A

    公开(公告)日:2020-07-28

    申请号:CN202010302619.3

    申请日:2020-04-17

    Abstract: 本说明书实施例公开了一种模型训练的方法和系统。模型训练方法包括,获取训练数据,所述训练数据包括多个样本对,每个样本对包括特征数据和标签数据,所述特征数据包括图像数据、文本数据或音频数据;基于每个样本对的特征数据,利用集成模型确定所述特征数据对应的综合输出结果;以及以所述多个样本对的特征数据作为输入,利用对应的综合输出结果和标签数据联合作为监督对初始模型进行训练,以获得最终模型。

    知识库管理方法、装置及处理设备

    公开(公告)号:CN111459917A

    公开(公告)日:2020-07-28

    申请号:CN202010302438.0

    申请日:2020-04-17

    Abstract: 本说明书提供一种知识库管理方法、装置及处理设备,可以针对群聊服务场景,对于群聊用户多,角色不清晰的聊天内容进行对话响应关系的确定,再基于对话响应关系进行问答信息的挖掘,确定出候选问答信息。利用人工客服对候选问答信息的点击采纳实现对候选问答信息进行反馈验证,将采纳率大于预设阈值的候选问答信息添加知识库中,可以不需要运营人员参与,实现了知识库的自动更新以及零运营管理。

    智能对话方法、装置和电子设备

    公开(公告)号:CN111444329A

    公开(公告)日:2020-07-24

    申请号:CN202010533383.4

    申请日:2020-06-12

    Abstract: 本说明书提出了一种智能对话方法、装置和电子设备,其中,上述方法包括:获取当前用户的提问语句,将所述提问语句输入至多个预置问答模型,得到对应的多条回答语句,其中,所述预置问答模型用于根据所述提问语句生成对应的回答语句;分别将每条所述回答语句和与所述当前用户对应的历史对话语句进行组合,得到对应的多个对话语句序列;将所述对话语句序列输入至预置输出模型进行计算,得到每个所述对话语句序列对应的置信度,根据所述置信度获得最终的回答语句。通过上述方法可以实现智能的对话,由此可以减少对人工标注数据的依赖,提高对话的效率,提升用户体验。

Patent Agency Ranking