用于自动问答的方法、系统、装置和介质

    公开(公告)号:CN114996429A

    公开(公告)日:2022-09-02

    申请号:CN202210750003.1

    申请日:2022-06-29

    Abstract: 公开了一种由计算机实现的自动问答方法,包括:获取对话前文,所述对话前文包括要回复的询问;基于所述对话前文,利用检索模型在问答知识库中检索对所述询问的一个或多个第一候选回复;基于所述对话前文,利用对话生成模型自动生成对所述询问的一个或多个第二候选回复,所述一个或多个第一候选回复和所述一个或多个第二候选回复构成候选回复集;利用回复打分模型对所述候选回复集中的候选回复打分;以及基于对所述候选回复集中的候选回复的打分结果从所述候选回复集中选择对所述询问的回复。本申请还涉及相关联的自动问答系统、装置和介质。本申请的方案能够更灵活、更高质量地生成对对话前文中的询问的回复。

    答案文本的处理方法和装置、关键文本的确定方法

    公开(公告)号:CN111737443A

    公开(公告)日:2020-10-02

    申请号:CN202010818292.5

    申请日:2020-08-14

    Abstract: 本说明书提供了答案文本的处理方法和装置、关键文本的确定方法。在一个实施例中,基于上述答案文本的数据处理方法,通过先从预设的知识库中确定出与目标问题匹配的答案文本作为目标答案文本;再通过从目标答案文本中识别确定出与目标问题关联性较强且用户关注度较高的关键文本,并在目标答案文本中标注出上述关键文本;进而可以在向用户所展示的目标答案文本中标识出上述关键文本,使得用户可以方便、高效地读取到目标答案文本中用户所需要的、价值较高的关键信息。

    一种问题生成方法及装置
    13.
    发明公开

    公开(公告)号:CN111737439A

    公开(公告)日:2020-10-02

    申请号:CN202010757542.9

    申请日:2020-07-31

    Inventor: 彭爽 崔恒斌

    Abstract: 一种问题生成方法及装置,该方法包括:将原始问题样本和目标问题样本作为训练样本,对由机器阅读模型和评分函数构成的判别器进行逆强化学习训练;其中,所述目标问题样本,为将所述原始问题样本输入问题生成模型生成的语义相似的问题;将所述评分函数输出的重合度评分作为回报,将所述原始问题样本作为训练样本,对由所述问题生成模型构成的生成器进行强化学习训练,以进一步形成所述生成器和所述判别器之间的,以所述目标问题样本作为与所述原始问题样本对应的对抗样本的对抗训练;对抗训练完成的问题生成模型即可用于语义相似的目标问题的生成。

    一种问题生成方法及装置
    14.
    发明授权

    公开(公告)号:CN111737440B

    公开(公告)日:2021-03-05

    申请号:CN202010759189.8

    申请日:2020-07-31

    Inventor: 彭爽 崔恒斌

    Abstract: 一种问题生成方法及装置,所述方法包括:基于预设的原始问题库与参考问题库中的问题样本,对问题生成模型进行模仿学习训练;其中,所述问题生成模型用于根据输入的原始问题,生成语义相似的目标问题;所述参考问题库用于在所述模仿学习训练过程中,提供与原始问题语义相似的问题样本作为模仿对象;获取原始问题;将所述原始问题输入模仿学习训练完成的所述问题生成模型,生成与所述原始问题语义相似的目标问题。

    答案文本的处理方法和装置、关键文本的确定方法

    公开(公告)号:CN111737443B

    公开(公告)日:2020-11-20

    申请号:CN202010818292.5

    申请日:2020-08-14

    Abstract: 本说明书提供了答案文本的处理方法和装置、关键文本的确定方法。在一个实施例中,基于上述答案文本的数据处理方法,通过先从预设的知识库中确定出与目标问题匹配的答案文本作为目标答案文本;再通过从目标答案文本中识别确定出与目标问题关联性较强且用户关注度较高的关键文本,并在目标答案文本中标注出上述关键文本;进而可以在向用户所展示的目标答案文本中标识出上述关键文本,使得用户可以方便、高效地读取到目标答案文本中用户所需要的、价值较高的关键信息。

    一种机器阅读标注数据的生成方法和装置

    公开(公告)号:CN111488448A

    公开(公告)日:2020-08-04

    申请号:CN202010459357.1

    申请日:2020-05-27

    Inventor: 彭爽 崔恒斌

    Abstract: 本发明实施例提供了一种机器阅读标注数据的生成方法,该方法包括:获取第一人工对话日志,其中包含多轮问答对话语句;根据预先统计得到的高频答案语句集合,从多轮问答对话语句中确定出第一高频答案语句;对于多轮问答对话语句中位于第一高频答案语句之前的若干问题语句中的任意问题语句,根据第一高频答案语句与该任意问题语句之间的语义相似度,以及根据该两者之间的文本间隔距离,确定对应的总相关度;从若干问题语句中提取与第一高频答案的总相关度最高的问题语句,作为第一问题语句;根据第一人工对话日志、第一高频答案语句和第一问题语句,生成带有标注的机器阅读数据。

    一种训练文本关键内容提取模型的方法和系统

    公开(公告)号:CN111401042A

    公开(公告)日:2020-07-10

    申请号:CN202010223432.4

    申请日:2020-03-26

    Abstract: 本说明书实施例公开了一种训练文本关键内容提取模型的方法和系统。所述方法包括:获取若干个训练样本,所述训练样本包括问题和拼接文档,所述拼接文档包括对应于所述问题的关键内容、干扰内容以及与所述关键内容和干扰内容对应的分隔符;基于所述问题和所述拼接文档,利用机器阅读模型处理得到对应的表示向量;利用所述表示向量训练初始模型得到文本关键内容提取模型,其中,所述文本关键内容提取模型的输出为所述拼接文档中与每一内容对应的分隔符的预测值;基于所述预测值,构建损失函数,迭代优化所述文本关键内容提取模型。本说明书采用用户的反馈数据构造训练样本,可以有效提升机器阅读模型的质量和难度。

    用于文本分类的神经网络系统的训练方法及装置

    公开(公告)号:CN112100387A

    公开(公告)日:2020-12-18

    申请号:CN202011269071.3

    申请日:2020-11-13

    Abstract: 本说明书实施例提供一种用于文本分类的神经网络系统的训练方法,该神经网络系统包括文本表征网络、特征提取层和分类网络。该训练方法包括:首先,获取训练文本集,该训练文本集对应K个类别;接着,针对该训练文本集中任一的第一训练文本,利用上述文本表征网络对其进行处理,得到第一文本向量;然后,利用上述特征提取层,将该第一文本向量分别与对应所述K个类别的K个类别特征向量进行组合操作,得到K个特征提取向量;再接着,基于该K个特征提取向量和上述分类网络,确定分类预测结果;再然后,基于该分类预测结果和上述第一训练文本的类别标签,训练上述神经网络系统。

Patent Agency Ranking