一种从对话语料中抽取对话策略结构的方法及系统

    公开(公告)号:CN112115248B

    公开(公告)日:2023-11-14

    申请号:CN202011034369.6

    申请日:2020-09-27

    Abstract: 本说明书一个或多个实施例涉及一种从对话语料中抽取对话策略结构的方法及系统,所述方法包括:获取所述对话语料的多个客服语料;其中,所述客服语料中包括多个按序排列的问题信息;基于特征提取算法对所述客服语料中的问题信息进行特征化处理,得到问题信息对应的特征向量;基于聚类算法将所述问题信息对应的特征向量聚类为多个问题聚类簇;基于所述多个按序排列的问题信息获取各问题聚类簇在所述多个客服语料中的顺序标识;基于关联规则算法对各问题聚类簇及其顺序标识进行处理,获取目标问题序列;基于所述目标问题序列确定所述对话策略结构。

    一种机器阅读标注数据的生成方法和装置

    公开(公告)号:CN111488448B

    公开(公告)日:2023-06-20

    申请号:CN202010459357.1

    申请日:2020-05-27

    Inventor: 彭爽 崔恒斌

    Abstract: 本发明实施例提供了一种机器阅读标注数据的生成方法,该方法包括:获取第一人工对话日志,其中包含多轮问答对话语句;根据预先统计得到的高频答案语句集合,从多轮问答对话语句中确定出第一高频答案语句;对于多轮问答对话语句中位于第一高频答案语句之前的若干问题语句中的任意问题语句,根据第一高频答案语句与该任意问题语句之间的语义相似度,以及根据该两者之间的文本间隔距离,确定对应的总相关度;从若干问题语句中提取与第一高频答案的总相关度最高的问题语句,作为第一问题语句;根据第一人工对话日志、第一高频答案语句和第一问题语句,生成带有标注的机器阅读数据。

    用于文本处理的方法和装置

    公开(公告)号:CN111309889B

    公开(公告)日:2023-04-14

    申请号:CN202010123765.X

    申请日:2020-02-27

    Inventor: 彭爽 崔恒斌

    Abstract: 本说明书的实施例提供了用于文本处理的方法、装置、计算设备和机器可读存储介质。该方法包括:从目标机器对话日志中获取目标问题文本,目标问题文本用于表示机器人客服未能回答的用户问题;基于目标问题文本,获取目标人工对话日志,目标人工对话日志是基于目标问题文本而产生的;利用机器阅读模型对目标问题文本和目标人工对话日志进行处理,其中机器阅读模型是通过基于训练语料对预训练语言模型进行训练而得到的,训练语料是基于历史问题文本和历史人工对话日志得到的;基于机器阅读模型的处理结果,从目标人工对话日志中获取针对目标问题文本的答案文本,其中,目标问题文本和答案文本以问答对的形式被存储到知识库中。

    用于自动回复医疗咨询的方法、系统、装置和介质

    公开(公告)号:CN114999676A

    公开(公告)日:2022-09-02

    申请号:CN202210747520.3

    申请日:2022-06-29

    Abstract: 提供了一种由计算机实现的自动回复医疗咨询的方法,包括:获取医疗对话前文,该医疗对话前文包括医疗咨询;基于该医疗对话前文,利用检索模型在医疗问答知识库中检索对该医疗咨询的一个或多个第一候选回复;基于该医疗对话前文,利用对话生成模型自动生成对该医疗咨询的一个或多个第二候选回复,该一个或多个第一候选回复和该一个或多个第二候选回复构成候选回复集;利用打分模型对该候选回复集中的候选回复打分;以及基于对该候选回复集中的候选回复的打分结果从该候选回复集中选择对该医疗咨询的回复。本申请还涉及相关联的系统、装置和介质。本申请的方案能够更灵活可靠地自动回复医疗咨询。

    多任务模型的训练方法及装置

    公开(公告)号:CN111310848B

    公开(公告)日:2022-06-28

    申请号:CN202010131419.6

    申请日:2020-02-28

    Abstract: 本说明书实施例提供一种多任务模型的训练方法及装置,在训练方法中,获取训练样本集,该训练样本集中的每个样本包括由一个问题和多个历史会话对组成的输入文本、第一标签和第二标签。对于任意的第一训练样本,将其中的输入文本输入文本编码层,得到输入文本的文本向量。从文本向量中确定出多个答案中各答案的语义向量。将各答案的语义向量输入问答相关性分类层,通过输出得到第一预测结果。基于第一预测结果和第一标签,确定第一预测损失。将文本向量输入答案选择层,通过输出得到第二预测结果。基于第二预测结果和第二标签,确定第二预测损失。基于训练样本集中各样本的第一预测损失与第二预测损失的融合结果,调整多任务模型的参数。

    一种文本分类的方法和系统

    公开(公告)号:CN112948580A

    公开(公告)日:2021-06-11

    申请号:CN202110154293.9

    申请日:2021-02-04

    Inventor: 彭爽 杨明晖

    Abstract: 本说明书实施例提供了一种文本分类的方法和系统。所述方法包括:获取待分类文本;确定所述待分类文本中的至少一个关键词;通过文本分类模型处理所述至少一个关键词及所述待分类文本,确定所述待分类文本的类别。可以通过文本分类模型,基于待分类文本及待分类文本对应的至少一个关键词的特征信息确定待分类文本的类别,可以实现在待分类文本中融合上关键词嵌入信息,从而更准确地完成文本分类。

    一种对话辅助方法、系统及装置

    公开(公告)号:CN112084318A

    公开(公告)日:2020-12-15

    申请号:CN202011024999.5

    申请日:2020-09-25

    Abstract: 本申请实施例公开了一种对话辅助方法、系统和装置,其中,所述方法包括:显示对话界面;获取所述对话的当前话语信息,以及所述对话中当前话语的上文信息;基于所述当前话语信息,确定一个或多个适配的预设话术推荐算法;利用所述预设话术推荐算法处理所述当前话语对应的文本数据以及所述上文信息,确定至少一个推荐话术;所述预设话术推荐算法至少包括基于机器学习的推荐算法,或基于规则的推荐算法;在对话界面显示至少一个推荐话术。由此,可以向进行对话的人员提供话术推荐,提高对话的效率。

    一种问题生成方法及装置
    30.
    发明授权

    公开(公告)号:CN111737439B

    公开(公告)日:2020-12-11

    申请号:CN202010757542.9

    申请日:2020-07-31

    Inventor: 彭爽 崔恒斌

    Abstract: 一种问题生成方法及装置,该方法包括:将原始问题样本和目标问题样本作为训练样本,对由机器阅读模型和评分函数构成的判别器进行逆强化学习训练;其中,所述目标问题样本,为将所述原始问题样本输入问题生成模型生成的语义相似的问题;将所述评分函数输出的重合度评分作为回报,将所述原始问题样本作为训练样本,对由所述问题生成模型构成的生成器进行强化学习训练,以进一步形成所述生成器和所述判别器之间的,以所述目标问题样本作为与所述原始问题样本对应的对抗样本的对抗训练;对抗训练完成的问题生成模型即可用于语义相似的目标问题的生成。

Patent Agency Ranking