训练话术生成模型、生成应答话术的方法和装置

    公开(公告)号:CN111339278A

    公开(公告)日:2020-06-26

    申请号:CN202010130638.2

    申请日:2020-02-28

    Abstract: 本说明书实施例提供一种训练话术生成模型、生成应答话术的方法和装置。训练话术生成模型的方法包括:针对用户与人工客服的第一历史对话,得到第一意图关键词对应的第一应答话术;将第一意图关键词以字为单位按照各字的位置关系输入待训练的话术生成模型,话术生成模型包括编码器和解码器,编码器根据位置关系以及第一意图关键词中的各字对第一意图关键词进行编码,得到第一意图关键词对应的第一语义向量,并将第一语义向量输入到解码器进行多次迭代解码,得到话术预测结果;根据第一应答话术和话术预测结果,对话术生成模型进行训练。能够在给定用户意图下生成应答话术,极大减轻了运营人员的工作量,提升运营效率。

    文本检索方法、模型训练方法、文本检索装置及存储介质

    公开(公告)号:CN111274808A

    公开(公告)日:2020-06-12

    申请号:CN202010086368.X

    申请日:2020-02-11

    Inventor: 陈晓军 崔恒斌

    Abstract: 本说明书涉及一种文本检索方法包括:对接收的第一文本进行分词,得到至少一个词语;根据所述至少一个词语从知识库中召回至少一个第二文本;将所述至少一个词语输入经过训练的文本向量模型,得到所述第一文本的文本向量;根据所述第一文本的向量从所述知识库中召回至少一个第三文本;以及将所述至少一个第二文本和所述至少一个第三文本进行融合,得到文本检索结果。本说明书还提供了词权重模型和文本向量模型的训练方法、文本检索装置、电子设备以及计算机可读存储介质。

    文本生成方法、装置和电子设备

    公开(公告)号:CN111241263A

    公开(公告)日:2020-06-05

    申请号:CN202010334292.8

    申请日:2020-04-24

    Abstract: 本说明书实施例提出了一种文本生成方法、装置和电子设备,其中,上述文本生成方法中,获取当前对话中的对话上文和预先设定的用户意图,以及获取已生成的输出文本之后,将对话上文、用户意图和输出文本进行拼接,获得输入文本;然后对输入文本进行编码获得输入向量,通过单向注意力模型对上述输入向量进行自注意力计算,获得上述输入向量对应的上下文向量,根据上述上下文向量,获得输出文本候选集合中的每个输出文本作为下一个输出文本的概率,最后根据上述概率从上述输出文本候选集合中选择下一个输出文本,循环执行上述步骤,直至下一个输出文本为结束符,或者已生成的输出文本的长度达到预定的长度,这样最终获得的所有输出文本组成对话下文。

    一种剔除干扰问题对的方法及系统

    公开(公告)号:CN110717028A

    公开(公告)日:2020-01-21

    申请号:CN201910995960.9

    申请日:2019-10-18

    Inventor: 陈晓军 崔恒斌

    Abstract: 本说明书实施例公开了一种剔除干扰问题对的方法及系统。所述方法包括:获取至少一个问题对,将所述至少一个问题对输入初始剔除模型,剔除所述至少一个问题对中的干扰问题对;所述干扰问题对是指与目标主题不相关的问题对;将所述至少一个问题对中未剔除的第一问题对输入匹配模型,确定所述第一问题对的第一匹配结果;基于所述第一匹配结果以及所述第一问题对标定的第二匹配结果,得到反馈值;根据所述反馈值调整所述初始剔除模型,得到目标剔除模型,采用所述目标剔除模型剔除目标问题对中的干扰问题对。

    一种训练分类模型的方法及系统

    公开(公告)号:CN110704627A

    公开(公告)日:2020-01-17

    申请号:CN201910978508.1

    申请日:2019-10-15

    Inventor: 陈晓军 崔恒斌

    Abstract: 本说明书实施例公开了一种训练分类模型的方法及系统。所述方法包括:获取至少一个问题对,将所述至少一个问题对输入初始分类模型,确定所述至少一个问题对中每一个的初始分类结果;基于所述初始分类结果,确定所述至少一个问题对中每一个的匹配模型,将所述至少一个问题对输入对应的所述匹配模型,确定所述至少一个问题对的第一匹配结果;基于所述第一匹配结果以及所述至少一个问题对标定的第二匹配结果,得到反馈值;根据所述反馈值调整所述初始分类模型,得到目标分类模型。

    一种从对话语料中抽取对话策略结构的方法及系统

    公开(公告)号:CN112115248B

    公开(公告)日:2023-11-14

    申请号:CN202011034369.6

    申请日:2020-09-27

    Abstract: 本说明书一个或多个实施例涉及一种从对话语料中抽取对话策略结构的方法及系统,所述方法包括:获取所述对话语料的多个客服语料;其中,所述客服语料中包括多个按序排列的问题信息;基于特征提取算法对所述客服语料中的问题信息进行特征化处理,得到问题信息对应的特征向量;基于聚类算法将所述问题信息对应的特征向量聚类为多个问题聚类簇;基于所述多个按序排列的问题信息获取各问题聚类簇在所述多个客服语料中的顺序标识;基于关联规则算法对各问题聚类簇及其顺序标识进行处理,获取目标问题序列;基于所述目标问题序列确定所述对话策略结构。

    基于语音识别结果进行意图分类的方法和装置

    公开(公告)号:CN111177324B

    公开(公告)日:2023-08-11

    申请号:CN201911421937.5

    申请日:2019-12-31

    Abstract: 本说明书实施例提供一种基于语音识别结果进行意图分类的方法和装置,方法包括:获取针对目标语音进行自动语音识别后得到的目标文本;从预先建立的汉字到拼音的映射表中,查找所述目标文本包含的各汉字分别对应的拼音;基于所述各汉字分别对应的拼音,形成目标拼音序列;将所述目标文本和所述目标拼音序列作为目标文本语音对,将所述目标文本语音对输入预先训练的文本编码模型,通过所述文本编码模型输出所述目标文本语音对对应的目标编码向量;根据所述目标编码向量,对所述目标语音进行意图分类。能够降低意图分类的错误率。

    用于处理文本的方法和装置

    公开(公告)号:CN111291172B

    公开(公告)日:2023-08-04

    申请号:CN202010146072.2

    申请日:2020-03-05

    Inventor: 王子豪 崔恒斌

    Abstract: 本说明书的实施例提供了用于处理文本的方法、装置、计算设备和机器可读存储介质。该方法包括:从用户与客服的当前对话数据中获取当前用户问句文本的上文信息;基于当前用户问句文本和上文信息,获取预先确定的至少一个候选回复文本;利用候选回复文本评分模型对当前用户问句文本、上文信息和至少一个候选回复文本进行处理,得到至少一个候选回复文本的评分结果,每个候选回复文本的评分结果表示该候选回复文本与当前用户问句文本的匹配程度;基于至少一个候选回复文本的评分结果,从至少一个候选回复文本中选择m个候选回复文本,作为要向客服呈现的目标回复文本,m为正整数。

Patent Agency Ranking