-
公开(公告)号:CN110738059A
公开(公告)日:2020-01-31
申请号:CN201911000110.7
申请日:2019-10-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/30
Abstract: 本说明书实施例公开了一种文本相似度计算的方法及系统。所述方法包括:获取第一文本,并提取与所述第一文本相对应的至少一个第一特征;根据所述第一文本得到与所述第一文本相关的多个第二文本;其中,与所述多个第二文本中的至少一个第二文本对应的至少一个第二特征已经存储在特征数据库中;将所述第一特征以及所述特征数据库中存储的第二特征输入交互模型,使用所述交互模型计算所述第一文本与所述第二本文本的相似度。
-
公开(公告)号:CN110727767A
公开(公告)日:2020-01-24
申请号:CN201911000025.0
申请日:2019-10-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33
Abstract: 本说明书实施例公开了一种扩展文本样本的方法及系统。所述方法包括:将第一文本在文本库中检索,获取与所述第一文本的相似度在设定区间的多个第二文本;基于所述第一文本和所述多个第二文本中的每一个在知识库中检索,确定所述第一文本的第一检索结果和所述第二文本的第二检索结果;所述知识库至少包含与所述第一文本关联的多个文本;判断所述第一检索结果和所述第二检索结果之间的关系是否满足预设条件;将满足所述预设条件的所述第二文本确定为所述第一文本的扩展文本。
-
公开(公告)号:CN113221555B
公开(公告)日:2023-11-14
申请号:CN202110493880.0
申请日:2021-05-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例公开了一种基于多任务模型的关键词识别方法、装置以及设备。方案包括:获取训练文本,为训练文本中的各字符分别标注第一标签,以表示对应的字符是否位于其所在词的起始位置或者终止位置;为训练文本中的各字符分别标注第二标签,以表示对应的字符所在词是否为关键词;根据第一标签确定第一训练任务,以及根据第二标签确定第二训练任务;将第一训练任务和第二训练任务进行联合训练,得到关键词识别模型;利用关键词识别模型,识别输入文本中的关键词。
-
公开(公告)号:CN111475652B
公开(公告)日:2023-09-22
申请号:CN202010441154.X
申请日:2020-05-22
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F16/332
Abstract: 本说明书提供的数据挖掘的方法和系统,通过聚类算法对海量的样本数据进行聚类,生成多个样本簇,每个样本簇中的多个样本数据对应相似的话题;从所述样本簇中选取样本数据数量最多的至少一个样本簇作为热门话题;并通过意图识别模型对热门话题中的样本数据进行分类,从中识别出有价值的样本数据。所述方法和系统可以对海量数据进行聚类,从而挖掘出共性的问题,以进行批量解决,大大提高了工作效率;同时,所述方法和系统可以从海量数据中挖掘出对产品经理有价值的信息,以帮助产品经理从用户的角度解决用户的诉求,大大提升了产品的体验感,提高用户满意度。
-
公开(公告)号:CN111400413B
公开(公告)日:2023-06-30
申请号:CN202010162561.7
申请日:2020-03-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/28 , G06F18/2415 , G06F18/214 , G06Q30/01
Abstract: 本说明书实施例公开了确定知识库中知识点类目的方法及系统,所述方法包括:获取至少一个待预测知识点,并确定与至少一个待预测知识点分别对应的知识库;判断对应的知识库的类目确定方式;其中,类目确定方式包括分类模型确定、距离匹配确定以及规则匹配确定方式中的至少两个;当类目确定方式为分类模型确定时,将待预测知识点输入基于对应的知识库训练的分类模型,确定待预测知识点的类目;当类目确定方式为距离匹配确定时,基于待预测知识点与对应的知识库中每个类目的知识点之间的距离关系,确定待预测知识点的类目;当类目确定方式为规则匹配确定时,基于预设规则确定待预测知识点的类目。
-
公开(公告)号:CN111401076B
公开(公告)日:2023-04-25
申请号:CN202010272706.9
申请日:2020-04-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/30 , G06F40/289 , G06N3/044
Abstract: 本说明书一个或多个实施例提供一种文本的相似度确定方法、装置和电子设备;所述方法包括:获取第一文本和第二文本;根据所述第一文本和第二文本,得到对应于所述第一文本和所述第二文本的文本表示向量;根据所述第一文本和第二文本,确定共有单字表示向量和差异单字表示向量;其中,所述共有单字表示向量对应于在所述第一文本和所述第二文本中均存在的单字,所述差异单字表示向量对应于仅在所述第一文本和所述第二文本之一中存在的单字;根据所述文本表示向量、所述共有单字表示向量和所述差异单字表示向量,得到对应于所述第一文本和所述第二文本的文本特征向量;根据所述文本特征向量,确定所述第一文本和所述第二文本的相似度。
-
公开(公告)号:CN111475635B
公开(公告)日:2023-04-18
申请号:CN202010420180.4
申请日:2020-05-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F40/30 , G06N3/0442
Abstract: 本说明书提出了一种语义补全方法、装置和电子设备,其中,上述方法包括:获取待语义补全的第一语句,对所述第一语句进行向量转换,得到第一语句向量;获取第一文本,对所述第一文本进行向量转换,得到第一文本向量;将所述第一语句向量和所述第一文本向量输入预置注意力模型进行注意力计算,得到所述第一语句向量的注意力分布,根据所述注意力分布计算获得第一语句隐向量;根据所述第一语句隐向量进行归一化计算,得到语义补全后的第二语句;通过上述方法可以对语句进行语义补全,由此可以提高语句的清晰度,进而提高文本的可读性。
-
公开(公告)号:CN111353028B
公开(公告)日:2023-04-18
申请号:CN202010103625.6
申请日:2020-02-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06Q30/01
Abstract: 本说明书的实施例提供了一种用于确定客服话术簇的方法及装置。在该方法中,从人工客服数据集中来确定候选客服话术集,使用业务话术筛选模型来从候选客服话术集中筛选分别针对不同业务类型的多个业务话术集,进而通过语义模型来从业务话术集中确定至少一个客服话术簇,可以为客服进行业务服务过程中遇到的相同或相似的用户问题提供参考。
-
公开(公告)号:CN111259130B
公开(公告)日:2023-04-07
申请号:CN202010092082.2
申请日:2020-02-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F40/211 , G06F40/289 , G06N20/00
Abstract: 本公开提供了用于在对话中提供答复语句的方法及装置,在该方法中,获取包括用户的当前对话语句和上下文对话语句的查询语句,以及从对话日志中搜索出的回答语料,并对查询语句和回答语料分别进行向量化处理以得到查询语句向量矩阵和回答语料向量矩阵,将查询语句向量和回答语料向量提供给机器阅读理解模型,以从回答语料中确定当前对话语句的答复语句的起始词语位置和结束词语位置,基于所确定的起始词语位置和结束词语位置,从回答语料中获取答复语句。
-
公开(公告)号:CN111339278B
公开(公告)日:2023-03-31
申请号:CN202010130638.2
申请日:2020-02-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/126 , G06F40/30
Abstract: 本说明书实施例提供一种训练话术生成模型、生成应答话术的方法和装置。训练话术生成模型的方法包括:针对用户与人工客服的第一历史对话,得到第一意图关键词对应的第一应答话术;将第一意图关键词以字为单位按照各字的位置关系输入待训练的话术生成模型,话术生成模型包括编码器和解码器,编码器根据位置关系以及第一意图关键词中的各字对第一意图关键词进行编码,得到第一意图关键词对应的第一语义向量,并将第一语义向量输入到解码器进行多次迭代解码,得到话术预测结果;根据第一应答话术和话术预测结果,对话术生成模型进行训练。能够在给定用户意图下生成应答话术,极大减轻了运营人员的工作量,提升运营效率。
-
-
-
-
-
-
-
-
-