-
公开(公告)号:CN111241412A
公开(公告)日:2020-06-05
申请号:CN202010329694.9
申请日:2020-04-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/36
Abstract: 本说明书实施例公开了一种确定用于信息推荐的图谱的方法、系统、及装置。所述方法包括:获取构建目标图谱的多个节点;所述节点至少包括词语节点,以及知识点节点;若所述节点为词语节点,将该节点对应的词语的向量表示作为该节点的向量表示;若所述节点为知识点节点,基于与所述知识点节点相关的词语的向量表示,确定对应于所述知识点节点的向量表示;对于任意两个节点:基于所述两个节点的类型,确定所述两个节点之间的边权,并将所述边权作为所述两个节点之间的关联关系;基于节点的向量表示,以及节点与节点之间的关联关系,进行至少一轮图聚合迭代,以更新所述图谱中节点的向量表示。
-
公开(公告)号:CN113221533B
公开(公告)日:2024-07-05
申请号:CN202110475145.7
申请日:2021-04-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F40/30 , G06F16/35 , G06N20/00 , G06F16/683
Abstract: 本说明书实施例公开了一种针对体验声音的标签提取方法、装置以及设备。方案包括:获取体验声音对应的待处理文本;获取根据训练语句及其重点内容标注训练过的识别模型,其中,识别模型包含用于将训练语句切分字符后并行输入的多个单字符输入节点,以及对应的多个输出节点,在训练的过程中,输入同一训练语句的多个单字符输入节点对应的一部分输出节点被屏蔽;将待处理文本切分字符并对应地输入识别模型,以识别得到待处理文本中的重点语句;根据重点语句,提取标签。
-
公开(公告)号:CN111274787B
公开(公告)日:2023-04-18
申请号:CN202010108943.1
申请日:2020-02-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F40/279
Abstract: 本说明书的实施例公开了一种用户意图预测方法和系统。该方法包括:获取与用户相关的一个或多个因子信息;所述因子信息至少反映用户在某服务平台内的操作行为;基于所述因子信息确定多个候选意图文本;基于语言模型处理所述多个候选意图文本以及所述因子信息,得到多个相关度;多个相关度分别反映所述多个候选意图文本与所述因子信息的相关性;以及,至少基于所述多个相关度从所述多个候选意图文本中确定目标意图文本。
-
公开(公告)号:CN111340218B
公开(公告)日:2022-04-15
申请号:CN202010113810.3
申请日:2020-02-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种训练问题识别模型的方法和系统,所述方法包括:获取多个第一文本和多个第二文本,所述第一文本和所述第二文本分别为问题类文本和非问题类文本;生成模型基于所述第一文本与所述第二文本之间的相似度,为所述第一文本选择满足第一预设条件的至少一个所述第二文本,生成至少一个文本对;将所述文本对输入初始问题识别模型进行训练,训练得到目标问题识别模型。
-
公开(公告)号:CN111475637B
公开(公告)日:2020-10-09
申请号:CN202010588724.8
申请日:2020-06-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06N5/02
Abstract: 本说明书实施例提供一种用于推送知识点的数据处理、训练方法及装置,基于异构图提取符合预设格式的多组元路径,获取异构图中各个节点的对应的第一特征,然后将多组元路径输入预先训练得到的图神经网络模型,通过图神经网络模型对元路径上节点的第一特征进行聚合,至少输出作为路径端点的用户节点和/或知识点节点对应的第二特征,第二特征用于对用户节点和知识点节点进行匹配,以向用户推送相应知识点。该方案能够更精确地匹配用户需求。
-
公开(公告)号:CN111552787A
公开(公告)日:2020-08-18
申请号:CN202010328553.5
申请日:2020-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/289 , G06F40/35 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例公开了一种问答处理方法、装置、设备及存储介质,获取用户问题匹配的候选对话记录集,针对候选对话记录集中每段对话记录,以用户问题替换对话记录的代表问题,得到待分类的文本对象,并通过文本分类模型对文本对象进行分类,得到表征用户问题与对话记录之间的匹配程度文本对象的文本分类结果,根据每个文本对象的文本分类结果,从候选对话记录集选出目标对话记录,并将目标对话记录提供给当前提问用户。
-
公开(公告)号:CN111324722B
公开(公告)日:2020-08-14
申请号:CN202010409812.7
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本说明书实施例提供一种训练词语权重模型的方法和系统。所述方法包括:获取多个文本对;判断所述文本对中两个文本之间是否匹配,得到匹配结果;基于所述匹配结果确定所述文本对中文本的词语的重要性标识,得到含有所述重要性标识的多个文本对;基于多个训练数据训练词语权重模型,所述训练数据来源于含有所述重要性标识的多个文本对中的文本。
-
公开(公告)号:CN111274787A
公开(公告)日:2020-06-12
申请号:CN202010108943.1
申请日:2020-02-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/205 , G06F40/279
Abstract: 本说明书的实施例公开了一种用户意图预测方法和系统。该方法包括:获取与用户相关的一个或多个因子信息;所述因子信息至少反映用户在某服务平台内的操作行为;基于所述因子信息确定多个候选意图文本;基于语言模型处理所述多个候选意图文本以及所述因子信息,得到多个相关度;多个相关度分别反映所述多个候选意图文本与所述因子信息的相关性;以及,至少基于所述多个相关度从所述多个候选意图文本中确定目标意图文本。
-
公开(公告)号:CN110991173A
公开(公告)日:2020-04-10
申请号:CN201911210176.9
申请日:2019-11-29
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 陈显玲
IPC: G06F40/284 , G06F40/216
Abstract: 本说明书实施例提供一种分词方法及系统。分词方法包括:候选词获取:基于第一位置从单句语料中获取预设字数的候选词;候选词截断:将候选词从一个或多个拆分位置处拆分,至少基于候选词中各拆分后子词的统计特征,从一个或多个拆分位置中确定候选词的截断位置;当截断位置位于候选词的结束位置时,将候选词确定为一个独立的分词;当截断位置位于候选词内部时,基于截断位置获取候选词的部分,将所述部分作为新的候选词进行至少一轮“候选词截断”处理,直至将所述部分拆分为一个或多个独立的分词;将截断位置作为第一位置从“候选词获取”开始进行下一轮循环;依此,将单句语料拆分为一个或多个独立的分词。
-
-
-
-
-
-
-
-