-
公开(公告)号:CN118152590B
公开(公告)日:2024-08-16
申请号:CN202410564986.9
申请日:2024-05-08
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/36 , G06F16/35 , G06F40/284 , G06N5/022
Abstract: 本说明书实施例提供一种基于文本语料生成医疗知识图谱的方法及装置,在基于文本语料构建知识图谱时,可以将知识图谱的数据获取过程分为开放式抽取和对齐两个阶段。具体而言,先由大模型从原始文本语料中开放式抽取实体词及相应的实体类型,还根据所抽取的实体词和实体类型提取相应连接关系。之后,再按照预先定义的实体模式和连接模式进行实体和关系的对齐,并根据对齐结果构建知识图谱。如此,可以提高知识图谱构建的全面性和有效性。
-
公开(公告)号:CN115034861B
公开(公告)日:2024-08-13
申请号:CN202210740465.5
申请日:2022-06-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/096 , G06N3/042 , G06Q30/0601
Abstract: 本说明书实施例公开了一种针对长尾分布的学习方法、装置以及设备,方案包括:确定物品集合中的各头部物品和各尾部物品;确定依次具有从属关系的多个属性维度,以及头部物品和尾部物品在属性维度上的属性值;将头部物品、尾部物品、属性值作为图节点,根据图节点和从属关系,生成图网络,以使头部物品的图节点通过对应的属性值的图节点,与尾部物品的图节点连接;确定反映头部物品的图节点向量内不同维度之间的相关性的第一相关性参数,以及反映尾部物品的图节点向量内不同维度之间的相关性的第二相关性参数;确定反映第一相关性参数与第二相关性参数之间差距的相关性损失;根据相关性损失,对图网络中的图节点向量进行学习。
-
公开(公告)号:CN118378099A
公开(公告)日:2024-07-23
申请号:CN202410612144.6
申请日:2024-05-16
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种针对自然语言处理模型的数据召回方法及装置,针对待通过自然语言模型处理的第一信息,可以对其进行数据召回的预处理,以将召回的文本与第一信息一起经由自然语言处理模型进行处理,得到相应业务处理结果。在数据召回过程中,可以先从数据库中检索与第一信息相匹配的若干文本作为候选文本,然后利用预先训练的效用模型对各个候选文本进行有效性评估,以得到各个候选文本分别对应的各个效用分数,再针对各个候选文本,分别基于相应相似度和效用分数的融合得到相应的融合分数,并根据各个融合分数从候选文本中筛选出目标文本作为召回数据。如此,可以有效节约计算成本。
-
公开(公告)号:CN118261269A
公开(公告)日:2024-06-28
申请号:CN202410405877.2
申请日:2024-04-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06F40/166
Abstract: 本说明书提供一种大模型领域迁移的训练方法及系统、文本生成方法及系统,能够使用少量的样本对训练由文本生成关键词组的模型,再使用该模型在已有的本文数据库上生成大量的样本对。之后调换样本对的输入和输出位置,训练由关键词组生成文本的模型。训练好的大模型能够接收关键词组类型的输入并输出文本类型的回答。
-
公开(公告)号:CN118153773A
公开(公告)日:2024-06-07
申请号:CN202410417578.0
申请日:2024-04-08
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种时间序列预测方法及装置,在进行时序预测过程中,考虑细时间粒度中的时序数据长度较大的情形,为了充分利用细时间粒度下的时序数据,通过按时间周期分割将长序列转换成短序列,并对短序列进行切片、提取单个短序列的切片编码、提取各个短时序中的对应时间区间的切片表征,进而通过拼接、形状重塑、融合等处理,进行分时间周期的长时序预测。这种实施方式可以减少参数量,提高对长时序数据处理的有效性。
-
公开(公告)号:CN118114675A
公开(公告)日:2024-05-31
申请号:CN202410533245.4
申请日:2024-04-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/295 , G06F16/35 , G06N3/0455 , G06N5/04 , G06F16/36 , G06N5/022
Abstract: 本申请一个或多个实施例提供一种基于大语言模型的医疗命名实体识别方法和装置,该方法包括:由大语言模型在多个不同的第一类提示文本中的各个第一类提示文本的引导下,基于候选实体类别集合对原始文本进行命名实体识别,得到命名实体识别结果;基于命名实体识别结果,确定原始文本中的各个目标命名实体及其对应的至少一个候选实体类别,并将其转化为与目标命名实体对应的至少一个用于指示与命名实体对应的实体类别的观点;获取与目标命名实体的定义相关的知识文本;由大语言模型从知识文本中抽取与各个观点对应的论据,并进一步基于论据,评估各个观点的正确度;将正确度最高的目标观点指示的候选实体类别确定为与目标命名实体对应的实体类别。
-
公开(公告)号:CN117196819A
公开(公告)日:2023-12-08
申请号:CN202310983611.1
申请日:2023-08-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q40/03 , G06F16/901
Abstract: 本说明书实施例提供基于Motif保持的用户表征学习方法、用户信用风险预测方法及装置。在进行用户表征学习时,根据用户社交关系图构建至少一个Motif图;对目标用户的用户初始表征分别执行用户社交关系图和各个Motif图下的图表征学习来学习出目标用户在各个图下的用户表征。随后,使用用户社交关系图下的用户表征来对各个Motif图下的用户表征进行表征增强,以得到各个Motif图下的经过表征增强后的用户表征;并且对各个Motif图下的经过表征增强后的用户表征进行表征融合,得到目标用户的最终用户表征。
-
公开(公告)号:CN116992047A
公开(公告)日:2023-11-03
申请号:CN202310982770.X
申请日:2023-08-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供知识图谱表征模型训练方法、知识图谱表征方法及装置。在进行知识图谱表征模型训练时,经由知识图谱表征模型的文本表征层,根据知识图谱中的实体节点的实体特征和边关系的边标识特征生成实体节点的初始实体表征以及边关系的关系表征,实体特征至少包括实体节点的文本特征;经由知识图谱表征模型的图学习层,对实体节点的初始实体表征进行知识图谱下的图学习,以得到实体节点的最终实体表征;以及使用实体节点的最终实体表征和边关系的关系表征来执行知识图谱表征模型训练。
-
公开(公告)号:CN116304337A
公开(公告)日:2023-06-23
申请号:CN202310274863.7
申请日:2023-03-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F18/214 , G06V10/44 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例提供对象推荐模型训练方法、推荐对象确定方法及装置。在每轮模型训练时,确定用户特征的用户特征嵌入表征、目标对象和用户交互对象的对象特征嵌入表征。从用户交互对象的对象特征嵌入表征中解耦出用户兴趣嵌入表征和用户从众嵌入表征;分别根据目标对象的对象特征嵌入表征以及用户特征嵌入表征与用户兴趣嵌入表征和用户从众嵌入表征之间的耦合结果确定目标对象表征、用户兴趣表征和用户从众表征;根据基于用户兴趣表征、用户从众表征与目标对象表征确定出的用户兴趣预测结果和用户从众预测结果调整对象推荐模型的模型参数。
-
-
-
-
-
-
-
-
-