-
公开(公告)号:CN117710510A
公开(公告)日:2024-03-15
申请号:CN202410156973.8
申请日:2024-02-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例公开了一种图像生成方法及装置,该方法首先获取目标主体的前景图像以及目标主体所在的待确定的目标图像的文本描述信息,该目标图像中包括目标主体的前景图像和背景图像,其次,从目标主体的前景图像中分别提取目标主体的类别表征信息和风格表征信息,然后将所提取的类别表征信息和风格表征信息输入预先训练的前景控制模型中,得到目标主体的前景控制信息,最后,通过扩散模型,根据目标图像的文本描述信息和前景控制信息,并通过对目标主体的前景图像添加噪声信息的方式,确定目标主体对应的目标图像。
-
公开(公告)号:CN113032566B
公开(公告)日:2023-02-24
申请号:CN202110318186.5
申请日:2021-03-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F16/33 , G06F40/205
Abstract: 本说明书实施例公开了一种舆情聚类方法、装置以及设备。方案包括:对待聚类舆情文本进行分句,得到多个分句片段,并确定分句片段的分句指纹;根据分句指纹,在历史舆情分句指纹库中进行匹配;根据匹配的结果,在历史舆情库中进行模糊搜索,得到与待聚类舆情文本具有相同分句片段的候选历史舆情集合;通过将待聚类舆情文本在候选历史舆情集合中进行相似性比较,从候选历史舆情集合中筛选出相似的历史舆情;根据相似的历史舆情所属的聚类组,对待聚类舆情文本进行中心漂移校验;若中心漂移校验通过,则将待聚类舆情文本加入聚类组中。
-
公开(公告)号:CN114821616A
公开(公告)日:2022-07-29
申请号:CN202210454967.1
申请日:2022-04-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/413 , G06V30/24 , G06V30/19
Abstract: 本说明书实施例提供了页面表征模型训练的方法、装置及计算设备。该方法包括:获取与目标页面相关的多个对象对应的多个编码向量;多个对象包括位于目标页面中的多个第一文字;利用训练好的目标检测模型,检测目标页面中的版面元素各自对应的标定元素类别得到第一结果;将多个编码向量输入页面表征模型,页面表征模型基于注意力机制对多个编码向量进行处理,得到对应的多个表征向量;根据多个表征向量,确定第二结果,第二结果包括多个对象的部分或全部的预测元素类别;根据第一结果和第二结果确定第一预测损失;根据第一预测损失对页面表征模型进行训练,使得页面表征模型学习页面的版面元素和页面的文字之间的关系,更好的表征页面的文字信息。
-
公开(公告)号:CN114492443A
公开(公告)日:2022-05-13
申请号:CN202210078338.3
申请日:2022-01-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 公开了一种用于训练实体识别模型的方法,包括:构造训练集;以及将该训练集中的训练样本输入到实体识别模型,以得到该训练样本中的句子的序列标注预测输出和实体匹配预测输出,基于该句子的序列标注预测输出和该句子的序列标注标签确定该句子的序列标注损失;至少部分地基于该句子的实体匹配预测输出和该句子的隐喻实体标签确定该句子的实体匹配损失;确定该实体识别模型的总损失,该总损失为该序列标注损失和该实体匹配损失的加权和;以及迭代执行训练以最小化该实体识别模型的总损失,从而得到经训练的实体识别模型。本申请还涉及相对应的实体识别方法以及相关系统、装置和介质。本方案能够全面、高效地识别出包括隐喻实体在内的感兴趣实体。
-
公开(公告)号:CN113688238A
公开(公告)日:2021-11-23
申请号:CN202110952575.3
申请日:2021-08-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F16/36 , G06F40/284 , G06K9/62 , G06F16/9535
Abstract: 本说明书实施例提供了一种识别词语上下位关系的方法和装置。根据该实施例的方法,首先获取待识别词对,所述待识别词对包括第一词语和第二词语;然后确定所述第一词语和第二词语之间的词向量差值;若所述词向量差值符合预先得到的上下位关系分布,则确定所述待识别词对存在上下位关系。通过本公开能够实现词语上下位关系的自动识别。
-
公开(公告)号:CN112199947A
公开(公告)日:2021-01-08
申请号:CN202011061564.8
申请日:2020-09-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/242 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08 , G06N20/00
Abstract: 本说明书实施例提供一种程序名称宽泛检测方法和装置,该方法包括:获取一个程序的程序名称和主体名称后,首先从程序名称中解析出第一分词并分别将每个第一分词映射为第一词向量,从主体名称中解析出第二分词并分别将每个第二分词映射为第二词向量,接着根据各第一词向量生成用于表征程序名称内容特征的程序名称编码,接着根据程序名称编码和各第二词向量生成用于表征主体名称内容特征及第一分词与第二分词之间相似性的主体名称编码,接着将程序名称编码和主体名称编码输入分类器获得名称宽泛系数,接着根据名称宽泛系统与预设名称宽泛阈值的大小关系确定该程序的程序名称是否宽泛。
-
公开(公告)号:CN111783453A
公开(公告)日:2020-10-16
申请号:CN202010621825.0
申请日:2020-07-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/289 , G06F40/30 , G06K9/62
Abstract: 本说明书一个或多个实施例公开了一种文本的情感信息处理方法及装置,以解决现有技术中情感倾向识别不准确、导致无法基于情感倾向信息准确调整业务参数的问题。方法包括:提取待预测文本中与业务相关的第一情感词,第一情感词包括正面情感词和负面情感词。以及,对待预测文本进行分句处理,得到待预测文本对应的第一分句。根据第一情感词及第一分句,确定待预测文本对应的第一情感词分布特征。根据第一情感词分布特征及预先训练的情感预测模型,确定待预测文本对应的第一情感倾向信息。根据第一情感倾向信息及第一分句对应的细粒度情感因子,确定待预测文本对应的第二情感倾向信息。向业务的业务处理平台发送第二情感倾向信息。
-
公开(公告)号:CN119025879B
公开(公告)日:2025-02-28
申请号:CN202411515145.5
申请日:2024-10-28
Applicant: 支付宝(杭州)信息技术有限公司 , 清华大学
IPC: G06F18/21 , G06F18/214 , G06N5/04
Abstract: 本说明书实施例公开了一种大模型的安全性测评方法、装置及设备,该方法包括:获取用于对目标大模型进行安全性测评所需使用的测试集,测试集中包括测试样本数据和对应的标签信息;确定测试样本数据中后门触发器的停用词权重比例阈值,基于停用词权重比例阈值对预设的多个初始停用词组中的基准停用词当前所在的初始停用词组进行调整,得到多个目标停用词组;将测试样本数据中包含的当前处于第一目标停用词组的停用词,使用多个目标停用词组中的其它目标停用词组中与停用词相匹配的基准停用词替换,直到停用词权重比例满足预设条件,得到替换后的测试集;基于替换后的测试集对目标大模型进行安全性测评,以判断目标大模型是否存在越狱攻击风险。
-
公开(公告)号:CN119128272A
公开(公告)日:2024-12-13
申请号:CN202411337666.6
申请日:2024-09-24
Applicant: 中国科学院软件研究所 , 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F18/214
Abstract: 本说明书实施例公开了一种标签生成的方法、装置及电子设备。所述标签生成的方法包括:接收用户输入的针对目标对象的标签生成指令;获取与所述目标对象匹配的层次标签体系,所述层次标签体系为根据预设的标签集构建的具有层次结构的标签体系,所述标签集中标签存放于所述层次标签体系中至少一个终止节点;基于大型语言模型,从所述层次标签体系的根节点出发,根据所述目标对象的描述信息和所述层次标签体系中各个中间节点的生成标签,逐层次确定与所述目标对象相关的中间节点;在所述层次标签体系中,将与所述目标对象相关的中间节点相连的终止节点,确定为目标终止节点,并从所述目标终止节点存放的标签中,确定所述目标对象的标签。
-
公开(公告)号:CN113836913B
公开(公告)日:2024-12-03
申请号:CN202111095354.5
申请日:2021-09-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F40/211 , G06F40/253 , G06F16/35 , G06N3/042 , G06N3/0464 , G06N3/0455 , G06N3/0442 , G06N3/048
Abstract: 本说明书实施例提供了一种利用检测模型检测文本中事件触发词的方法及装置,检测模型包括图神经网络,其中包括依次连接的N个神经网络层,神经网络层包括噪声过滤子层和图卷积子层,该方法包括:获取词序列中m个词分别对应的m个第一向量;基于m个词的句法依赖获取各词之间的邻接关系;将m个第一向量输入图神经网络,在任意的第t神经网络层的向量处理包括:利用噪声过滤子得到各输入向量的降噪向量,包括该输入向量与其他输入向量之间分别对应的降噪权重;根据m个输入向量、邻接关系、各输入向量的降噪向量,基于图卷积子层确定本层的m个输出向量;根据N个神经网络层中最后一层的m个输出向量,确定各个词是否为事件触发词的检测结果。
-
-
-
-
-
-
-
-
-