一种数据处理方法、装置及设备

    公开(公告)号:CN119026636B

    公开(公告)日:2025-02-28

    申请号:CN202411514637.2

    申请日:2024-10-28

    Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:获取用于对图神经网络模型进行模型训练的图结构数据,所述图结构数据中包括节点、边和节点特征;根据预先设定的隐私数据遗忘要求,对所述图结构数据中包含的隐私数据进行定位,并根据定位结果确定所述图结构数据中位于所述隐私数据对应的遗忘范围内的目标子图数据;通过与所述隐私数据遗忘要求对应的类型相匹配的对冲规则,调整所述目标子图数据中的数据生成所述目标子图数据对应的对冲子图数据;基于所述目标子图数据和所述对冲子图数据,通过对比学习的方式对所述图神经网络模型进行模型训练,得到训练后的图神经网络模型。

    一种视频数据处理方法及装置
    2.
    发明公开

    公开(公告)号:CN119295999A

    公开(公告)日:2025-01-10

    申请号:CN202411383312.5

    申请日:2024-09-29

    Abstract: 本说明书一个或多个实施例公开了一种视频数据处理方法及装置。该方法首先获取目标视频以及与目标视频的视频类别相关的多个视频类别标签,其次,通过图文跨模态预训练模型对目标视频进行特征提取,得到目标视频的文本特征和包括多个视频帧的第二视频特征,并将目标视频的第二视频特征输入训练后的视频调制模型中,通过视频调制模型中的时序调制矩阵在预设时间段内对目标视频进行调制处理,得到目标视频对应的调制处理后的第二视频特征,最后计算调制处理后的第二视频特征和多个视频类别标签之间的第一相似度,计算调制处理后的第二视频特征和目标视频的文本特征之间的第二相似度,并基于第一相似度和第二相似度确定目标视频的视频类别。

    数据处理方法、装置及设备

    公开(公告)号:CN114969293B

    公开(公告)日:2025-01-03

    申请号:CN202210612033.6

    申请日:2022-05-31

    Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,所述方法包括:获取待识别的目标特征向量,所述目标特征向量由目标用户针对目标业务的交互内容确定,其中,基于所述目标特征向量还原出的内容与所述交互内容不同;基于预先训练的风险话术识别模型对所述目标特征向量进行识别处理,得到针对所述目标特征向量的识别结果,所述风险话术识别模型基于目标风险话术对应的特征向量训练得到,所述目标风险话术对应的特征向量为基于预先训练的风险话术筛选模型,对所述目标业务中存在风险的历史交互内容对应的第一特征向量进行筛选处理得到;基于所述识别结果,确定所述交互内容中是否存在风险话术,以确定触发执行所述目标业务是否存在风险。

    一种信息抽取方法、装置、存储介质及电子设备

    公开(公告)号:CN119128129A

    公开(公告)日:2024-12-13

    申请号:CN202411311820.2

    申请日:2024-09-19

    Abstract: 本说明书公开了一种信息抽取方法、装置、存储介质和电子设备,获取待抽取文本,并确定若干个目标抽取类别。针对每个目标抽取类别,根据预设对应关系,确定该目标抽取类别对应的标识符,作为提示信息。将提示信息及待抽取文本输入的信息抽取模型,得到信息抽取模型输出的待抽取文本的抽取结果,该信息抽取模型是通过预设对应关系确定出的标识符训练得到的。由于需要抽取的抽取类别较多,导致提示信息的长度过长,因此,本方法通过将抽取类别转换为标识符,以减少提示信息的长度。此外,信息抽取模型也是通过标识符训练得到的,因此,将标识符作为提示信息输入信息抽取模型,可在待抽取文本中抽取与标识符对应的抽取类别的信息。

    一种数据处理方法、装置及设备

    公开(公告)号:CN119026636A

    公开(公告)日:2024-11-26

    申请号:CN202411514637.2

    申请日:2024-10-28

    Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:获取用于对图神经网络模型进行模型训练的图结构数据,所述图结构数据中包括节点、边和节点特征;根据预先设定的隐私数据遗忘要求,对所述图结构数据中包含的隐私数据进行定位,并根据定位结果确定所述图结构数据中位于所述隐私数据对应的遗忘范围内的目标子图数据;通过与所述隐私数据遗忘要求对应的类型相匹配的对冲规则,调整所述目标子图数据中的数据生成所述目标子图数据对应的对冲子图数据;基于所述目标子图数据和所述对冲子图数据,通过对比学习的方式对所述图神经网络模型进行模型训练,得到训练后的图神经网络模型。

    一种模型训练的方法、图像生成的方法及装置

    公开(公告)号:CN118918201A

    公开(公告)日:2024-11-08

    申请号:CN202410917610.1

    申请日:2024-07-09

    Abstract: 本说明书公开了一种模型训练的方法、图像生成的方法及装置,具体包括:将原始图像以及文本描述信息输入到待训练的图像生成模型中,使得图像生成模型生成包含有指定对象的目标图像。将文本描述信息输入图像生成模型中,以生成出先验图像,并确定原始图像的标签信息,使图像生成模型根据标签信息,生成重构先验图像。根据目标图像和目标图像的参照数据确定第一偏差,根据先验图像和重构先验图像确定第二偏差。以最小化第一偏差和第二偏差为优化目标,训练图像生成模型。通过本方法可以有效提高图像生成模型在进行图像创作时的扩展能力,同时又完整保护了指定对象特征信息的完整性,极大程度上提高了目标图像中指定对象的保真性。

    一种语音识别方法、装置及设备
    7.
    发明公开

    公开(公告)号:CN118522273A

    公开(公告)日:2024-08-20

    申请号:CN202410726526.1

    申请日:2024-06-05

    Inventor: 王志铭 祝慧佳

    Abstract: 本说明书实施例公开了一种语音识别方法、装置及设备,该方法包括:将语音序列数据输入到语音识别模型中的线性编码器中,得到语音序列数据对应的第一线性编码序列;将第一线性编码序列输入到语音识别模型中的编码器中,得到语音序列数据对应的编码结果,编码器由多个相互串联的语音处理子模型构成,每个语音处理子模型包括线性循环模块和输出模块,线性循环模块中包括前向循环和逆向循环,输出模块用于基于前向循环中当前线性循环模块的隐藏状态、逆向循环中当前线性循环模块的隐藏状态,以及前向循环对应的输入数据,确定语音处理子模型对应的结果;将编码结果输入到语音识别模型中的解码器中,得到语音序列数据对应的识别结果。

    一种视频数据分类方法、装置以及介质

    公开(公告)号:CN118193788A

    公开(公告)日:2024-06-14

    申请号:CN202410383785.9

    申请日:2024-03-29

    Abstract: 本说明书提供了一种视频数据分类方法、装置以及介质中,通过确定视频数据,作为训练样本,并确定视频数据对应的各文本段。确定所述各文本段对应的来源特征,然后将训练样本、各文本段以及各文本段对应的来源特征输入视频分类模型,确定预测分类结果。以预测分类结果与训练样本对应的分类标签之间的差异最小为优化目标,训练待训练的视频分类模型,以根据训练完成的视频分类模型执行业务。通过特征提取网络确定各文本段对应特征,辅助视频分类模型可以更好的理解各文本段的语义以及视频内容的数据,实现对视频数据更加准确的分类,已便根据视频数据的分类更好的执行相应业务。

    一种图像的召回方法、装置及设备

    公开(公告)号:CN118193776A

    公开(公告)日:2024-06-14

    申请号:CN202410384438.8

    申请日:2024-03-29

    Abstract: 本说明书实施例公开了一种图像的召回方法、装置及设备,该方法包括:对待检测的目标图像进行开集目标检测,以检测目标图像中包含的第一类目标和第二类目标,得到目标图像中包含的每个图像目标所在的目标区域,第一类目标为属于预设类别的目标,第二类目标为不属于预设类别的目标,分别对每个图像目标所在的目标区域中包含的图像内容进行语义识别处理,得到每个目标区域对应的语义识别文本,基于每个图像目标在目标图像中的位置的信息、目标区域对应的语义识别文本和预设的图像召回条件,通过预设的大语言模型判断目标图像是否满足图像召回条件,从而可以通过召回目标图像来达到召回其包含的某指定图像目标(具体如某指定商品等)的目的。

    文本的情感信息处理方法及装置

    公开(公告)号:CN111783453B

    公开(公告)日:2024-05-21

    申请号:CN202010621825.0

    申请日:2020-07-01

    Abstract: 本说明书一个或多个实施例公开了一种文本的情感信息处理方法及装置,以解决现有技术中情感倾向识别不准确、导致无法基于情感倾向信息准确调整业务参数的问题。方法包括:提取待预测文本中与业务相关的第一情感词,第一情感词包括正面情感词和负面情感词。以及,对待预测文本进行分句处理,得到待预测文本对应的第一分句。根据第一情感词及第一分句,确定待预测文本对应的第一情感词分布特征。根据第一情感词分布特征及预先训练的情感预测模型,确定待预测文本对应的第一情感倾向信息。根据第一情感倾向信息及第一分句对应的细粒度情感因子,确定待预测文本对应的第二情感倾向信息。向业务的业务处理平台发送第二情感倾向信息。

Patent Agency Ranking