一种生成图像的检测方法及装置
    41.
    发明公开

    公开(公告)号:CN117523323A

    公开(公告)日:2024-02-06

    申请号:CN202410010345.9

    申请日:2024-01-03

    Abstract: 本说明书一个或多个实施例公开了一种生成图像的检测方法及装置,该方法首先获取目标图像,其次从目标图像中选取部分图像,并基于目标图像中除部分图像之外的剩余图像对部分图像进行重构处理,获取剩余图像和重构的部分图像所组成的重构图像,然后将重构图像输入预先训练的分类模型,得到重构图像的重构效果类别,最后根据重构图像的重构效果类别,确定目标图像是真实图像或生成图像。

    数据处理方法、装置及设备
    42.
    发明公开

    公开(公告)号:CN117392694A

    公开(公告)日:2024-01-12

    申请号:CN202311674312.6

    申请日:2023-12-07

    Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:获取与目标文本匹配的目标风险关键词,并获取目标文本与目标风险关键词之间的匹配度;通过预先训练的扩散生成模型,对目标文本进行加噪处理,得到与目标文本对应的第一图像表征;通过预先训练的扩散生成模型,经过预设迭代次数逐次对第一图像表征进行降噪处理,直到最后一次迭代过程结束,得到预先训练的扩散生成模型的输出端的元函数;基于迭代结束得到的预先训练的扩散生成模型的输出端的元函数、目标文本、目标风险关键词以及最后一次迭代过程对应的噪声,生成与目标文本对应的第二图像表征,并基于第二图像表征,确定与目标文本对应的目标图像。

    一种数据的检索方法、装置及设备

    公开(公告)号:CN117312492A

    公开(公告)日:2023-12-29

    申请号:CN202311141896.0

    申请日:2023-09-05

    Abstract: 本说明书实施例公开了一种数据的检索方法、装置及设备,该方法包括:获取目标事件的查询请求,查询请求中包括目标事件的事件文本,获取针对查询请求的历史事件文书集,对事件文本进行关键信息提取,得到事件文本对应的事件信息,事件信息包括目标事件的事件触发词,对事件信息和事件文本进行编码处理,得到第一编码信息,并对第一编码信息中事件触发词对应的编码信息进行池化处理,得到第二编码信息,对历史事件文书进行编码处理,得到第三编码信息集,基于预先训练的表征模型对第二编码信息和第三编码信息集进行处理,并基于处理后的第二编码信息和第三编码信息集,从历史事件文书集中确定查询到的与目标事件相匹配的历史事件文书。

    一种模型训练的方法、装置、存储介质及电子设备

    公开(公告)号:CN117195871A

    公开(公告)日:2023-12-08

    申请号:CN202311008555.6

    申请日:2023-08-10

    Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质和电子设备,获取样本文本,并确定所述样本文本中的每个字符的标注实体类别,针对每个标注实体类别,获得该标注实体类别对应的代表字符集,所述代表字符集中包含至少两个代表字符,获取预训练的语言模型,将所述样本文本输入所述语言模型,确定所述语言模型针对每个字符识别出的代表字符,针对所述样本文本中的每个字符,判断所述语言模型针对该字符识别出的代表字符是否位于该字符的标注实体类别对应的代表字符集中,若否,则对所述语言模型进行微调训练。本方法通过语言模型识别文本中字符的实体类别,并利用多个代表字符代表一个实体类别,提高语言模型输出文本中字符的实体类别的准确性。

    数据处理方法、装置及设备
    45.
    发明公开

    公开(公告)号:CN116757208A

    公开(公告)日:2023-09-15

    申请号:CN202310466681.X

    申请日:2023-04-26

    Abstract: 本说明书实施例提供了多种数据处理方法、装置及设备,其中一种方法包括:获取用于训练第一模型的文本数据样本及文本数据样本包含的词对应的实体类型标签,基于第一损失函数、文本数据样本及文本数据样本包含的词对应的实体类型标签,对第一模型进行迭代训练,并在第一模型满足预设收敛条件的情况下,基于由初步训练的第一模型对文本数据样本进行实体识别处理得到的文本数据样本包含的词对应不同的预测实体类型的概率分布,确定的初步训练的第一模型对应的预测熵,对第一损失函数中的参数进行更新处理,并基于更新后的第一损失函数对初步训练的第一模型进行迭代训练,直到第一模型收敛,得到训练后的第一模型。

    数据处理方法、装置及设备
    46.
    发明公开

    公开(公告)号:CN116541509A

    公开(公告)日:2023-08-04

    申请号:CN202310507025.X

    申请日:2023-05-04

    Abstract: 本说明书实施例提供了多种数据处理方法、装置及设备,其中一种方法包括:接收针对目标文本数据的相似文本检索请求,响应于相似文本检索请求,获取由基于训练后的目标模型得到的目标文本数据包含的语句对应的第一特征向量、目标文本数据包含的语句对应的预测类别、候选文本数据包含的语句对应的第二特征向量,以及候选文本数据包含的语句对应的预测类别,确定的目标文本数据和候选文本数据之间的目标相似度,基于目标相似度,从候选文本数据中筛选出与目标文本数据存在匹配关系的候选文本数据,并将筛选出的候选文本数据确定为针对目标文本数据的相似文本检索结果。

    数据处理方法、装置及设备
    47.
    发明公开

    公开(公告)号:CN116522939A

    公开(公告)日:2023-08-01

    申请号:CN202310466522.X

    申请日:2023-04-26

    Abstract: 本说明书实施例提供了多种数据处理方法、装置及设备,其中一种方法包括:通过目标模型对文本数据样本进行实体识别处理,得到文本数据样本包含的词对应的预测实体类型,基于词对应的预测实体类型和实体类型标签,将文本数据样本包含的词划分为第一样本和包含噪声的第二样本,并基于第一样本对应的预测实体类型和实体类型标签,确定第一损失值,对增强处理得到的第二样本进行语义提取处理,得到第二样本对应的语义向量,基于由第二样本对应的语义向量构建的正样本对和负样本对,确定第二损失值,基于第一损失值和第二损失值,确定目标模型对应的目标损失值,并基于目标损失值对目标模型进行迭代训练,直至目标模型收敛,得到训练后的目标模型。

    一种文本处理方法、装置、设备和存储介质

    公开(公告)号:CN114266226A

    公开(公告)日:2022-04-01

    申请号:CN202111642879.6

    申请日:2021-12-29

    Abstract: 本申请提出一种文本处理方法、装置、设备和存储介质。该方法可以包括:对待处理文本进行切分操作,得到N个文本序列;针对所述N个文本序列中的每一文本序列,基于所述文本序列前后相邻的文本序列中的至少部分文本数据,对所述文本序列进行编码,得到编码后的所述文本序列;对编码后的N个所述文本序列进行编码,得到所述待处理文本对应的编码结果,并根据所述编码结果,确定所述待处理文本的文本类型。

    文本变异关系的获取方法和装置

    公开(公告)号:CN113837118A

    公开(公告)日:2021-12-24

    申请号:CN202111141052.7

    申请日:2021-09-28

    Abstract: 本说明书实施例提供了一种文本变异关系的获取方法及装置以及真实文本的获取方法及装置。首先,得到变异文本字符;将该变异文本字符转换为第一图像;对转换出的第一图像进行图像变换处理,得到第二图像;对变换处理后得到的第二图像进行OCR识别,得到第二图像对应的OCR识别字符;将所述变异文本字符与所述第二图像对应的OCR识别字符的映射关系作为文本变异关系;根据文本变异关系得到待识别的第一文本字符串对应的第二文本字符串,根据第二文本字符串得到真实文本。本说明书实施例能够更为全面地得到文本变异关系并得到具有更加真实语义的真实文本。

    文本分类的方法和装置
    50.
    发明公开

    公开(公告)号:CN113626603A

    公开(公告)日:2021-11-09

    申请号:CN202110956610.9

    申请日:2021-08-19

    Abstract: 说明书披露一种文本分类的方法和装置。所述方法包括:对待分类文本进行切分,得到若干文本片段;针对每个文本片段,将所述文本片段作为入参输入已训练的片段语义提取模型以对所述文本片段进行语义提取,得到所述文本片段对应的片段语义向量;将所述若干文本片段对应的若干片段语义向量作为入参输入已训练的文本语义提取模型以对所述待分类文本进行语义提取,得到所述待分类文本对应的文本语义向量;将所述文本语义向量作为入参输入已训练的分类模型,根据所述分类模型的输出结果,确定所述待分类文本所属的文本分类。

Patent Agency Ranking