基于对抗学习的文本分类模型训练和文本分类方法及装置

    公开(公告)号:CN112966112A

    公开(公告)日:2021-06-15

    申请号:CN202110322493.0

    申请日:2021-03-25

    Abstract: 说明书实施例提供了一种文本分类模型的训练方法和文本分类方法,文本分类模型包括文本分类网络、对抗文本生成网络,该方法包括:将第一文本样本输入对抗文本生成网络,获得第一对抗文本;根据第一对抗文本与第一文本样本的文本差异损失;确定第一对抗文本与第一文本样本对于文本分类网络的判别差异损失;以文本差异损失趋于变小、判别差异损失趋于变大为目标,训练对抗文本生成网络;将第二文本样本输入经过训练的对抗文本生成网络,生成第二对抗文本;将第二文本样本和所述第二对抗文本,输入文本分类网络,得到第二文本样本和第二对抗文本分别对应的分类结果,以该分类结果趋同于第二文本样本的分类标签为目标,更新文本分类网络。

    文件加载方法、装置和电子设备

    公开(公告)号:CN111580881B

    公开(公告)日:2023-06-16

    申请号:CN202010366453.1

    申请日:2020-04-30

    Inventor: 钱涛 严淮

    Abstract: 本说明书提出了一种文件加载方法、装置和电子设备,其中,所述文件加载方法包括:加载值索引池,所述值索引池中存储对象和对象索引值;加载目标文档,所述目标文档中存储目标索引值;其中,当接收到检索请求时,在所述目标文档中确定与所述检索请求匹配的目标索引值,从所述值索引池中检索与确定出的所述目标索引值匹配一致的对象索引值,基于检索出的所述对象索引值所对应的对象生成检索结果。本说明书的文件加载方法、装置和电子设备,能够在文件加载场景中降低对象文件反序列化过程中的资源消耗。

    对抗样本的生成方法和装置
    3.
    发明公开

    公开(公告)号:CN112990383A

    公开(公告)日:2021-06-18

    申请号:CN202110510166.8

    申请日:2021-05-11

    Abstract: 本说明书实施例提供了一种对抗样本的生成方法和装置。该方法中,首先获取原始样本;根据所述原始样本,得到至少两个原始向量;从所述至少两个原始向量中选择出待扰动向量;对待扰动向量添加对抗扰动,得到扰动向量;在预先设置的向量池中检索与扰动向量相近似的向量;其中,所述向量池中包括根据各历史原始样本得到的各历史原始向量;根据检索到的相近似的向量,得到对抗样本。

    基于对抗学习的文本分类模型训练和文本分类方法及装置

    公开(公告)号:CN112966112B

    公开(公告)日:2023-08-08

    申请号:CN202110322493.0

    申请日:2021-03-25

    Abstract: 说明书实施例提供了一种文本分类模型的训练方法和文本分类方法,文本分类模型包括文本分类网络、对抗文本生成网络,该方法包括:将第一文本样本输入对抗文本生成网络,获得第一对抗文本;根据第一对抗文本与第一文本样本的文本差异损失;确定第一对抗文本与第一文本样本对于文本分类网络的判别差异损失;以文本差异损失趋于变小、判别差异损失趋于变大为目标,训练对抗文本生成网络;将第二文本样本输入经过训练的对抗文本生成网络,生成第二对抗文本;将第二文本样本和所述第二对抗文本,输入文本分类网络,得到第二文本样本和第二对抗文本分别对应的分类结果,以该分类结果趋同于第二文本样本的分类标签为目标,更新文本分类网络。

    文件加载方法、装置和电子设备

    公开(公告)号:CN111580881A

    公开(公告)日:2020-08-25

    申请号:CN202010366453.1

    申请日:2020-04-30

    Inventor: 钱涛 严淮

    Abstract: 本说明书提出了一种文件加载方法、装置和电子设备,其中,所述文件加载方法包括:加载值索引池,所述值索引池中存储对象和对象索引值;加载目标文档,所述目标文档中存储目标索引值;其中,当接收到检索请求时,在所述目标文档中确定与所述检索请求匹配的目标索引值,从所述值索引池中检索与确定出的所述目标索引值匹配一致的对象索引值,基于检索出的所述对象索引值所对应的对象生成检索结果。本说明书的文件加载方法、装置和电子设备,能够在文件加载场景中降低对象文件反序列化过程中的资源消耗。

    一种基于文本的风险防控处理方法、装置及设备

    公开(公告)号:CN113961704B

    公开(公告)日:2024-06-14

    申请号:CN202111266143.3

    申请日:2021-10-28

    Abstract: 本说明书实施例公开了一种基于文本的风险防控处理方法、装置及设备,该方法包括:获取针对目标业务的历史文本数据,然后,将历史文本数据输入到预先构建的生成器中,生成与历史文本数据对应的对抗文本数据,该对抗文本数据与历史文本数据之间的相似度高于预设相似度阈值,将历史文本数据和相应的对抗文本数据构建的数据对输入到预先构建的判别器中,通过该判别器分别对历史文本数据和相应的对抗文本数据进行评分,并通过对比历史文本数据的评分值和相应的对抗文本数据的评分值,以及预设的损失函数对生成器和判别器进行训练,得到训练后的生成器和判别器,最终,通过训练后的判别器对目标业务进行基于文本数据的风险防控处理。

    一种基于文本的风险防控处理方法、装置及设备

    公开(公告)号:CN113961704A

    公开(公告)日:2022-01-21

    申请号:CN202111266143.3

    申请日:2021-10-28

    Abstract: 本说明书实施例公开了一种基于文本的风险防控处理方法、装置及设备,该方法包括:获取针对目标业务的历史文本数据,然后,将历史文本数据输入到预先构建的生成器中,生成与历史文本数据对应的对抗文本数据,该对抗文本数据与历史文本数据之间的相似度高于预设相似度阈值,将历史文本数据和相应的对抗文本数据构建的数据对输入到预先构建的判别器中,通过该判别器分别对历史文本数据和相应的对抗文本数据进行评分,并通过对比历史文本数据的评分值和相应的对抗文本数据的评分值,以及预设的损失函数对生成器和判别器进行训练,得到训练后的生成器和判别器,最终,通过训练后的判别器对目标业务进行基于文本数据的风险防控处理。

Patent Agency Ranking