文本匹配和对抗文本识别方法、装置及设备

    公开(公告)号:CN112256841B

    公开(公告)日:2024-05-07

    申请号:CN202011350754.1

    申请日:2020-11-26

    Abstract: 本说明书实施例提供一种文本匹配和对抗文本识别方法、装置及设备。文本匹配方法包括:构建第一文本和第二文本的文本向量,并分析文本向量之间的对齐信息;从对齐信息中抽取出关键对齐信息,以保留文本中关键文本单元相关的对齐信息;基于第一文本和第二文本的文本向量、关键对齐信息,分析第一文本和第二文本的匹配关系,达到从文本样本的维度进行文本匹配分析的目的。

    一种风险扫描规则的生成方法、装置、介质及电子设备

    公开(公告)号:CN117114393A

    公开(公告)日:2023-11-24

    申请号:CN202311008623.9

    申请日:2023-08-10

    Abstract: 本说明书公开了一种风险扫描规则的生成方法、装置、介质和电子设备,所述方法包括:确定当前初始规则组合和除初始规则组合中的扫描规则外的各待选规则。将各待选规则分添加到初始规则组合中,得到各待选组合。根据各待选组合的总得分,判断总得分最高的待选组合是否满足选中条件。若是,从各待选组合中确定选中组合。若否,从至少除总得分最高的待选组合之外的各其他待选组合中确定选中组合。根据初始规则组合的总得分和选中组合的总得分,重新确定初始规则组合以及选中组合,直至满足结束条件时,将确定出的选中组合作为对交易事件进行风险扫描的风险扫描规则组合,使采用风险扫描规则组合对交易事件进行风险扫描后得到的扫描结果更加准确。

    基于对抗学习的文本分类模型训练和文本分类方法及装置

    公开(公告)号:CN112966112B

    公开(公告)日:2023-08-08

    申请号:CN202110322493.0

    申请日:2021-03-25

    Abstract: 说明书实施例提供了一种文本分类模型的训练方法和文本分类方法,文本分类模型包括文本分类网络、对抗文本生成网络,该方法包括:将第一文本样本输入对抗文本生成网络,获得第一对抗文本;根据第一对抗文本与第一文本样本的文本差异损失;确定第一对抗文本与第一文本样本对于文本分类网络的判别差异损失;以文本差异损失趋于变小、判别差异损失趋于变大为目标,训练对抗文本生成网络;将第二文本样本输入经过训练的对抗文本生成网络,生成第二对抗文本;将第二文本样本和所述第二对抗文本,输入文本分类网络,得到第二文本样本和第二对抗文本分别对应的分类结果,以该分类结果趋同于第二文本样本的分类标签为目标,更新文本分类网络。

    一种语言模型的预训练方法、装置、介质及电子设备

    公开(公告)号:CN116502176A

    公开(公告)日:2023-07-28

    申请号:CN202310333653.0

    申请日:2023-03-28

    Abstract: 本说明书公开了一种语言模型的预训练方法、装置、介质及电子设备,可先获取样本文本,将样本文本输入到特征提取网络,以提取样本文本的文本特征,并通过提示网络生成提示特征。然后将文本特征和提示特征融合,得到融合特征。最后针对预设的每个训练任务,根据融合特征以及该训练任务的训练目标,对语言模型中的编码端进行预训练。通过在预训练语言模型的编码端添加提示网络,使得在对语言模型进行预训练时候,可以将样本文本的文本特征和通过提示网络得到的提示特征进行融合,进而根据训练任务,完成训练目标,使得预训练后的语言模型可以更好的适配应用场景中的实际任务,以提高语言模型执行任务的能力,达到更好的效果。

    文本匹配和对抗文本识别方法、装置及设备

    公开(公告)号:CN112256841A

    公开(公告)日:2021-01-22

    申请号:CN202011350754.1

    申请日:2020-11-26

    Abstract: 本说明书实施例提供一种文本匹配和对抗文本识别方法、装置及设备。文本匹配方法包括:构建第一文本和第二文本的文本向量,并分析文本向量之间的对齐信息;从对齐信息中抽取出关键对齐信息,以保留文本中关键文本单元相关的对齐信息;基于第一文本和第二文本的文本向量、关键对齐信息,分析第一文本和第二文本的匹配关系,达到从文本样本的维度进行文本匹配分析的目的。

    一种模型训练方法、业务风控方法、装置以及存储介质

    公开(公告)号:CN117933424A

    公开(公告)日:2024-04-26

    申请号:CN202410138854.X

    申请日:2024-01-31

    Abstract: 本说明书提供的一种模型训练方法、业务风控方法、装置以及存储介质,可以首先获取非结构化文档,并从中提取出其包含的各文本信息,以及确定出每个文本信息在非结构化文档中的文本位置信息,而后,将各文本信息以及文本位置信息输入到实体识别模型中,以使实体识别模型针对每个文本信息,根据该文本信息在非结构化文档中的文本位置信息以及其他文本信息在非结构化文档中的文本位置信息,从其他文本信息中确定与该文本信息相关联的文本信息,作为参考文本信息,并根据参考文本信息,确定对应的实体信息,作为预测实体,以最小化每个文本信息对应的预测实体与非结构化文档中包含的实际实体信息之间的偏差为优化目标,对实体识别模型进行训练。

    文本分类模型的训练方法及装置
    7.
    发明公开

    公开(公告)号:CN115858786A

    公开(公告)日:2023-03-28

    申请号:CN202211592050.4

    申请日:2022-12-12

    Abstract: 本说明书实施例提供了文本分类模型的训练方法及装置,其中,一种文本分类模型的训练方法包括:文本分类模型的训练方法,包括:基于获取的待处理文本,构建对应的初始文本样本;待处理文本包括通用文本和业务文本;初始文本样本携带有掩码;基于初始文本样本,构建对应的正负样本对;正负样本对包括表征两个样本相似的正样本对和表征两个样本不相似的负样本对;根据正负样本对,对初始文本分类模型进行模型训练,得到预训练模型;根据预先生成的业务文本样本对预训练模型进行模型训练,得到文本分类模型。

    针对交易的制裁扫描方法及装置

    公开(公告)号:CN114819976A

    公开(公告)日:2022-07-29

    申请号:CN202210466962.0

    申请日:2022-04-29

    Abstract: 本说明书实施例提供了针对交易的制裁扫描方法及装置。该方法涉及扫描引擎,扫描引擎关联多个审理机器人,该多个审理机器人包括第一审理机器人,该方法包括:扫描引擎将其生成的当前审理任务发送至第一审理机器人,当前审理任务根据针对当笔交易的制裁扫描请求生成;第一审理机器人在本地数据库中查找与当前审理任务相同的目标人工审理任务,其中,该本地数据库存储有若干人工审理任务和该若干人工审理任务分别对应的审理结果;若查找到,则将目标人工审理任务对应的审理结果返回给扫描引擎;若未查找到,则向扫描引擎返回无法决策消息。

    名称匹配方法、训练方法、设备及存储介质

    公开(公告)号:CN114510944A

    公开(公告)日:2022-05-17

    申请号:CN202210153195.8

    申请日:2022-02-18

    Abstract: 本说明书一个或多个实施例提供一种名称匹配方法、训练方法、设备及存储介质。所述方法包括:获取待匹配名称的名称字符串;根据预先训练好的神经网络将所述待匹配名称的名称字符串转换成表征向量;其中,所述神经网络用于将同一名称的不同变体的字符串均转换成同一表征向量;确定所述待匹配名称的表征向量分别与预存的若干参考名称的表征向量之间的相似度;其中,所述参考名称的表征向量为将所述参考名称的任一变体的字符串输入所述神经网络得到;根据所述相似度确定所述待匹配名称与所述参考名称是否匹配。本实施例有利于提高匹配效率和匹配准确性。

Patent Agency Ranking