实体匹配模型的训练方法、实体匹配方法及设备

    公开(公告)号:CN117829145A

    公开(公告)日:2024-04-05

    申请号:CN202311758476.7

    申请日:2023-12-19

    Abstract: 本说明书一个或多个实施例公开了一种实体匹配模型的训练方法,包括:构建训练数据集;确定实体匹配任务的子任务;基于所述训练数据集对实体匹配模型进行训练,得到训练好的目标实体匹配模型;训练过程中,通过所述实体匹配模型的第一模型学习输入的样本对的浅层特征表示和深层特征表示,通过所述实体匹配模型的第二模型来基于所述浅层特征表示和所述深层特征表示中的至少一个,预测出所述子任务的预测结果,并确定所述子任务的损失函数;基于至少一个所述子任务的损失函数,确定所述实体匹配任务的损失函数,来更新所述实体匹配模型的参数。相应地,本说明书还公开了实体匹配模型的训练装置、实体匹配方法及实体匹配装置。

    文字识别方法、名单扫描方法和装置

    公开(公告)号:CN116229484A

    公开(公告)日:2023-06-06

    申请号:CN202310125818.5

    申请日:2023-01-31

    Abstract: 本说明书实施例提供了一种文字识别方法及装置、名单扫描方法及装置。在该方法中包括:确定待识别文字;根据预先设定的笔顺编码规则以及所述待识别文字的书写笔顺,得到待识别文字对应的笔顺编码;从该笔顺编码中拆分出至少一个编码片段;针对每一个编码片段均执行:根据预先设置的容差限制,在预先生成的字典中收集与当前的编码片段相对应的一组候选已知文字;其中,所述字典中包括多个已知文字;在对应各个编码片段的各组候选已知文字之间求交集,根据该交集得到所述待识别文字所对应的所述字典中的目标已知文字。本说明书实施例能够更为有效地识别出输入的文字。

    一种模型训练方法、业务风控方法、装置以及存储介质

    公开(公告)号:CN117933424A

    公开(公告)日:2024-04-26

    申请号:CN202410138854.X

    申请日:2024-01-31

    Abstract: 本说明书提供的一种模型训练方法、业务风控方法、装置以及存储介质,可以首先获取非结构化文档,并从中提取出其包含的各文本信息,以及确定出每个文本信息在非结构化文档中的文本位置信息,而后,将各文本信息以及文本位置信息输入到实体识别模型中,以使实体识别模型针对每个文本信息,根据该文本信息在非结构化文档中的文本位置信息以及其他文本信息在非结构化文档中的文本位置信息,从其他文本信息中确定与该文本信息相关联的文本信息,作为参考文本信息,并根据参考文本信息,确定对应的实体信息,作为预测实体,以最小化每个文本信息对应的预测实体与非结构化文档中包含的实际实体信息之间的偏差为优化目标,对实体识别模型进行训练。

Patent Agency Ranking