通过神经网络模型进行文档图像处理的方法及装置

    公开(公告)号:CN117351324A

    公开(公告)日:2024-01-05

    申请号:CN202311647324.X

    申请日:2023-12-04

    Abstract: 本公开提供一种通过神经网络模型进行文档图像处理的方法及装置,神经网络模型预先通过整体训练得到,其中至少包括匹配预测网络和逻辑交互网络,方法包括:从包含文档内容的目标图像中识别出多个文字;对于多个文字中任意两个文字构成的文字组合,使用匹配预测网络,得到文字组合属于同一语义字段的第一概率;在逻辑交互网络中,根据与文档理解相关的若干条约束规则,更新各个文字组合对应的第一概率,得到各个文字组合对应的第二概率;基于各个文字组合对应的第二概率,确定多个文字各自所属的语义字段。该实施方式使用包括约束规则的神经网络模型确定文档图像中多个文字各自所属的语义字段,因此可以提高文档图像处理的准确性。

    基于马尔可夫逻辑网预测用户行为的方法及装置

    公开(公告)号:CN115829110A

    公开(公告)日:2023-03-21

    申请号:CN202211489287.X

    申请日:2022-11-25

    Abstract: 本说明书实施例提供一种基于马尔可夫逻辑网预测用户行为的方法及装置。该方法包括:先获取基于用于限定用户行为之间关系的多条实例化规则而构建的马尔可夫逻辑网,其中包括与用户行为相关的多个变量,多个变量中涉及同一条实例化规则的变量共同形成对应的团;再基于马尔可夫逻辑网,对多个变量中各个隐变量在观测变量的观测值下的概率分布进行多轮次迭代更新,其中任一轮次包括:将各个隐变量分别作为目标隐变量,基于其所在若干团中各个团的团势能函数、各个团中其他隐变量的上一轮概率分布,确定目标隐变量的逻辑值对应的目标势能,用以确定目标隐变量的本轮概率分布;然后,根据多轮次迭代更新后隐变量中的行为变量的概率分布,预测用户行为。

    数据处理方法及系统
    4.
    发明公开

    公开(公告)号:CN119557398A

    公开(公告)日:2025-03-04

    申请号:CN202411606386.0

    申请日:2024-11-11

    Abstract: 本说明书提供一种数据处理方法及系统。该方法包括:获取目标问题,并获得事实数据集合;从知识图谱中检索得到与所述目标问题相关的第一知识信息,并基于所述第一知识信息从所述事实数据集合中筛选出关键事实数据;从所述知识图谱中检索得到与所述目标问题、所述关键事实数据均相关的第二知识信息;以及将所述目标问题、所述关键事实数据以及所述第二知识信息提供给大模型,以通过所述大模型生成所述目标问题对应的回答信息。

    一种基于图数据的业务规则确定方法及装置

    公开(公告)号:CN117290554B

    公开(公告)日:2024-03-01

    申请号:CN202311590588.6

    申请日:2023-11-24

    Abstract: 本说明书实施例提供了一种基于图数据的业务规则确定方法及装置。图数据包括代表业务对象的节点以及节点之间的连接边,用来存储与业务数据相关的隐私数据。在该方法中,通过图神经网络确定图数据中的节点表征。将若干备选规则与匹配的实例子图进行结合,得到若干推理子图,备选规则包括推理条件和推理结果,任意一个推理子图包含推理条件数据和推理结果数据。接着,利用节点表征确定若干推理子图中各自的推理结果数据成立的概率评分,基于与任意一个备选规则匹配的若干推理子图的概率评分,确定该备选规则的置信度,基于若干备选规则的置信度对若干备选规则进行筛选,得到图数据的

    用于识别敏感样本的方法、模型训练方法和装置

    公开(公告)号:CN117520898A

    公开(公告)日:2024-02-06

    申请号:CN202311548634.6

    申请日:2023-11-20

    Abstract: 本说明书的实施例提供了一种用于识别敏感样本的方法、模型训练方法和装置。在该用于识别敏感样本的方法中,获取待识别的样本数据集,其中,所述样本数据集中的各个样本数据包括特征数据;先利用样本分组模型根据各个样本数据的特征数据得到用于指示各个样本数据所属分组的分组信息;再利用因果预测模型根据各个样本数据的特征数据和对应的分组信息得到各个样本数据对应的在处理变量的各个取值下的结果预测值;根据所得到的各个分组中的样本数据对应的在处理变量的各个取值下的结果预测值,确定各个分组对应的敏感系数;将敏感系数最高的分组中的样本数据确定为敏感样本。

    一种基于图数据的业务规则确定方法及装置

    公开(公告)号:CN117290554A

    公开(公告)日:2023-12-26

    申请号:CN202311590588.6

    申请日:2023-11-24

    Abstract: 本说明书实施例提供了一种基于图数据的业务规则确定方法及装置。图数据包括代表业务对象的节点以及节点之间的连接边,用来存储与业务数据相关的隐私数据。在该方法中,通过图神经网络确定图数据中的节点表征。将若干备选规则与匹配的实例子图进行结合,得到若干推理子图,备选规则包括推理条件和推理结果,任意一个推理子图包含推理条件数据和推理结果数据。接着,利用节点表征确定若干推理子图中各自的推理结果数据成立的概率评分,基于与任意一个备选规则匹配的若干推理子图的概率评分,确定该备选规则的置信度,基于若干备选规则的置信度对若干备选规则进行筛选,得到图数据的业务规则,用于进行业务处理。

    因果效应估计模型的训练方法、因果效应估计方法和装置

    公开(公告)号:CN117520899A

    公开(公告)日:2024-02-06

    申请号:CN202311549529.4

    申请日:2023-11-20

    Abstract: 本说明书的实施例提供了一种因果效应估计模型的训练方法、因果效应估计方法和装置。在该因果效应估计模型的训练方法中,利用包括特征数据、结果数据和作为处理变量的处理数据的训练样本集执行以下训练:利用当前分组模型根据各个当前训练样本的特征数据得到对应的所属分组信息;利用当前因果估计模型根据各个当前训练样本对应的所属分组信息、特征数据和处理变量的各个取值得到各个当前训练样本在处理变量的各个取值下对应的结果预测值;根据各个当前训练样本的结果数据与相匹配的结果预测值之间的差异确定当前因果估计模型训练过程的因果估计损失值,进而根据所确定的因果估计损失值调整当前因果估计模型的模型参数,直到满足训练结束条件。

    通过神经网络模型进行文档图像处理的方法及装置

    公开(公告)号:CN117351324B

    公开(公告)日:2024-03-01

    申请号:CN202311647324.X

    申请日:2023-12-04

    Abstract: 本公开提供一种通过神经网络模型进行文档图像处理的方法及装置,神经网络模型预先通过整体训练得到,其中至少包括匹配预测网络和逻辑交互网络,方法包括:从包含文档内容的目标图像中识别出多个文字;对于多个文字中任意两个文字构成的文字组合,使用匹配预测网络,得到文字组合属于同一语义字段的第一概率;在逻辑交互网络中,根据与文档理解相关的若干条约束规则,更新各个文字组合对应的第一概率,得到各个文字组合对应的第二概率;基于各个文字组合对应的第二概率,确定多个文字各自所属的语义字段。该实施方式使用包括约束规则的神经网络模型确定文档图像中多个文字各自所属(56)对比文件孙忠严.“逻辑规则增强的中医实体表示学习与应用研究”《.中国优秀硕士学位论文全文数据库 医药卫生科技辑》.2023,第2023年卷(第10期),第E056-3页.Rinon Gal et.al..“Cardinal graphconvolution framework for documentinformation extraction”《.Proceedings ofthe ACM Symposium on Document Engineering2020》.2020,第7卷第1–11页.张雪;孙宏宇;辛东兴;李翠平;陈红.自动术语抽取研究综述.软件学报.2020,(第07期),第136-168页.

Patent Agency Ranking