基于注意力机制的自适应分组卷积神经网络结构设计方法

    公开(公告)号:CN112801289A

    公开(公告)日:2021-05-14

    申请号:CN202110163368.X

    申请日:2021-02-05

    Abstract: 本发明公开了基于注意力机制的自适应分组卷积神经网络结构设计方法,涉及人工智能运算领域,针对现有分组卷积技术中特征图通道在层间不能有效流通的问题提出本方案。在设计选择网络时,基于注意力机制设计用于自适应重排输出的特征图通道;所述选择网络包括通道选择矩阵,所述通道选择矩阵用于记录特征图在层间传递的流通信息。优点在于,通过基于注意力的选择网络,为每组从上一层传入的特征图自适应地生成相应的通道选择矩阵,使得这些特征图能够被动态分配到合适的下一层通道中,实现分组卷积中不同组间的信息交换。可以兼顾特征图的动态分配与内存开销的节约,实现轻量化结构的特征图通道动态分配,提高卷积神经网络性能。

    一种多语言多模态多分支文档视觉信息抽取方法

    公开(公告)号:CN117542063B

    公开(公告)日:2024-04-09

    申请号:CN202410033225.0

    申请日:2024-01-10

    Abstract: 本发明公开了一种多语言多模态多分支文档视觉信息抽取方法,本发明属于模式识别与人工智能领域,包括:获取若干种语言的文档图像,对所述文档图像进行检测识别,得到文本检测识别结果;对所述文本检测识别结果进行排序,得到已排序检测识别结果;对所述已排序检测识别结果和所述文档图像进行特征提取,得到多模态特征,将所述多模态特征输入多任务预训练模块内不同的预训练任务中进行预训练;基于预训练好的多模态特征,分别进行实体类别预测、实体链接预测,以实现文档视觉信息的抽取。本发明设计的方法在文档视觉信息抽取任务上表现出优异的性能,显著超越同类具有竞争力的其他现有方法。

    一种多语言多模态多分支文档视觉信息抽取方法

    公开(公告)号:CN117542063A

    公开(公告)日:2024-02-09

    申请号:CN202410033225.0

    申请日:2024-01-10

    Abstract: 本发明公开了一种多语言多模态多分支文档视觉信息抽取方法,本发明属于模式识别与人工智能领域,包括:获取若干种语言的文档图像,对所述文档图像进行检测识别,得到文本检测识别结果;对所述文本检测识别结果进行排序,得到已排序检测识别结果;对所述已排序检测识别结果和所述文档图像进行特征提取,得到多模态特征,将所述多模态特征输入多任务预训练模块内不同的预训练任务中进行预训练;基于预训练好的多模态特征,分别进行实体类别预测、实体链接预测,以实现文档视觉信息的抽取。本发明设计的方法在文档视觉信息抽取任务上表现出优异的性能,显著超越同类具有竞争力的其他现有方法。

Patent Agency Ranking