基于高斯约束注意力机制网络的场景文字识别方法及系统

    公开(公告)号:CN112070114B

    公开(公告)日:2023-05-16

    申请号:CN202010767079.6

    申请日:2020-08-03

    Abstract: 本发明提出一种基于高斯约束注意力机制网络的场景文字识别方法及系统,涉及图像信息识别领域,通过提取待识别图片的视觉特征,得到二维特征图;将二维特征图转化为一维特征序列,根据该一维特征序列提取全局语义信息;将全局语义信息输入至第一个时间步中初始化解码隐状态,并在每个时间步中根据隐状态和二维特征图计算原始的注意力权重,利用该权重加权求和得到原始加权特征向量;根据隐状态和原始加权特征向量构造二维高斯分布掩膜,将该掩膜与原始的注意力权重相乘,得到矫正的注意力权重,根据该权重得到矫正后加权特征向量;将原始加权特征向量和矫正后加权特征向量融合一起来预测待识别图片的字符,从而能够解决注意力弥散的情况。

    一种基于实时查询的数据交互方法及装置

    公开(公告)号:CN112650915B

    公开(公告)日:2023-03-10

    申请号:CN202011375913.3

    申请日:2020-11-30

    Abstract: 本发明提供一种基于实时查询的数据交互方法及装置,包括:解析接收的客户端数据查询请求,判断所述客户端数据查询请求为长查询或短查询;若为长查询,则依据生成的查询记录对数据库进行查询,并将长查询结果存储至分布式文件系统中;若为短查询,则通过转换得到的系统sql语句对数据库进行查询,得到短查询结果;将获取的长查询结果或短查询结果返回至客户端。本发明支持短查询和长查询两种不同的请求方式,可以根据业务的紧急程度做不同速度的处理;短查询可以跳过中间系统直接访问数据源并返回结果数据,以达到更快的速度;长查询的结果以较小单位依次返回给请求方达到更高的时效性。

    基于宏观到微观语义关联对比的视频自监督表征学习方法

    公开(公告)号:CN115713665A

    公开(公告)日:2023-02-24

    申请号:CN202211237958.3

    申请日:2022-10-10

    Inventor: 周宇 方波 王伟平

    Abstract: 本发明公开了一种基于宏观到微观语义关联对比的视频自监督表征学习方法。本发明首先创建一视频自监督时空表示模型,其包括时域模块MaMiCo与空域模块MaMiCo;所述时域模块MaMiCo包括第一编码器、平均全局映射头,所述空域模块MaMiCo包括第二编码器、密集映射头,所述第一编码器与第二编码器共享参数;然后在视频数据中以金字塔的形式采样全局片段、局部片段以及静止片段用于训练视频自监督时空表示模型,其中时域MaMiCo关注在学习全局片段与局部片段的时域语义关联,空域MaMiCo旨在学习局部片段与静止片段的空域语义关联;然后将待处理视频输入训练后的第一编码器或第二编码器,得到该待处理视频的特征图。

    一种基于哈希编码和图注意力机制的零样本图像检索方法及装置

    公开(公告)号:CN112199532B

    公开(公告)日:2022-10-14

    申请号:CN202010906456.X

    申请日:2020-09-01

    Abstract: 本发明涉及一种基于哈希编码和图注意力机制的零样本图像检索方法及装置。该方法包括:构建哈希网络和关系网络;基于软边距的分类损失对哈希网络和关系网络进行训练;将数据库中的每一张图像输入到训练完成的哈希网络中,得到对应的图像哈希码;将待查询图像输入到训练完成的哈希网络中生成哈希码,计算其与数据库中每一张图像的哈希码之间的距离,并根据距离返回满足要求的查询结果。本发明能够同时考虑语义和视觉信息,充分挖掘类别之间的相似关系,从而更好地实现知识迁移,同时基于软边距的分类损失进行哈希学习能够在一定程度上避免对可见类别过拟合学习,提升模型对未见类别的泛化能力,进而提高零样本图像检索的效果。

    一种基于多层感知的问题答案抽取方法及电子装置

    公开(公告)号:CN112380326B

    公开(公告)日:2022-07-08

    申请号:CN202011079727.5

    申请日:2020-10-10

    Abstract: 本发明提供一种基于多层感知的问题答案抽取方法,其步骤包括:将一问题与若干目标文档拼接,输入到预训练语言模型中,得到问题的表示Q与目标文档的上下文表示P,将表示Q与上下文表示P交互,得到文档相关的问题表示u与融合问题信息的文档表示h;对问题表示u进行多层感知分类,获取问题的推理类型,并根据推理类型、问题表示u、文档表示h及通过表示Q生成的子问题ct,得到所述问题在目标文档中的答案注意力分布,其中t为生成子问题的次数;依据答案注意力分布,获取该问题的答案预测结果。本发明以子问题拆分的形式递进回答问题,引入推理类别分类器控制拆分,对问题的回答进行共享,提升推理阅读理解效果。

    一种隐式语义数据增强方法

    公开(公告)号:CN114219017A

    公开(公告)日:2022-03-22

    申请号:CN202111459333.7

    申请日:2021-12-02

    Abstract: 本发明公开了一种隐式语义数据增强方法。本发明第一阶段利用原始数据训练特征提取器和分类器,然后利用分类器构建知识图谱,并基于提取的特征计算每个类别的类中心和协方差矩阵;第二阶段利用构建的知识图谱识别出尾部类别的相似类别,然后将相似类别的特征变换方向迁移到每个尾部样本上进行特征变化。通过挖掘类别之间的相关关系,极大地丰富了尾部类别多样性。最后,对每个样本沿着迁移的协方差矩阵进行变化方向的无限次高斯分布采样可以获得无穷样本,通过优化无限样本损失函数的上界,得到一个新的基于推理的隐式语义数据增强损失进行模型训练。

    单阶段3D点云目标检测方法及装置、计算机设备、介质

    公开(公告)号:CN114155524A

    公开(公告)日:2022-03-08

    申请号:CN202111271651.0

    申请日:2021-10-29

    Abstract: 本发明公开了一种单阶段3D点云目标检测方法及装置、计算机设备、介质。本方法为:根据3D点云中目标与获取3D点云的采样传感器距离不同,设置不同的聚类半径参数对3D点云进行聚类操作,用立体包围框将同类的点云包含起来得到最小立体包围框,并对每一所述最小立体包围框内的点集合进行下采样,得到数据增广后的点云数据;对数据增广后的点云数据进行基于球内最远距离采样,并对采样得到的点进行特征提取,得到语义特征和空间特征;根据空间特征和语义特征预测每个点的预测分数,然后按照预测分数从高到低完成点采样;对采样点的特征进行融合得到融合特征图;回归预测网络根据该融合特征图进行预测,得到点云当中目标的位置和类别。

    一种基于表示学习的属性图社区搜索方法和系统

    公开(公告)号:CN113626723A

    公开(公告)日:2021-11-09

    申请号:CN202110777236.6

    申请日:2021-07-09

    Abstract: 本发明涉及一种基于表示学习的属性图社区搜索方法和系统。该方法以查询节点为随机游走的起点,使用节点的属性信息和结构信息引导随机游走的跳转,获取节点序列和属性关键词序列;分别对节点序列和属性关键词序列进行节点的表示学习,获得节点的拓扑表示和属性表示,将其结合作为节点表示信息;根据节点之间的相似度对原始图数据进行重构,得到重构图;基于重构图和节点表示信息建立社区模型;以建立的社区模型为指导寻找满足要求的目标社区。本发明降低了计算的规模,表示学习过程更加契合社区搜索关注局部特性的特点,并融入了节点在社区层面的信息,提高了节点特征挖掘的准确度,建立的社区模型兼顾了发现社区的可解释性、质量和效率。

Patent Agency Ranking