-
公开(公告)号:CN116110055A
公开(公告)日:2023-05-12
申请号:CN202211610577.5
申请日:2022-12-12
Applicant: 杭州电子科技大学
IPC: G06V30/18 , G06V30/19 , G06V30/196 , G06V10/82 , G06N3/045
Abstract: 本发明公开一种基于压缩与激励神经网络的场景文本识别方法。该方法通过在输入层对包含文字的自然场景图像进行预处理得到文本块图像,然后通过压缩与激励神经网络组成的特征提取层对文本块图像进行特征提取,然后把提取到的特征图经过特征变换为多个特征序列,此时每个特征序列对应原始图像一个感受野,再把特征序列送入时序信息学习层,时序信息学习层使用双层双向门控循环神经网络提取特征图时序信息,最后使用连接时间分类网络CTC进行转录翻译得到预测文本。本发明不仅识别准确度高,并且模型的尺寸小,可移植和可应用性高,也具有很好的泛化能力。
-
公开(公告)号:CN116955650A
公开(公告)日:2023-10-27
申请号:CN202310940713.5
申请日:2023-07-28
Applicant: 杭州电子科技大学
IPC: G06F16/36 , G06F40/295 , G06F16/2453 , G06F18/214
Abstract: 本发明公开基于小样本知识图谱补全的信息检索优化方法,构造小样本知识图谱补全模型GAKDN,利用门控和角色感知的邻居聚合器有效过滤邻居噪声信息,减少噪音信息在学习实体嵌入时的影响,通过角色识别网络学习实体和邻居关系的深层关联,识别实体在不同小样本关系下的角色;通过知识蒸馏提取小样本关系对应的实体对之间的结构信息,缓解样本表征不足的问题;利用自适应匹配处理器计算正负例查询集与支持集的得分,根据最高得分找到最适合的补全实体。本发明解决了噪声邻域、实体多角色和小样本场景下样本特征学习不足的问题,从而更准确地预测待补全的尾实体,提高小样本场景下知识图谱补全的准确率,以优化知识图谱的信息检索能力。
-
公开(公告)号:CN116486393A
公开(公告)日:2023-07-25
申请号:CN202310464879.4
申请日:2023-04-27
Applicant: 杭州电子科技大学
IPC: G06V20/62 , G06V10/26 , G06V10/80 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于图像分割的场景文本检测方法,属于计算机视觉领域。本发明首先获取包含文本的自然场景图像,对其进行预处理,并通过特征提取组件对预处理后的自然场景图像进行特征提取得到特征图。其次根据特征图,通过特征金字塔增强组件让特征图中不同尺寸的特征信息充分融合,得到深层特征。然后通过特征聚焦组件对来自特征金字塔增强组件的多个不同尺寸的特征图融合,并进行特征聚焦操作。最后通过文本框预测组件对特征聚焦组件输出的特征图进行预测,找出文本所在位置。本发明增大特征图感受视野和文本特征的表达能力,有效提高场景文本检测的精度。
-
-