一种基于改进SwinTextSpotter v2的厂站接线图文本鲁棒泛化检测识别方法

    公开(公告)号:CN119992563A

    公开(公告)日:2025-05-13

    申请号:CN202510068464.4

    申请日:2025-01-16

    Applicant: 同济大学

    Abstract: 本发明属于智能电网和计算机视觉领域,特别涉及一种基于改进SwinTextSpotter v2的厂站接线图文本鲁棒泛化检测识别方法。包括如下步骤:步骤1:将输入图像送入基于多模态学习的文本检测识别网络进行训练和预测,通过共享特征提取主干网络,得到共享特征图,进一步送入文本检测模块得到文本检测结果和文本特征图;步骤2:将文本特征图送入视觉特征提取与预测模块得到特征序列,随后将预测的特征序列与字符结构特征提取与预测模块所得到的规范表示进行匹配,得到识别结果;等等。本发明鲁棒地提升了模型对于不规则文本和汉字文本的检测识别精度,提升了对多种类接线图文本检测与识别的泛化性能。

    一种基于深度对抗学习的大规模图生成方法

    公开(公告)号:CN115879507A

    公开(公告)日:2023-03-31

    申请号:CN202211167773.X

    申请日:2022-09-23

    Applicant: 同济大学

    Abstract: 本发明公开了一种基于深度对抗学习的大规模图生成方法,包括,对于图G,给定其邻接矩阵A与特征矩阵X,对其进行采样后,输入图注意力编码器以获得图的结构信息,应用社区检测算法得到社区标签的真实值;将所述图注意力编码器输出的社区信息和图表示馈送至社区解码器,生成各节点对应的社区标签;利用反向传播调整所述图注意力编码器与社区解码器的参数,将其引导至社区保持的潜在空间;将所述图注意力编码器输出的社区信息和图表示馈送至图解码器,生成边概率;利用所述边概率模拟图分数矩阵,最终采样得到模型生成的新图;本发明提出的模型可以在图模拟的质量和效率(可扩展性)之间实现良好的平衡。

Patent Agency Ranking