一种基于网格点的医疗文档图像矫正识别方法及系统

    公开(公告)号:CN118918589A

    公开(公告)日:2024-11-08

    申请号:CN202411399134.5

    申请日:2024-10-09

    Abstract: 本发明涉及一种基于网格点的医疗文档图像矫正识别方法及系统,该方法包括以下步骤:步骤A:获取医疗文档的待矫正图像及其对应的真实图像,构建测试数据集;步骤B:构建基于网格点的医疗文档图像矫正模型并通过训练数据集对其进行训练,得到训练好的医疗文档图像矫正模型;步骤C:利用测试数据集对训练好的医疗文档图像矫正模型进行测试,评估合格的即为最终得到的医疗文档图像矫正模型;步骤D:将最终得到的医疗文档图像矫正模型应用于医疗文档图像矫正,获取矫正后的医疗文档图像;然后对矫正后的医疗文档图像进行文字识别,得到识别后的医疗文本。该方法及系统有利于快速、准确地校正医疗文档图像并对其进行文字识别。

    一种应用于歪曲试卷的文档矫正系统

    公开(公告)号:CN118898846A

    公开(公告)日:2024-11-05

    申请号:CN202411396493.5

    申请日:2024-10-09

    Abstract: 本发明提出一种应用于歪曲试卷的文档矫正系统,包括试卷图像的分割模块和基于多头注意力机制的试卷图像矫正模块;所述试卷图像的分割模块基于UNet构建的分割模型以实现对于试卷文档的左缘信息和右缘信息分割,通过卷积层、残差连接以及转置卷积层提取和融合图像特征,以获得图像分割图,随后进行后处理以获得实际的掩码图;再将分割后的信息输入到基于多头注意力机制的试卷图像矫正模块中以对分割后的图形进行矫正;所述基于多头注意力机制的试卷图像矫正模块采用Transformer结构,包括Encoder‑Decoder结构,采用多头注意力结构网络生成图像的光流图,通过一系列的Encoder编码器块进行逐步降采样和Decoder解码器块进行逐步上采样,得到矫正后的试卷文档图像。

    基于视觉语言模型的人脸属性识别方法及系统

    公开(公告)号:CN116778556A

    公开(公告)日:2023-09-19

    申请号:CN202310751198.6

    申请日:2023-06-25

    Abstract: 本发明涉及一种基于视觉语言模型的人脸属性识别方法及系统,该方法包括:1)给定需要预测的所有人脸属性标签,并获取多张人脸图片及其人脸属性标签,形成人脸属性识别数据集;2)构建基于视觉语言模型的人脸属性识别网络模型,其主要包括视觉编码器、语言编码器和多个视觉语言交互编码器,每个视觉语言交互编码器包括视觉语言交叉注意力模块和自注意力模块,视觉语言交叉注意力模块包含视觉对语言的调节注意力机制和语言对视觉的指导注意力机制;通过人脸属性识别数据集及40个人脸属性标签组合对网络模型进行训练;3)将训练好的人脸属性识别网络模型用于人脸属性识别。该方法及系统有利于获得更加稳定、鲁棒、准确的人脸属性识别结果。

    基于特征重构的跨模态行人重识别方法及系统

    公开(公告)号:CN116434143A

    公开(公告)日:2023-07-14

    申请号:CN202310406803.6

    申请日:2023-04-17

    Abstract: 本发明涉及一种基于特征重构的跨模态行人重识别方法,包括以下步骤:1)从数据集中成对抽取多个行人的可见光图片和红外图片,形成可见光训练数据集和红外训练数据集;2)构建基于特征重构的跨模态行人重识别网络模型,所述跨模态行人重识别网络模型主要包括特定特征提取模块、多尺度特征提取模块、Token感知的多尺度特征融合模块和跨模态特征重构模块;通过可见光训练数据集和红外训练数据集对跨模态行人重识别网络模型进行训练,得到可泛化的模型参数;3)将训练好的跨模态行人重识别网络模型用于跨模态检索,实现跨模态行人重识别。该方法及系统有利于获得更加稳定、鲁棒、准确的跨模态行人重识别结果。

    基于高效模板更新与选择机制的双向目标跟踪方法及系统

    公开(公告)号:CN113486820B

    公开(公告)日:2023-06-06

    申请号:CN202110780748.8

    申请日:2021-07-09

    Abstract: 本发明涉及一种基于高效模板更新与选择机制的双向目标跟踪方法,包括以下步骤:构建基于在线学习的目标跟踪器T0;构建在线可靠性评估模块ORE;构建动态模板更新模块DTU;构建自适应模板选择模块ATS;构建基于离线学习的孪生跟踪器T1;根据ORE、DTU和ATS,首先选择将当前视频帧图像输入T0或者T1,第一帧默认选择T0,然后执行相应切换模式下的跟踪策略和模板策略,得到当前帧的最终预测结果。该方法及系统有效结合了基于在线学习跟踪器和基于离线学习跟踪器的优势,可以在具有挑战性的场景中获得更加稳定、鲁棒、准确的跟踪结果。

    基于交互与聚合式特征优化的孪生跟踪方法及系统

    公开(公告)号:CN114926652A

    公开(公告)日:2022-08-19

    申请号:CN202210600748.X

    申请日:2022-05-30

    Abstract: 本发明涉及一种基于交互与聚合式特征优化的孪生跟踪方法及系统,该方法包括以下步骤:初始化模板图像和搜索区域图像;构建特征提取网络,获得模板多层特征和搜索区域多层特征;构建门控双视角聚合模块优化多层模板特征;构建语义引导的注意力模块实现搜索区域的粗粒度特征优化;构建相关性图聚合模块实现搜索区域的细粒度特征优化;构建头部预测网络,预测出当前帧目标的位置。该方法及系统通过模板特征和搜索区域特征的自注意力聚合及交互来增强目标显著特征,抑制背景噪声,从而在具有挑战性的场景中获得更加稳定、鲁棒、准确的跟踪结果。

    基于高效模板更新与选择机制的双向目标跟踪方法及系统

    公开(公告)号:CN113486820A

    公开(公告)日:2021-10-08

    申请号:CN202110780748.8

    申请日:2021-07-09

    Abstract: 本发明涉及一种基于高效模板更新与选择机制的双向目标跟踪方法,包括以下步骤:构建基于在线学习的目标跟踪器T0;构建在线可靠性评估模块ORE;构建动态模板更新模块DTU;构建自适应模板选择模块ATS;构建基于离线学习的孪生跟踪器T1;根据ORE、DTU和ATS,首先选择将当前视频帧图像输入T0或者T1,第一帧默认选择T0,然后执行相应切换模式下的跟踪策略和模板策略,得到当前帧的最终预测结果。该方法及系统有效结合了基于在线学习跟踪器和基于离线学习跟踪器的优势,可以在具有挑战性的场景中获得更加稳定、鲁棒、准确的跟踪结果。

    在线多示例学习目标跟踪方法、终端设备及存储介质

    公开(公告)号:CN109767457A

    公开(公告)日:2019-05-17

    申请号:CN201910022615.7

    申请日:2019-01-10

    Abstract: 本发明公开了一种在线多示例学习目标跟踪方法,包括如下过程:S1:初始正包和负包中示例的选取;S2:计算初始正包中每个示例的相关相似度;S3:对初始正包进行筛选;S4:更新弱分类器;S5:为筛选后的正包和负包中的示例赋予相应的权重值;S6:对包概率进行加权;S7:获得最优弱分类器;S8:集成强分类器并输出。通过利用本发明设计出的目标跟踪方法能够提升分类器的性能,提高目标跟踪的鲁棒性。

    一种最优类外原点输出折中滤波器的设计方法

    公开(公告)号:CN109359688A

    公开(公告)日:2019-02-19

    申请号:CN201811221448.0

    申请日:2018-10-19

    Abstract: 本发明公开了一种最优类外原点输出折中滤波器的设计方法,涉及生物特征识别技术领域。该方法包括:将所有训练样本图像进行分类,对于每个类别,通过下述步骤S1至S3训练得到相应的最优类外原点输出折中滤波器:S1,设计最小平均类外原点输出能量滤波器;S2,设计最小类外原点方差合成鉴别滤波器;S3,设计最优类外原点输出折中滤波器:通过调节所述最小平均类外原点输出能量滤波器和所述最小类外原点方差合成鉴别滤波器的权重,最小化类外样本图像在原点的平均能量输出和噪声方差输出的加权和,同时使类内样本图像在原点的输出满足不等式约束条件。通过采用本发明设计出的滤波器在人脸识别过程中所提取的特征更加有效,推广性能更好。

Patent Agency Ranking