一种语义增强的零样本甲骨文字符识别方法

    公开(公告)号:CN118314583A

    公开(公告)日:2024-07-09

    申请号:CN202410337361.9

    申请日:2024-03-23

    Abstract: 本发明公开了一种语义增强的零样本甲骨文字符识别方法,包括:根据域和字符类别为甲骨文图像构造可学习的提示信息;引入对比式语言‑图像预训练模型,并通过平衡采样策略采样数据,对可学习的提示信息进行优化,以实现从甲骨文拓片和字模图像中挖掘出语义信息;去除域提示信息来得到域无关的提示信息,进而通过语义编码器编码得到域无关的字符语义;通过类内共享特征学习分支和类间差异特征学习分支对视觉编码器进行监督训练;采用训练好的视觉编码器,实现零样本甲骨文字符识别。

    一种基于深度学习的机车工单信息智能识别方法及系统

    公开(公告)号:CN117576699A

    公开(公告)日:2024-02-20

    申请号:CN202311462227.3

    申请日:2023-11-06

    Abstract: 本发明公开了一种基于深度学习的机车工单信息智能识别方法及系统,包括以下步骤:步骤1,获得机车工单图像数据;步骤2,对机车工单图像数据进行图像预处理得到预处理后的图像数据;步骤3,利用预处理后的图像数据进行文本检测和文本识别;步骤4,利用机车工单图像数据以及文本检测和文本识别的结果进行表格无模板重建,获得机车工单图像的文本信息及文本之间的联系;提升了对机车工单信息智能识别的识别精度,实现了机车工单复杂表格的无模板重建;特别在机车工单多类别的识别场景,都能满足机车维修等后勤工作对机车工单识别的高精度性能需求,能够高效识别出各种机车工单的文本信息和通过表格构建的文本之间的联系。

    一种基于深度学习的表格摘要生成方法

    公开(公告)号:CN117216245B

    公开(公告)日:2024-01-26

    申请号:CN202311482529.7

    申请日:2023-11-09

    Abstract: 本发明公开了一种基于深度学习的表格摘要生成方法,包括以下步骤:步骤1,将表格的参考摘要进行切分,通过匹配算法得到表格对应的内容行;步骤2,将表格对应的内容行进行两两配对,得到独立内容行与合并内容行;步骤3,获取所述独立内容行与所述合并内容行分别对应的文本摘要;步骤4,将所述分别对应的文本摘要融合在一起,形成整个表格的文本摘要作为最终模型的输出;通过对表格进行跨行合并和将内容行逐行生成摘要的方式,解决了表格存在跨行较多以及单元格数目较多时效果不佳的问题,从而提高了表格生成摘要的鲁棒性和准确性。

    一种交互式导盲系统
    14.
    实用新型

    公开(公告)号:CN211512572U

    公开(公告)日:2020-09-18

    申请号:CN201921601724.6

    申请日:2019-09-25

    Abstract: 本实用新型属于导盲系统技术领域,涉及一种交互式导盲系统。交互式导盲系统包括中央处理器及与其相连的深度相机、高端语音合成装置、麦克风和电源,其中:中央处理器:用于系统控制、目标检测、路径规划、语音识别和信号传递;深度相机:用于对当前场景进行图像采集,生成RGB图像与深度图;高端语音合成装置:用于对所述中央处理器输出的语音信息进行合成,播放寻物结果或道路规划情况;麦克风:用于采集用户语音信息,并传送给中央处理器;电源:用于给所述中央处理器供电。本实用新型能辅助盲人更好地生活,提高盲人的生活质量。(ESM)同样的发明创造已同日申请发明专利

Patent Agency Ranking