-
公开(公告)号:CN112712085A
公开(公告)日:2021-04-27
申请号:CN202011584156.0
申请日:2020-12-28
Applicant: 哈尔滨工业大学
IPC: G06K9/34 , G06F40/295 , G06N3/08
Abstract: 本发明公开了一种提取多语言PDF文档中日期的方法,具体实施步骤包括:基于反二进制化格式解码技术获取PDF文档的结构化信息;利用PDF特征分析技术将此部分信息中的文本编码分析并解析成可辨认文本串。然后,训练基于深度学习的命名实体识别模型,利用命名实体识别模型和正则表达式匹配技术获取多语言环境下日期信息序列。最后,获取待处理PDF文档进行处理与标注获得的PDF文档中时间信息与时间序列的对应关系的特征数据库,获取所需日期信息。该技术与现有技术相比能处理无固定格式文档或格式复杂多变文档、较低图片式文档,和含有多种语言的PDF文档。
-
公开(公告)号:CN116994258A
公开(公告)日:2023-11-03
申请号:CN202310971667.5
申请日:2023-08-03
Applicant: 哈尔滨工业大学
IPC: G06V30/148 , G06V30/19 , G06F17/16
Abstract: 一种基于扩散模型的无训练指代图像分割方法,属于计算机视觉中的指代图像分割领域。本发明针对现有数据匮乏情况下,难以实现指代图像分割的问题。包括:获取要进行指代图像分割的原始图像和文本,对原始图像增加高斯噪声后,经生成器得到交叉注意力函数的全部计算结果矩阵;在交叉注意力函数的全部计算结果矩阵中确定与核心词语位置对应的所有目标矩阵;再利用双线性插值算法对目标矩阵进行扩张,再均值化得到指代关系矩阵;再采用SAM模型对原始图像进行分割,得到多个候选分割结果矩阵;计算每个候选分割结果矩阵与指代关系矩阵的相似度,选择相似度最高的候选分割结果矩阵作为指代图像分割结果。本发明实现了无训练指代图像分割。
-