-
公开(公告)号:CN118093846B
公开(公告)日:2024-07-05
申请号:CN202410512955.9
申请日:2024-04-26
Applicant: 华南理工大学
Inventor: 黄森
IPC: G06F16/332 , G06F40/216 , G06F16/33 , G06F16/36 , G06F18/213 , G06F18/22 , G06N3/084 , G06Q50/18
Abstract: 本发明公开了一种基于关联建模的知识检索问答方法,所述方法包括:构建专利特征提取模型,包括节点单一特征提取模块,节点层级特征提取模块;利用专利特征提取模型可以提取出每个权利要求的层级特征;把各个权利要求输入大语言模型,得到对应的查询,并把查询输入查询特征提取模型,得到权利要求的查询特征;对权利要求的层级特征和查询特征计算损失函数;利用损失函数训练专利特征提取模型和查询特征提取模型;利用训练好的专利特征提取模型和查询特征提取模型进行专利检索问答。本发明通过显式建模专利的权利要求的依赖关系,实现权利要求的有效特征表示,通过对自然语言查询特征和权利要求的层级特征的匹配,实现专利权利要求的检索问答。
-
公开(公告)号:CN118093846A
公开(公告)日:2024-05-28
申请号:CN202410512955.9
申请日:2024-04-26
Applicant: 华南理工大学
Inventor: 黄森
IPC: G06F16/332 , G06F40/216 , G06F16/33 , G06F16/36 , G06F18/213 , G06F18/22 , G06N3/084 , G06Q50/18
Abstract: 本发明公开了一种基于关联建模的知识检索问答方法,所述方法包括:构建专利特征提取模型,包括节点单一特征提取模块,节点层级特征提取模块;利用专利特征提取模型可以提取出每个权利要求的层级特征;把各个权利要求输入大语言模型,得到对应的查询,并把查询输入查询特征提取模型,得到权利要求的查询特征;对权利要求的层级特征和查询特征计算损失函数;利用损失函数训练专利特征提取模型和查询特征提取模型;利用训练好的专利特征提取模型和查询特征提取模型进行专利检索问答。本发明通过显式建模专利的权利要求的依赖关系,实现权利要求的有效特征表示,通过对自然语言查询特征和权利要求的层级特征的匹配,实现专利权利要求的检索问答。
-
公开(公告)号:CN117576699A
公开(公告)日:2024-02-20
申请号:CN202311462227.3
申请日:2023-11-06
Applicant: 华南理工大学 , 株洲中车时代电气股份有限公司
IPC: G06V30/148 , G06N3/0464 , G06V10/24 , G06V10/82 , G06V30/19
Abstract: 本发明公开了一种基于深度学习的机车工单信息智能识别方法及系统,包括以下步骤:步骤1,获得机车工单图像数据;步骤2,对机车工单图像数据进行图像预处理得到预处理后的图像数据;步骤3,利用预处理后的图像数据进行文本检测和文本识别;步骤4,利用机车工单图像数据以及文本检测和文本识别的结果进行表格无模板重建,获得机车工单图像的文本信息及文本之间的联系;提升了对机车工单信息智能识别的识别精度,实现了机车工单复杂表格的无模板重建;特别在机车工单多类别的识别场景,都能满足机车维修等后勤工作对机车工单识别的高精度性能需求,能够高效识别出各种机车工单的文本信息和通过表格构建的文本之间的联系。
-
公开(公告)号:CN117216245B
公开(公告)日:2024-01-26
申请号:CN202311482529.7
申请日:2023-11-09
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度学习的表格摘要生成方法,包括以下步骤:步骤1,将表格的参考摘要进行切分,通过匹配算法得到表格对应的内容行;步骤2,将表格对应的内容行进行两两配对,得到独立内容行与合并内容行;步骤3,获取所述独立内容行与所述合并内容行分别对应的文本摘要;步骤4,将所述分别对应的文本摘要融合在一起,形成整个表格的文本摘要作为最终模型的输出;通过对表格进行跨行合并和将内容行逐行生成摘要的方式,解决了表格存在跨行较多以及单元格数目较多时效果不佳的问题,从而提高了表格生成摘要的鲁棒性和准确性。
-
公开(公告)号:CN117351003A
公开(公告)日:2024-01-05
申请号:CN202311579723.7
申请日:2023-11-24
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于视频动作的多模型集成多相位MRI肿瘤分类方法,包括以下步骤:步骤1,对MRI肿瘤病例数进行划分处理与对MRI三维图像进行预处理;步骤2,通过分类模型获取MRI三维图像的特征图;步骤3,对特征图进行融合并映射到输出类别中得到预测结果;步骤4,重复步骤2和步骤3,获取多个独立且对不同类别具有不同分类能力的模型的预测结果;步骤5,集成多个模型的预测结果从而得到最终的多相位MRI肿瘤分类结果;得到更具鲁棒性和更精准的预测结果,使自动诊断多相位MRI肿瘤分类结果的精准度进一步提高,有效的缓解了医疗数据集中、数据量少、数据集不平衡的问题。
-
公开(公告)号:CN117151111A
公开(公告)日:2023-12-01
申请号:CN202311027442.0
申请日:2023-08-15
Applicant: 华南理工大学
IPC: G06F40/30 , G06F16/33 , G06F18/214 , G06F18/2415
Abstract: 本发明公开了基于感知和语义关联性的文本识别模型可靠性正则方法,包括:利用语义上下文无关的识别模型和预训练语言模型分别获取感知关联序列集和语义关联序列集,构建实例特定的关联序列集;根据关联序列集,联合利用感知和语义关联序列平滑目标序列的损失,以实现更加有效的序列可靠性正则;构建调制函数,根据样本的难易程度自适应调整校准强度,以实现自适应细粒度序列可靠性正则;引入全局平滑因子,联合预测序列与标签序列的KL散度,构建全局校准损失函数,以实现总体的序列可靠性正则;利用最终损失重新训练待校准训练模型,最后得到校准的场景文本识别模型,用于输出预测文本序列及校准的置信度。
-
公开(公告)号:CN115620265A
公开(公告)日:2023-01-17
申请号:CN202211631506.3
申请日:2022-12-19
Applicant: 华南理工大学 , 株洲中车时代软件技术有限公司
IPC: G06V20/58 , G06N3/04 , G06N3/08 , G06V10/44 , G06V10/764 , G06V10/82 , G06V30/146 , G06V30/18 , G06V30/19
Abstract: 本发明公开了基于深度学习的机车标志牌信息智能识别方法,包括以下步骤:获得机车标志牌图像数据;对所述的机车标志牌图像进行预分类;根据预分类结果,采用对应的方法进行图像文本识别及分类;获得所述的机车标志牌图像的具体类别及文本信息;所述的预分类结果包括单一文本标志牌、单行文本标志牌、单列文本标志牌和多文本标志牌。本发明实施例实现了机车线路标志牌类别信息与文本信息的智能识别,通过标志牌预分类算法,对不同的预分类采用不同的处理方法,提升了对机车标志牌的识别速度与复杂标志牌的识别精度,并通过融合文本与图像的多模态特征,实现了高精度的具体分类识别和文本信息提取。
-
-
-
-
-
-