-
公开(公告)号:CN119599009A
公开(公告)日:2025-03-11
申请号:CN202411704051.2
申请日:2024-11-26
Applicant: 欧冶工业品股份有限公司 , 同济大学 , 华东师范大学
IPC: G06F40/279 , G06F16/353 , G06F40/186 , G06N20/00 , G06Q50/18
Abstract: 本发明提供了一种基于大语言模型的复杂工业合同信息抽取方法及系统,包括:步骤S1:对获取的不同的工业合同文本进行聚类分析,确定每个合同文本所在的簇;步骤S2:从每个簇中分别进行分层抽样,获取代表性样本;步骤S3:对每个簇相对应的代表性样本进行满足预设要求的关键内容抽取;基于抽取的满足预设要求的关键内容获取对应的结构化文本;步骤S4:对结构化文本进行标注,得到标注数据;步骤S5:获取所有簇的标注数据生成标注数据集,利用标注数据集对大语言模型进行微调,得到微调后的大语言模型;步骤S6:将微调后的大语言模型部署到生产环境中,抽取未标注的合同文本的满足预设要求的关键信息。
-
公开(公告)号:CN117112931A
公开(公告)日:2023-11-24
申请号:CN202311183016.6
申请日:2023-09-13
Applicant: 同济大学
IPC: G06F16/9537 , G06F16/9536 , G06Q50/00 , G06F18/24 , G06F18/25 , G06N3/0442 , G06N3/084 , G06Q50/30
Abstract: 本发明公开了一种基于多模态信息融合的城市轨道交通客流预测方法,首先获取城市兴趣点的特征向量,然后构基于轨道交通站点有向图,以及轨道交通站点与兴趣点的位置关系,提取得到轨道交通站点的特征向量,爬取各个时间段的社交媒体文本,从中提取出公众出行兴趣特征向量,然后基于多头交叉注意力模型融合公众出行兴趣特征向量、轨道交通站点特征向量和历史客流特征向量,再采用LTSM网络预测得到下一时间段的客流特征向量。本发明融合城市兴趣点特征、社交媒体的文本特征对城市轨道交通客流进行预测,提高预测准确度。
-
公开(公告)号:CN119314146A
公开(公告)日:2025-01-14
申请号:CN202411405121.4
申请日:2024-10-10
Applicant: 同济大学
Abstract: 本发明属于智慧城轨及计算机视觉技术领域,具体提出了一种基于图像识别的复杂道岔区域内轨行区提取识别方法,通过实例分割模型对输入图像处理以得到n维矩阵掩码Mask;通过轨行区处理模块对矩阵掩码进行处理以获得矩阵掩码Mask_Re;对Mask_Re的轨行区数量进行分析,并通过获取道岔区图像模块截取道岔区图像;通过目标定位模型获得道岔的定反位状态,即列车的行径方向,从而获得列车运行的唯一轨行区;并进行可视化处理,输出RGB图像结果。本发明通过实例分割模型对复杂道岔区域场景图像进行处理,并通过目标定位模型进行定位和识别岔尖状态,能够准确识别并提取出不同场景和拍摄角度获得的复杂道岔区域图像中的列车当前行驶的轨行区。
-
公开(公告)号:CN119557646A
公开(公告)日:2025-03-04
申请号:CN202411704053.1
申请日:2024-11-26
Applicant: 欧冶工业品股份有限公司 , 同济大学 , 华东师范大学
IPC: G06F18/214 , G06F18/241 , G06F16/353 , G06F40/186 , G06N20/00 , G06Q50/18
Abstract: 本发明提供了一种基于大语言模型的标注数据生成方法及系统,包括:步骤S1:获取相同类别代表性合同的结构化文本,并基于获取的代表性合同的结构化文本生成对应的信息抽取模板;步骤S2:基于信息抽取模板和相同类别内所有的合同文本,批量生成标注数据;步骤S3:汇总不同类别的标注数据及相应的合同文本,并生成标注数据集,利用标注数据集对大语言模型进行微调,得到微调后的大语言模型;步骤S4:基于微调后的大语言模型对合同文本进行标注。
-
-
-