-
公开(公告)号:CN117009496A
公开(公告)日:2023-11-07
申请号:CN202310579818.2
申请日:2023-05-22
Applicant: 苏州空天信息研究院
IPC: G06F16/335 , G06F16/31 , G06F16/33 , G06F40/279 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于链接矩阵的多模态事件联合抽取方法,确定应用领域的事件结构体系,构建跨模态事件抽取数据集;构建图像块和文本序列之间的链接矩阵;基于ViLT构建多模态事件抽取模型,其中多模态Transformer编码器以图像块像素特征、词例特征和图像分块‑文本词例对特征为输入,得到多模态特征输入解码器,获取图文事件类型一致性特征、事件类型特征和图文事件要素特征;利用极大似然估计,取最大概率的图文事件类型匹配结果、事件类型、图文事件要素作为索引,利用索引映射得到文本事件信息。本发明解决了弱监督和无监督方法识别精度低,管道式多模态事件要素信息匹配不准确的问题,为多模态信息抽取领域提供了一种新的事件抽取策略。
-
公开(公告)号:CN120030110A
公开(公告)日:2025-05-23
申请号:CN202410802980.0
申请日:2024-06-20
Applicant: 苏州空天信息研究院
IPC: G06F16/3329 , G06F16/334 , G06F16/953 , G06F40/194 , G06F40/258
Abstract: 本发明公开了一种基于专家思维链大模型智能体的高价值信息挖掘方法,输入任务的名称和概述,通过大语言模型抽取其中的实体和事件信息关键词,并将关键词与专家思维链模板进行文本向量化处理,通过计算关键词与专家思维链模板向量之间的余弦距离相似度,匹配得到相似度最高的专家思维链模板;调用搜索引擎搜索从任务名称和概述中抽取得到的实体和事件信息关键词,针对每个信息关键词分别利用大模型和搜索引擎联想关键词并搜索相关内容,得到并记录搜索得到的网页的标题、发布机构、发布时间、内容、网址,对记录的标题、发布结构、内容进行抽取,得到实体、关系、事件三元组,组织成公共安全领域知识体系进行存储;依据专家思维链模板,对构建的公共安全领域知识体系进行智能化分析,得到可视化的统计图表和结构化分析结论;依据可视化的统计图表和结构化分析结论,撰写生成分析报告,得到最终的信息挖掘分析报告。本发明可以快速识别、分类和解析大量复杂的数据集,从而加速信息提取和知识发现的过程。
-
公开(公告)号:CN116384401A
公开(公告)日:2023-07-04
申请号:CN202310399388.6
申请日:2023-04-14
Applicant: 苏州空天信息研究院
IPC: G06F40/295 , G06F18/214 , G06N3/08
Abstract: 本发明公开了一种基于提示学习的命名实体识别方法,利用文本表示模型consert计算文本序列和候选样本示例模板的相似度,选择最相似的候选样本示例模板以上下文的形式拼接到文本序列中,使用Transformer‑1编码器编码,通过一层线性映射层映射为实体边界判别向量,并通过条件随机场得到候选实体边界预测值,获得候选实体片段;利用候选实体边界预测值,在文本序列中插入候选实体片段分隔符,构造实体边界感知模板输入,使用Transformer‑2编码器进行编码,平均候选实体片段中的字符向量,得到候选实体片段向量;接着通过一层线性映射层映射为候选实体类别判别向量,并使用softmax函数得到候选实体类别预测值,得到识别出的命名实体。本发明提升了命名实体识别准确率。
-
-