一种移动端智能图谱构建与自适应可视化方法及其系统

    公开(公告)号:CN119807475A

    公开(公告)日:2025-04-11

    申请号:CN202411830787.4

    申请日:2024-12-12

    Abstract: 本发明提供了一种移动端智能图谱构建与自适应可视化方法及其系统,该方法包括,利用爬虫等技术收集多种来源数据,例如文本、图像、音频、视频等数据;将获取的不同种类异构数据处理和整合,形成结构化数据和半结构化数据;训练知识抽取模型,读取结构化和半结构化数据进行实体识别和关系抽取;编写自动图谱构建程序,将构建结果存储在数据库中;获取设备相关参数编写自适应可视化程序,展示实体的关联信息。本发明通过集成化的方法设计和智能化的技术手段,实现了在移动端的高效图谱构建和自适应的可视化展示。该方法不仅提高了知识图谱的构建效率和质量,还为用户提供了更加便捷、直观的信息获取方式,提高用户对复杂信息的理解和分析效率。

    一种融合新闻发生时间与语义相似度的事件脉络链路生成方法

    公开(公告)号:CN116955537A

    公开(公告)日:2023-10-27

    申请号:CN202310978360.8

    申请日:2023-08-04

    Abstract: 本发明公开一种融合新闻发生时间与语义相似度的事件脉络链路生成方法,对新闻文本内容进行嵌入式表征,对新闻发生时间进行数字化表示,完成新闻集合预处理;对预处理后的新闻集合按照发生时间进行窗口划分,形成若干新闻子集合;结合新闻的发生时间和文本内容信息,对每一个窗口内的新闻子集合使用聚类算法计算事件簇结果并进行评估;在各个窗口下计算得到的事件簇结果中,选择属于同一类的簇进行融合,并在融合后的簇结果中选择事件簇代表节点形成新一轮的新闻集合;针对新形成的新闻集合,重复上述过程,直至得到最终的事件脉络结果。本发明提高了新闻事件脉络结果生成的准确性、可解释性以及高效性。

    一种融合正排与倒排索引的电子文档管理方法

    公开(公告)号:CN116186133A

    公开(公告)日:2023-05-30

    申请号:CN202211729747.1

    申请日:2022-12-30

    Abstract: 本发明提出了一种融合正排与倒排索引的电子文档管理方法,选取搜索引擎为正排索引的数据库,以及搜索引擎为倒排索引的数据库,并封装统一的数据库API对两种数据库进行融合引接;电子文档存储时,向正排索引数据库中存储电子文档的结构化数据,向倒排索引数据库中存储电子文档的文本数据,将正排索引数据库中的数据与倒排索引数据库中的数据通过电子文档的ID相互关联;当查找文档时,根据不同的需求,通过文档的结构信息在正排索引数据库中进行查找,或者通过关键词在倒排索引数据库中实现文档全文高效检索。本发明既满足了电子文档管理的结构化管理及存储功能,又实现了海量文本内容的高效检索功能。

    一种文本-视频跨模态事件要素抽取方法

    公开(公告)号:CN119649264A

    公开(公告)日:2025-03-18

    申请号:CN202411576519.4

    申请日:2024-11-06

    Abstract: 本发明公开了一种文本‑视频跨模态事件要素抽取方法,搜集视频数据及其视频简介文本数据,分别标注文本及视频数据的事件类型及对应的事件论元角色,其中事件论元角色表示在事件中扮演不同角色的实体,文本数据与视频数据预标注事件类型及事件类型对应的事件论元角色一致;进行多模态事件指代消解,实现任意“文本‑视频”数据间的共指事件配对,即将指代同一事件的文本和视频进行匹配,构成一组文本‑视频共指事件对;对匹配的“文本‑视频”数据转换为对应的特征向量,其中对文本数据执行文本标记化和文本嵌入,转化为词向量形式;对视频数据直接使用ResNet算法获取全局级别事件要素特征,构建视频全局特征向量;对视频数据通过Fast‑R‑CNN识别局部对象,使用ResNet算法获取局部级别时间要素,构建视频局部特征向量;对文本词向量和视频全局特征向量与局部特征向量,通过全连接层统一三者的向量维度,构建文本‑视频共享向量空间;将文本词向量和视频全局特征向量与局部特征向量输入到Transformer编码器,再采用ONEIE算法进行文本模态的事件要素信息抽取,采用T5‑base算法进行视频模态的事件要素信息抽取。本发明能够更加精确的捕捉多模态内部之间的关联性,提高了抽取精度。

    一种基于拓扑结构的图像图谱化实现方法

    公开(公告)号:CN114398892B

    公开(公告)日:2024-09-24

    申请号:CN202111447552.3

    申请日:2021-11-30

    Abstract: 本发明公开了一种基于拓扑结构的图像图谱化实现方法,收集网络设备图标的相关图像,生成训练数据和验证数据;利用Unet语义分割网络进行语义分割模型训练,利用训练后的模型对输入图像的语义信息进行提取;利用膨胀和腐蚀算法对包含语义信息的图像进行处理,利用腐蚀算法去除图像中的噪声点,利用膨胀算法对图像中的连接线进行加粗;利用连通区域标定方法进行实例划分,得到不同的实例对象,获取每个实例对象的类别、大小、位置信息;利用自然语言处理方法对实例对象进行结果补充,并纠正语义分割模型识别可能出现的错误实例;进行图谱绘制,最后以JSON格式输出结果。本发明能够自动的从包含网络拓扑结构的图像中提取出结构化的图谱信息。

    一种基于聚类算法的小样本事件要素智能抽取方法

    公开(公告)号:CN118193738A

    公开(公告)日:2024-06-14

    申请号:CN202410359544.0

    申请日:2024-03-27

    Abstract: 本发明公开了一种基于聚类算法的小样本事件要素智能抽取方法,采用Word2Vec模型对文本数据进行向量化处理,所述文本数据包含已标注的文本数据和未标注的文本数据;利用K‑means算法对向量化后的样本进行聚类,依据文本向量之间的相似度将样本划分为K个类簇,以每个簇的中心作为该簇的代表;利用信息熵计算每个类簇中的每个样本在该类簇中的相似度权重,选取信息熵相似度权重最高的多个样本作为该类簇的代表性样本,每个类簇的代表性样本构成一个初始训练样本集;构建训练各初始训练样本集对应的子分类器UIE‑F,在每轮迭代中,根据分类器的预测结果和选定样本进行标注,以增量学习的方式不断优化分类器。本发明提高了事件抽取方法在小样本条件下的性能,也提高了事件要素抽取的泛用性和准确性。

Patent Agency Ranking