一种融合正排与倒排索引的电子文档管理方法

    公开(公告)号:CN116186133A

    公开(公告)日:2023-05-30

    申请号:CN202211729747.1

    申请日:2022-12-30

    Abstract: 本发明提出了一种融合正排与倒排索引的电子文档管理方法,选取搜索引擎为正排索引的数据库,以及搜索引擎为倒排索引的数据库,并封装统一的数据库API对两种数据库进行融合引接;电子文档存储时,向正排索引数据库中存储电子文档的结构化数据,向倒排索引数据库中存储电子文档的文本数据,将正排索引数据库中的数据与倒排索引数据库中的数据通过电子文档的ID相互关联;当查找文档时,根据不同的需求,通过文档的结构信息在正排索引数据库中进行查找,或者通过关键词在倒排索引数据库中实现文档全文高效检索。本发明既满足了电子文档管理的结构化管理及存储功能,又实现了海量文本内容的高效检索功能。

    一种天基电磁信号覆盖率评估方法

    公开(公告)号:CN120085074A

    公开(公告)日:2025-06-03

    申请号:CN202411299124.4

    申请日:2024-09-18

    Abstract: 本发明公开了一种天基电磁信号覆盖率评估方法,基于卫星与天线的轨道几何关系,建立天基电磁信号的功率密度模型;基于卫星灵敏度与天线的功率密度,获取卫星对天基电磁信号的捕获情况;基于卫星对天基电磁信号的捕获情况,计算卫星的有效覆盖范围;基于卫星的有效覆盖范围,计算卫星的有效覆盖时间;基于天线的探测概率,构建卫星对天基电磁信号的覆盖率评估模型。本发明通过分析天基电磁信号的功率密度和探测概率,计算覆盖率评估值为天基信号的覆盖率评估的实际应用提供了更为全面的理论依据。

    一种移动端智能图谱构建与自适应可视化方法及其系统

    公开(公告)号:CN119807475A

    公开(公告)日:2025-04-11

    申请号:CN202411830787.4

    申请日:2024-12-12

    Abstract: 本发明提供了一种移动端智能图谱构建与自适应可视化方法及其系统,该方法包括,利用爬虫等技术收集多种来源数据,例如文本、图像、音频、视频等数据;将获取的不同种类异构数据处理和整合,形成结构化数据和半结构化数据;训练知识抽取模型,读取结构化和半结构化数据进行实体识别和关系抽取;编写自动图谱构建程序,将构建结果存储在数据库中;获取设备相关参数编写自适应可视化程序,展示实体的关联信息。本发明通过集成化的方法设计和智能化的技术手段,实现了在移动端的高效图谱构建和自适应的可视化展示。该方法不仅提高了知识图谱的构建效率和质量,还为用户提供了更加便捷、直观的信息获取方式,提高用户对复杂信息的理解和分析效率。

    一种融合新闻发生时间与语义相似度的事件脉络链路生成方法

    公开(公告)号:CN116955537A

    公开(公告)日:2023-10-27

    申请号:CN202310978360.8

    申请日:2023-08-04

    Abstract: 本发明公开一种融合新闻发生时间与语义相似度的事件脉络链路生成方法,对新闻文本内容进行嵌入式表征,对新闻发生时间进行数字化表示,完成新闻集合预处理;对预处理后的新闻集合按照发生时间进行窗口划分,形成若干新闻子集合;结合新闻的发生时间和文本内容信息,对每一个窗口内的新闻子集合使用聚类算法计算事件簇结果并进行评估;在各个窗口下计算得到的事件簇结果中,选择属于同一类的簇进行融合,并在融合后的簇结果中选择事件簇代表节点形成新一轮的新闻集合;针对新形成的新闻集合,重复上述过程,直至得到最终的事件脉络结果。本发明提高了新闻事件脉络结果生成的准确性、可解释性以及高效性。

    一种文本-视频跨模态事件要素抽取方法

    公开(公告)号:CN119649264A

    公开(公告)日:2025-03-18

    申请号:CN202411576519.4

    申请日:2024-11-06

    Abstract: 本发明公开了一种文本‑视频跨模态事件要素抽取方法,搜集视频数据及其视频简介文本数据,分别标注文本及视频数据的事件类型及对应的事件论元角色,其中事件论元角色表示在事件中扮演不同角色的实体,文本数据与视频数据预标注事件类型及事件类型对应的事件论元角色一致;进行多模态事件指代消解,实现任意“文本‑视频”数据间的共指事件配对,即将指代同一事件的文本和视频进行匹配,构成一组文本‑视频共指事件对;对匹配的“文本‑视频”数据转换为对应的特征向量,其中对文本数据执行文本标记化和文本嵌入,转化为词向量形式;对视频数据直接使用ResNet算法获取全局级别事件要素特征,构建视频全局特征向量;对视频数据通过Fast‑R‑CNN识别局部对象,使用ResNet算法获取局部级别时间要素,构建视频局部特征向量;对文本词向量和视频全局特征向量与局部特征向量,通过全连接层统一三者的向量维度,构建文本‑视频共享向量空间;将文本词向量和视频全局特征向量与局部特征向量输入到Transformer编码器,再采用ONEIE算法进行文本模态的事件要素信息抽取,采用T5‑base算法进行视频模态的事件要素信息抽取。本发明能够更加精确的捕捉多模态内部之间的关联性,提高了抽取精度。

    基于自适应分块与语义层次聚类的长文本摘要自动生成方法

    公开(公告)号:CN120086367A

    公开(公告)日:2025-06-03

    申请号:CN202411984652.3

    申请日:2024-12-31

    Abstract: 本发明公开了一种基于自适应分块与语义层次聚类的长文本摘要自动生成方法,基于网络爬虫技术收集相关长文本,进行专业术语识别、标准化、清洗与规范化处理;流水线并行执行长文本自适应分块、摘要生成和语义嵌入,将分块文本转为语义向量;进行语义层次聚类,得到最高层簇摘要,即为长文本摘要。本发明兼顾文本块长度及语义连贯性,避免了单次处理长文本产生的计算与显存压力,并保证了同一文本块内语义相关,相邻文本块语义独立;能够充分利用不同GPU设备,减少空闲等待时间,降低单个GPU的显存压力,提高整体计算效率;有利于捕捉长文本中的不同主题与层次结构,使最终生成的摘要更精确和有条理,摘要的生成过程也更具可解释性。

Patent Agency Ranking