-
公开(公告)号:CN116186133A
公开(公告)日:2023-05-30
申请号:CN202211729747.1
申请日:2022-12-30
Applicant: 苏州空天信息研究院
IPC: G06F16/25 , G06F16/22 , G06F16/28 , G06F16/2457 , G06F16/31 , G06F16/335
Abstract: 本发明提出了一种融合正排与倒排索引的电子文档管理方法,选取搜索引擎为正排索引的数据库,以及搜索引擎为倒排索引的数据库,并封装统一的数据库API对两种数据库进行融合引接;电子文档存储时,向正排索引数据库中存储电子文档的结构化数据,向倒排索引数据库中存储电子文档的文本数据,将正排索引数据库中的数据与倒排索引数据库中的数据通过电子文档的ID相互关联;当查找文档时,根据不同的需求,通过文档的结构信息在正排索引数据库中进行查找,或者通过关键词在倒排索引数据库中实现文档全文高效检索。本发明既满足了电子文档管理的结构化管理及存储功能,又实现了海量文本内容的高效检索功能。
-
公开(公告)号:CN120085074A
公开(公告)日:2025-06-03
申请号:CN202411299124.4
申请日:2024-09-18
Applicant: 苏州空天信息研究院
IPC: G01R29/08
Abstract: 本发明公开了一种天基电磁信号覆盖率评估方法,基于卫星与天线的轨道几何关系,建立天基电磁信号的功率密度模型;基于卫星灵敏度与天线的功率密度,获取卫星对天基电磁信号的捕获情况;基于卫星对天基电磁信号的捕获情况,计算卫星的有效覆盖范围;基于卫星的有效覆盖范围,计算卫星的有效覆盖时间;基于天线的探测概率,构建卫星对天基电磁信号的覆盖率评估模型。本发明通过分析天基电磁信号的功率密度和探测概率,计算覆盖率评估值为天基信号的覆盖率评估的实际应用提供了更为全面的理论依据。
-
公开(公告)号:CN119807475A
公开(公告)日:2025-04-11
申请号:CN202411830787.4
申请日:2024-12-12
Applicant: 苏州空天信息研究院
IPC: G06F16/901 , G06F16/904 , G06N5/04 , G06N3/0455 , G06N5/022
Abstract: 本发明提供了一种移动端智能图谱构建与自适应可视化方法及其系统,该方法包括,利用爬虫等技术收集多种来源数据,例如文本、图像、音频、视频等数据;将获取的不同种类异构数据处理和整合,形成结构化数据和半结构化数据;训练知识抽取模型,读取结构化和半结构化数据进行实体识别和关系抽取;编写自动图谱构建程序,将构建结果存储在数据库中;获取设备相关参数编写自适应可视化程序,展示实体的关联信息。本发明通过集成化的方法设计和智能化的技术手段,实现了在移动端的高效图谱构建和自适应的可视化展示。该方法不仅提高了知识图谱的构建效率和质量,还为用户提供了更加便捷、直观的信息获取方式,提高用户对复杂信息的理解和分析效率。
-
公开(公告)号:CN116955537A
公开(公告)日:2023-10-27
申请号:CN202310978360.8
申请日:2023-08-04
Applicant: 苏州空天信息研究院
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06F40/216 , G06F18/23
Abstract: 本发明公开一种融合新闻发生时间与语义相似度的事件脉络链路生成方法,对新闻文本内容进行嵌入式表征,对新闻发生时间进行数字化表示,完成新闻集合预处理;对预处理后的新闻集合按照发生时间进行窗口划分,形成若干新闻子集合;结合新闻的发生时间和文本内容信息,对每一个窗口内的新闻子集合使用聚类算法计算事件簇结果并进行评估;在各个窗口下计算得到的事件簇结果中,选择属于同一类的簇进行融合,并在融合后的簇结果中选择事件簇代表节点形成新一轮的新闻集合;针对新形成的新闻集合,重复上述过程,直至得到最终的事件脉络结果。本发明提高了新闻事件脉络结果生成的准确性、可解释性以及高效性。
-
公开(公告)号:CN116824360A
公开(公告)日:2023-09-29
申请号:CN202310550251.6
申请日:2023-05-16
IPC: G06V20/10 , G06V20/70 , G06V10/764 , G06T7/73 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/0895
Abstract: 本发明公开了一种大规模遥感图片数据集标注的自动生成方法。本方法中,提出了一个双阶段的半监督方法,用于为遥感数据集生成定位注释。对于一个特定的目标,如机场,只需要包含特定目标和不包含特定目标的两部分样本图像,就能用本系统的方法来生成像素级的定位注释,同时提出了一种新的方法来更准确地定位遥感图像中的目标。一个包含正样本图片(包含特定的目标)和负样本图片(不包含特定的目标)的数据集经过一个三分类器网络得到初步定位区域,本发明用一个三分类器取代中双分类器,提高准确度和生成速度。
-
公开(公告)号:CN113886529A
公开(公告)日:2022-01-04
申请号:CN202111235748.6
申请日:2021-10-22
Applicant: 苏州空天信息研究院
IPC: G06F16/33 , G06F40/126 , G06F40/242 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种面向网络安全领域的信息抽取方法及其系统,制定面向网络安全领域的实体和关系标注规范,构建实体和关系标签体系;使用半自动化标注策略生成训练数据,所述半自动化标注策略包括使用人工进行少量标注和使用基于知识库的远程监督方法进行补充标注;训练联合神经网络模型预测实体和关系,所述联合神经网络模型结合命名实体识别和关系抽取,在检测尾实体的位置时,同时对头实体和尾实体之间的关系进行判断。本发明针对网络安全领域实现实体和关系的抽取功能。
-
公开(公告)号:CN119807517A
公开(公告)日:2025-04-11
申请号:CN202411836631.7
申请日:2024-12-13
Applicant: 苏州空天信息研究院
IPC: G06F16/9535 , G06F16/9537 , G06F16/906 , G06F18/22 , G06F18/24 , G06F18/25 , G06F18/211 , G06N20/00
Abstract: 本发明公开了一种基于多路召回的个性化新闻信息推荐方法,当用户是新用户时,提供用户兴趣标签选择功能,若用户选择兴趣标签,按照用户兴趣标签进行标签栏目信息推荐;若用户拒绝兴趣标签选择,进行冷启动热点信息推荐;当用户不是新用户时,判断是否有用户历史行为数据信息,若没有历史数据,则按照新用户进行兴趣标签判断并进行冷启动热点信息推荐或者栏目推荐;若有历史行为数据,综合相似用户偏好信息推荐以及基于时序内容的信息推荐进行综合信息推荐。本发明克服了现有个性化信息推荐算法面向新闻推荐领域用户历史数据依赖性强、推荐同质化的缺陷。
-
公开(公告)号:CN119649264A
公开(公告)日:2025-03-18
申请号:CN202411576519.4
申请日:2024-11-06
Applicant: 苏州空天信息研究院
IPC: G06V20/40 , G06V10/80 , G06V10/74 , G06V10/40 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0895
Abstract: 本发明公开了一种文本‑视频跨模态事件要素抽取方法,搜集视频数据及其视频简介文本数据,分别标注文本及视频数据的事件类型及对应的事件论元角色,其中事件论元角色表示在事件中扮演不同角色的实体,文本数据与视频数据预标注事件类型及事件类型对应的事件论元角色一致;进行多模态事件指代消解,实现任意“文本‑视频”数据间的共指事件配对,即将指代同一事件的文本和视频进行匹配,构成一组文本‑视频共指事件对;对匹配的“文本‑视频”数据转换为对应的特征向量,其中对文本数据执行文本标记化和文本嵌入,转化为词向量形式;对视频数据直接使用ResNet算法获取全局级别事件要素特征,构建视频全局特征向量;对视频数据通过Fast‑R‑CNN识别局部对象,使用ResNet算法获取局部级别时间要素,构建视频局部特征向量;对文本词向量和视频全局特征向量与局部特征向量,通过全连接层统一三者的向量维度,构建文本‑视频共享向量空间;将文本词向量和视频全局特征向量与局部特征向量输入到Transformer编码器,再采用ONEIE算法进行文本模态的事件要素信息抽取,采用T5‑base算法进行视频模态的事件要素信息抽取。本发明能够更加精确的捕捉多模态内部之间的关联性,提高了抽取精度。
-
公开(公告)号:CN113886529B
公开(公告)日:2022-12-02
申请号:CN202111235748.6
申请日:2021-10-22
Applicant: 苏州空天信息研究院
IPC: G06F16/33 , G06F40/126 , G06F40/242 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种面向网络安全领域的信息抽取方法及其系统,制定面向网络安全领域的实体和关系标注规范,构建实体和关系标签体系;使用半自动化标注策略生成训练数据,所述半自动化标注策略包括使用人工进行少量标注和使用基于知识库的远程监督方法进行补充标注;训练联合神经网络模型预测实体和关系,所述联合神经网络模型结合命名实体识别和关系抽取,在检测尾实体的位置时,同时对头实体和尾实体之间的关系进行判断。本发明针对网络安全领域实现实体和关系的抽取功能。
-
公开(公告)号:CN120086367A
公开(公告)日:2025-06-03
申请号:CN202411984652.3
申请日:2024-12-31
Applicant: 苏州空天信息研究院
IPC: G06F16/35 , G06F16/34 , G06F40/30 , G06F40/211 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于自适应分块与语义层次聚类的长文本摘要自动生成方法,基于网络爬虫技术收集相关长文本,进行专业术语识别、标准化、清洗与规范化处理;流水线并行执行长文本自适应分块、摘要生成和语义嵌入,将分块文本转为语义向量;进行语义层次聚类,得到最高层簇摘要,即为长文本摘要。本发明兼顾文本块长度及语义连贯性,避免了单次处理长文本产生的计算与显存压力,并保证了同一文本块内语义相关,相邻文本块语义独立;能够充分利用不同GPU设备,减少空闲等待时间,降低单个GPU的显存压力,提高整体计算效率;有利于捕捉长文本中的不同主题与层次结构,使最终生成的摘要更精确和有条理,摘要的生成过程也更具可解释性。
-
-
-
-
-
-
-
-
-