-
公开(公告)号:CN116992886A
公开(公告)日:2023-11-03
申请号:CN202310940792.X
申请日:2023-07-28
Applicant: 中国电子科技集团公司第五十四研究所 , 陆军装备部驻北京地区军事代表局驻石家庄地区第一军事代表室
IPC: G06F40/30 , G06F40/284 , G06F16/33 , G06F16/335 , G06F16/35 , G06N3/0442 , G06N3/045
Abstract: 本发明公开了一种基于BERT的热点新闻事件脉络生成方法及装置。在本发明中,对于批次输入的热点新闻文本数据,首先使用基于BERT的方法进行语义挖掘,目的是从语义层面理解热点新闻文本,获取其中包含的信息和事件。然后,通过文本关键词、热点事件词和衰减因子等方法,筛选并抽取出与当前热点事件相关的关键词,这些关键词构成了热点事件的语义表示。随后根据事件的语义表示,本发明使用不同策略来构建事件的主脉络和分支脉络,进一步提取事件的演变脉络。由此,本发明实现了对热点新闻事件的全面理解和描述,为相关领域的研究、分析和应用提供了有力支持。
-
公开(公告)号:CN120067702A
公开(公告)日:2025-05-30
申请号:CN202510099790.1
申请日:2025-01-22
Applicant: 中国电子科技集团公司第五十四研究所
IPC: G06F18/22
Abstract: 本发明公开了一种基于灰色关联矩阵的运动实体关联方法,属于人工智能及知识工程技术领域。该方法采用运动实体属性特征与状态信息相结合的实体关联判断方法,将实体的位置、速度、加速度和方位角等状态信息以及有关属性特征作为指标形成关联矩阵,通过计算比较相邻时刻矩阵间的关联度,确定实体关联关系。本发明方法能够用于解决多源异构信息的实体关联,为运动实体实时融合技术提供支撑和依据。
-
公开(公告)号:CN116992029A
公开(公告)日:2023-11-03
申请号:CN202310940176.4
申请日:2023-07-28
Applicant: 中国电子科技集团公司第五十四研究所
IPC: G06F16/35 , G06F40/216 , G06F40/284 , G06F18/22 , G06F18/231
Abstract: 本发明公开了一种基于增量聚类与主题划分的热点事件脉络生成方法及装置,属于信息挖掘领域。该方法通过调节数据窗口,将每批次输入的新闻文本数据通过基于tf‑idf或Doc2Vec方法,以及类簇计算文本语义的相似度来得到粗粒度的事件脉络,并根据类簇内数据量的规模进行基于LDA的细粒度聚类,进一步划分主题。最终,按照文本生成的时间顺序,构建基于增量聚类与主题划分的事件脉络,以结构化的方式跟踪和揭示事件是如何随着时间发展来演化的。该方法能够在不阅读大量新闻文章的情况下,也可以对事件的发生发展脉络有清晰的认识。同时,该方法具有高效性和自动化特点,可广泛应用于热点事件追踪、舆情分析、信息提取等领域,为人们提供更加准确、全面的信息服务。
-
公开(公告)号:CN120046034A
公开(公告)日:2025-05-27
申请号:CN202510104715.X
申请日:2025-01-23
Applicant: 中国电子科技集团公司第五十四研究所
IPC: G06F18/2415 , G06F18/213 , G06F18/214 , G06N3/0455 , G06N3/09
Abstract: 本发明涉及信息技术领域,公开了一种融合标签引导注意力机制的多标签文本分类方法,所述方法包括:由一个基本预测模型、标签混淆模型以及标签引导的注意力机制实现,基本预测模型从文本中提取特征,并生成初步的标签分布。标签混淆模型通过计算文本向量表征与每一级标签之间的因果相关性,生成模拟标签分布,引导初步预测结果,提高预测准确性。为了进一步减少噪声引入,设计了一种标签引导的注意力机制,使模型能够更好地聚焦于与目标标签相关的特征。实验结果表明,该算法在建立的分类基准数据集上均表现出优越的性能,验证了因果关系建模在多标签文本分类任务中的有效性。
-
公开(公告)号:CN115828433A
公开(公告)日:2023-03-21
申请号:CN202211588614.7
申请日:2022-12-12
Applicant: 中国电子科技集团公司第五十四研究所
Abstract: 本发明公开了一种基于FlightGear的直升机编队飞行仿真方法,属于数字化飞行场景仿真领域。本发明首先进行多个驾驶员操作仿真联网,制作基础的图形仿真环境,综合使用计算机图形学技术、多媒体技术以及地理信息技术,将描述直升机运动信息的参数直接关联到三维场景的几何模型中,同时将与飞行有关的地理位置、环境参数同步集成,驱动模型调动处理、分布交互的直升机编队飞行视景生成。相对于传统全数值的仿真结果,本发明能够实现全方位、逼真展现编队飞行全景状态及各种综合信息效果,提升飞行人员对真实环境体验感。该方法具有计算效率高、通用性强、易于实现的特点。
-
公开(公告)号:CN119988604A
公开(公告)日:2025-05-13
申请号:CN202510066406.8
申请日:2025-01-16
Applicant: 中国电子科技集团公司第五十四研究所
Abstract: 本发明涉及一种大语言模型驱动的主题导向型多文档摘要生成方法,属于自然语言处理技术领域。该方法包括:执行多文档数据预处理;应用大语言模型为每个预处理后的单文档生成简洁的摘要及识别主题;将文档的摘要与主题转换成向量表示,并通过聚类算法形成基于内容相似性的多个类别;针对每个类别内的文档使用大语言模型生成综合性的摘要;融合所有类别的综合性摘要,再次利用大语言模型生成最终摘要。本发明通过分阶段处理和主题向量注入,解决了传统方法在处理海量文档时遇到的输入长度限制和缺乏主题连贯性的问题,提升了摘要的准确性和聚焦度。
-
公开(公告)号:CN119849489A
公开(公告)日:2025-04-18
申请号:CN202411736526.6
申请日:2024-11-29
Applicant: 中国电子科技集团公司第五十四研究所
IPC: G06F40/284 , G06F40/216 , G06F18/22 , G06N3/0455 , G06N3/045 , G06N3/084
Abstract: 本发明涉及新闻文本增广和生成技术领域,尤其涉及一种基于温度控制的微调模型中文小样本生成方法。所述方法包括:构建高质量新闻数据文本;获取相似句子数据集;微调预训练的Transformer Block,使Transformer Block在相似句任务上表现更出色,采用生成模型的微调方法,提高Transformer Block模型的新闻表达能力;构建Transformer Block生成器;使用温度控制的方式实现新闻文本生成。基于Transformer Block生成大量新闻文本,通过不断增加温度以提升新闻文本发散度,在保证生成新闻文本质量不下降的同时增加丰富度,确保生成新闻文本满足预期效果。
-
公开(公告)号:CN114138935B
公开(公告)日:2024-11-22
申请号:CN202111422588.6
申请日:2021-11-26
Applicant: 中国电子科技集团公司第五十四研究所
IPC: G06F16/33 , G06F40/295 , G06F18/214
Abstract: 本发明公开了一种基于数据分布自适应间隔的少样本复杂关系抽取方法,属于计算机自然语言处理领域。本发明针对文本中包含多个实体、多种关系的复杂场景,设计了元任务构造方法,引入了基于数据分布自适应间隔,并以此调整度量空间边界,同时引入负样本机制,解决None‑of‑the‑above场景问题,且对于常见的实体嵌套情况也可进行处理。
-
公开(公告)号:CN115936007A
公开(公告)日:2023-04-07
申请号:CN202211589441.0
申请日:2022-12-12
Applicant: 中国电子科技集团公司第五十四研究所
IPC: G06F40/30 , G06F40/289 , G06F40/216
Abstract: 本发明为一种基于语料库的群体情感倾向度分析方法,涉及信息处理领域。该方法基于倾向性语料库中的极性词汇对集合中每一份素材文本进行分词,统计并计算素材文本中出现的极性词汇的强度值,得到整篇素材文本的倾向度,再对集合中所有素材文本的倾向度进行统计并归一化,带入分段条件函数中进行倾向度判断,得到网络群体对该事件的情感倾向是正面的、中立的、还是负面的。该方法具有易于实现、运算速度快、效率高的特点。
-
公开(公告)号:CN114138935A
公开(公告)日:2022-03-04
申请号:CN202111422588.6
申请日:2021-11-26
Applicant: 中国电子科技集团公司第五十四研究所
IPC: G06F16/33 , G06F40/295 , G06K9/62
Abstract: 本发明公开了一种基于数据分布自适应间隔的少样本复杂关系抽取方法,属于计算机自然语言处理领域。本发明针对文本中包含多个实体、多种关系的复杂场景,设计了元任务构造方法,引入了基于数据分布自适应间隔,并以此调整度量空间边界,同时引入负样本机制,解决None‑of‑the‑above场景问题,且对于常见的实体嵌套情况也可进行处理。
-
-
-
-
-
-
-
-
-