-
公开(公告)号:CN116911289B
公开(公告)日:2024-01-02
申请号:CN202311176752.9
申请日:2023-09-13
Applicant: 中电科大数据研究院有限公司
IPC: G06F40/279 , G06F40/216 , G06F40/30 , G06F18/214
Abstract: 本申请公开了一种政务领域大模型可信文本生成方法、装置及存储介质。本申请方法包括:构建问题数据以及对应的知识数据;将问题数据以及知识数据构建成可控Prompt模板;将问题数据插入至预先配置的空白Prompt模板中,得到语义近似Prompt模板;将语义近似Prompt模板输入至目标大模型中,得到语义近似问题数据,语义近似问题数据与问题数据语义近似;将可控Prompt模板、问题数据、知识数据以及语义近似问题数据按照不同的组合方式构建映射数据集;以映射数据集作为目标大模型的输入,对目标大模型进行微调;在使用微调后的目标大模型时,将目标大模型输出的实时答案输入至预先构建
-
公开(公告)号:CN116996235B
公开(公告)日:2023-12-05
申请号:CN202311248994.4
申请日:2023-09-26
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明公开了一种联合建模的安全认证方法、装置及系统,该方法包括:生成并发布公开参数PK及文件散列函数H;根据公开参数PK及文件散列函数H,为参与联合建模的各节点生成私钥SK,并将私钥SK及全局模型通过安全信道发送给对应的节点;接收各节点的梯度签名,所述梯度签名是所述节点根据自己的私钥SK、所述公开参数PK及文件散列函数H对所述全局模型训练得到的梯度数据进行签名得到的;确定各节点的梯度签名是否有效;如果所有梯度签名均有效,则对梯度签名进行聚合,得到聚合签名,并将聚合签名发送给各节点。利用本发明方案,可以保证联合建模信息的安全性。
-
公开(公告)号:CN116954587A
公开(公告)日:2023-10-27
申请号:CN202311205042.4
申请日:2023-09-19
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明公开了一种前端智能拖拽引擎、建立数据处理流程的方法,该前端智能拖拽引擎包括:对应不同任务模式的组件库和操作语句库、以及流程模板库;所述组件库,用于提供构建数据处理流程的组件;所述流程模板库,用于提供构建数据处理流程的流程模板;所述操作语句库,用于提供对各组件及连接关系的操作语句;推荐功能单元,用于在用户建立数据处理流程过程中,实时检测当前在建数据处理流程与所述流程模板库中各流程模板的重合度,向用户推荐重合度大于设定值的流程模板。利用本发明方案,可以降低整套拖拽组件使用门槛,为前端数据处理流程的建立提供智能化辅助,提升效率及准确性。
-
公开(公告)号:CN113269139B
公开(公告)日:2023-09-26
申请号:CN202110677796.4
申请日:2021-06-18
Applicant: 中电科大数据研究院有限公司
IPC: G06V20/52 , G06V10/26 , G06V10/30 , G06V10/40 , G06V10/774 , G06V10/764 , G06V10/80
Abstract: 本发明提供了一种针对复杂场景的自学习大规模警员图像分类模型,通过优化警员图像数据集构建和模型训练过程,对大规模警员图像数据集进行筛选,结合图像主体区域检测模型减少数据中的噪声,增强了对复杂场景的识别,同时利用迁移学习方法降低了模型训练的难度,迭代训练了一个警员图像分类模型,进一步将模型运用在原始大规模警员图片数据集中,实现了警员图像分类模型自学习过程。相对于传统的直接在原始数据集上进行训练的图像分类模型,本方法解决了训练大规模警员图像分类模型缺少标注数据的问题,并针对警员图像数据场景复杂的特征进行了数据筛选与语义增强,从而能够更准确的实现对警员图像的分类与识别。
-
公开(公告)号:CN116775578A
公开(公告)日:2023-09-19
申请号:CN202311070192.9
申请日:2023-08-24
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明公开了一种政策血缘网络构建方法及装置、政策分析方法及装置,所述方法包括:收集政策文件,并对所述政策文件进行分类编码管理;根据所述政策文件,构建不同粒度的文本向量;对所述文本向量进行聚类,得到各聚类中心点及该中心点对应的向量簇,所述向量簇包括多个文本向量、以及与所述文本向量相关的政策集合;构建对应各中心点的政策谱系树,由所述政策谱系树组成政策森林;根据所述政策森林中的所有政策谱系树构建政策血缘网络。利用本发明方案,可以高效地构建政策血缘网络,而且构建的政策血缘网络可以全面地呈现不同政策间的显性血缘关系和隐性血缘关系,为政策传播的分析提供有效支撑。
-
公开(公告)号:CN110245275B
公开(公告)日:2023-09-01
申请号:CN201910521164.1
申请日:2019-06-18
Applicant: 中电科大数据研究院有限公司 , 贵州华云创谷科技有限公司 , 长沙军民先进技术研究有限公司
IPC: G06F16/9032 , G06F16/951 , G06F16/9535
Abstract: 本发明公开了一种大规模相似新闻标题快速归一化方法,所述方法包括:S1、预处理新闻标题数据;S2、将与任意给定新闻标题相关的新闻标题数据进行排序;S3、计算相关新闻标题与该新闻标题之间相似度并排序;S4、比较相关新闻标题中最大相似度值与设定相似度阈值并判断索引中是否存在相似新闻标题,若存在则将最大相似度新闻标题MD5值作为该新闻标题归一化序列码,若不存在则进入步骤S5;S5、计算该新闻标题MD5值,作为其归一化序列码与其内容存入索引中;S6、重复步骤S2和S5,完成所有新闻标题的归一化映射。本发明可以快速找出相关的新闻标题并做出相似性判定,然后将相似新闻标题映射成唯一的归一化序列码,实现了大规模相似新闻标题的快速归一化。
-
公开(公告)号:CN110716925B
公开(公告)日:2023-08-04
申请号:CN201910837650.4
申请日:2019-09-05
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/215 , G06F16/2458 , G06F16/29 , H04W4/021 , G01S19/42
Abstract: 本发明公开了一种基于轨迹分析的跨境行为识别方法,包括以下步骤:(1)获取人员历史轨迹及边界地理围栏数据;(2)对人员历史轨迹数据进行数据预处理;(3)轨迹数据预分类;(4)对预分类的轨迹数据进行跨境行为识别;(5)输出跨境行为识别结果。本发明基于地理GIS数据及人员轨迹数据,统筹地理科学、计算机图形学、统计学、大数据等多学科理论与技术手段,可为智能交通、社会公共安全、智慧公安等领域应用提供技术支持。
-
公开(公告)号:CN116501875A
公开(公告)日:2023-07-28
申请号:CN202310486869.0
申请日:2023-04-28
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/35 , G06F16/31 , G06F16/34 , G06F40/289 , G06F40/216 , G06F40/253 , G06F40/186 , G06F16/28 , G06F16/901 , G06F18/23213 , G06N3/0442
Abstract: 本发明涉及信息处理领域,特别是一种基于自然语言和知识图谱的文档处理方法和系统,通过对主题关键词属性信息聚类分类处理;借助于权重值信息的赋值抽取出文档中的关键信息,对文档文本进行自动分词、自动分类、自动聚类处理,配置知识图谱获取到特定的语法与结构,形成自动填充模板,对法律文档配置填充格式,生成文档数据信息的自动摘要,能够快捷高效地向用户推送文档主题信息,提升了现有文档信息的处理效率。
-
公开(公告)号:CN116108165B
公开(公告)日:2023-06-13
申请号:CN202310347275.1
申请日:2023-04-04
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/34 , G06F40/211 , G06F40/289 , G06F40/284
Abstract: 本发明提供了一种文本摘要生成方法、装置、存储介质及电子设备,其中,该方法包括:提取目标文本中的关键词;基于具有关键词的原始词序列中的关键词的重要程度对相应的关键词进行数量扩展,得到目标句子的有效词序列;根据有效词序列确定目标句子与其他目标句子之间的相关度;根据该相关度确定目标句子的影响权重;基于影响权重最高的多个目标句子形成目标文本的文本摘要。本发明实施例提供的技术方案,先提取出关键词,进而确定关键词数量扩展后的有效词序列,基于该有效词序列可以更准确地表示在需要提取文本摘要时所需的目标句子之间的相关度,从而可以更准确地确定目标句子的影响权重,进而能够更准确地提取出文本摘要。
-
公开(公告)号:CN116028192A
公开(公告)日:2023-04-28
申请号:CN202310315993.0
申请日:2023-03-29
Applicant: 中电科大数据研究院有限公司
Abstract: 本申请公开了一种多源异构数据采集方法、装置和存储介质,旨在通过分布式系统实现通用式多源异构数据采集,提高数据处理效率。本申请方法包括:确定数据源的类型,并配置所述数据源的数据源信息;配置任务调度器,所述任务调度器用于定时执行任务、周期执行任务、确定服务节点以及确定执行策略;创建数据采集任务,所述数据采集任务包括数据来源、数据目标源以及数据采集策略;通过配置好的任务调度器,按照所述数据采集策略执行所述数据采集任务;输出数据采集结果。
-
-
-
-
-
-
-
-
-