-
公开(公告)号:CN110852040A
公开(公告)日:2020-02-28
申请号:CN201911072366.9
申请日:2019-11-05
Applicant: 中电科大数据研究院有限公司
IPC: G06F40/117 , G06F40/279
Abstract: 本发明提供了一种标点预测模型训练方法及文本标点确定方法,标点预测模型训练方法包括:(1)获取用于标点预测模型训练的分字文本训练集;(2)利用数据增强方法从训练集中生成训练样本;(3)获取训练好的标点预测模型。文本标点确定方法包括:(1)获取无标点的目标文本;(2)获取目标文本中每个文字后面的预测标点;(3)将预测标点插入目标文本中对应文字的后面,得到标点确定的文本。本发明所提供的标点预测模型训练方法和文本标点确定方法,可以优化标点预测模型的训练,让标点预测模型达到自身的最佳性能,从而提高标点预测结果的正确性。
-
公开(公告)号:CN109710936A
公开(公告)日:2019-05-03
申请号:CN201811613793.9
申请日:2018-12-27
Applicant: 中电科大数据研究院有限公司
IPC: G06F17/27
Abstract: 本发明提供了一种跨层级政府公文公告主题分析方法,包括如下步骤:(1)对公开的政府公文公告数据进行文本数据预处理;(2)基于跨层级的政府公文公告数据构建基于空间线的动态层级概率主题模型;(3)基于单一层级的政府公文公告数据构建基于时间线的动态时序概率主题模型;(4)对模型中的超参数和隐变量进行采样,采样参数包括主题的分布、词语的分布、词语对应的主题;(5)根据模型估计的分布进行主题演化分析。本发明从空间线出发分析政府公文公告的主题随层级的演化过程,从时间线出发分析同一层级政府公文公告的主题随时间的演化情况,并将两个走线结合共同发现和分析主题演化所揭示的政府公文公告事宜,为政府高效监管和决策提供辅助和支撑。
-
公开(公告)号:CN119513674B
公开(公告)日:2025-05-13
申请号:CN202510089450.0
申请日:2025-01-21
Applicant: 中电科大数据研究院有限公司 , 中电科新型智慧城市研究院有限公司
IPC: G06F18/24 , G06F18/213 , G06F18/22
Abstract: 本申请公开了一种基于特征向量匹配的数据识别方法、装置及存储介质。包括:获取待检测数据,分词生成特征向量;通过矩阵运算计算待匹配特征向量与预定义核心数据特征向量的欧氏距离,统计匹配数量;根据描述信息、表描述信息和字段描述信息的权重(分别为0.2、0.5、0.3),计算数据权重值;结合匹配结果和数据规模,通过加权计算得到待检测数据属于核心或重要数据的概率值;判断概率值是否超过阈值,若超过,则识别为核心或重要数据。本方法依托可信执行环境TEE实现特征向量的提取、匹配及计算,避免待检测数据和核心数据特征库暴露。确保计算过程的真实性和可信性。TEE相对其他隐私计算技术,具有额外计算少的优点,可以提升算法匹配效率。
-
公开(公告)号:CN119357177B
公开(公告)日:2025-04-15
申请号:CN202411920739.4
申请日:2024-12-25
Applicant: 中电科大数据研究院有限公司 , 中国电子科技集团公司第十五研究所
IPC: G06F16/215 , G06F18/2433 , G06F18/15 , G06N5/04
Abstract: 本申请公开了一种基于大模型的数据质量分析报告生成方法、系统、装置及存储介质,生成的质量报告具有深入分析和标准化建议,使得报告内容较为丰富,从而可满足复杂多变的业务需求。本申请方法包括:获取输入数据;对输入的数据进行缺失值、重复数据和异常值处理,以得到预处理数据;将所述预处理数据进行分类,以获取日志类型数据和原始数据;将目标知识库RAG集成于垂直大模型,并对所述垂直大模型进行微调,以获取垂直微调大模型;将所述日志类型数据和所述原始数据输入所述垂直微调大模型;获取所述垂直微调大模型生成的校验规则;在确定所述校验规则符合规则符合要求之后,根据所述校验规则生成高质量分析报告。
-
公开(公告)号:CN119210902A
公开(公告)日:2024-12-27
申请号:CN202411707270.6
申请日:2024-11-27
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明提供一种基于分块加密的数据安全共享方法、装置及系统,该方法包括:数据中心对数据信息进行分块,对每个数据块进行加密得到数据块密文,将数据块密文上传至云服务器进行存储,并在本地保存分块信息以及目录信息;接收到数据使用方发布的数据需求信息后,根据本地保存的分块信息以及目录信息确定满足需求的待共享数据;对数据使用方进行身份验证、并判断数据使用方的私钥是否合法以及请求数据是否合规;在验证及判断通过后向监管中心发送共享数据请求,以使监管中心利用自己的私钥生成数据共享令牌及签名,并发送给数据使用方。利用本发明方案,可以使数据得到安全可靠的共享。
-
公开(公告)号:CN119005195B
公开(公告)日:2024-12-20
申请号:CN202411481454.5
申请日:2024-10-23
Applicant: 中电科大数据研究院有限公司
IPC: G06F40/295 , G06F40/30 , G06F16/35
Abstract: 本申请公开了一种基于多智能体协同的事件抽取方法、系统及装置。该方法包括:接收非结构化数据,第一智能体调用至少一个第二智能体识别实体及其类型,并将结果存储至信息池中;调用至少一个第三智能体识别触发词及对应的事件类型,并存储至信息池中;解析触发词和事件类型,生成论元角色集合;第四智能体对论元角色进行识别,并将结果存储至信息池中;将非结构化数据切分为句子、段落和篇章等不同粒度的文本单元,生成对应的上下文提示信息Prompt;调用智能体对各粒度文本进行事件识别,融合不同粒度的事件信息,生成最终的事件抽取结果。通过多智能体协同工作,实现了更精确的事件识别与信息整合,提高了事件抽取的准确性和效率。
-
公开(公告)号:CN119005195A
公开(公告)日:2024-11-22
申请号:CN202411481454.5
申请日:2024-10-23
Applicant: 中电科大数据研究院有限公司
IPC: G06F40/295 , G06F40/30 , G06F16/35
Abstract: 本申请公开了一种基于多智能体协同的事件抽取方法、系统及装置。该方法包括:接收非结构化数据,第一智能体调用至少一个第二智能体识别实体及其类型,并将结果存储至信息池中;调用至少一个第三智能体识别触发词及对应的事件类型,并存储至信息池中;解析触发词和事件类型,生成伦元角色集合;第四智能体对伦元角色进行识别,并将结果存储至信息池中;将非结构化数据切分为句子、段落和篇章等不同粒度的文本单元,生成对应的上下文提示信息Prompt;调用智能体对各粒度文本进行事件识别,融合不同粒度的事件信息,生成最终的事件抽取结果。通过多智能体协同工作,实现了更精确的事件识别与信息整合,提高了事件抽取的准确性和效率。
-
公开(公告)号:CN118643919B
公开(公告)日:2024-10-29
申请号:CN202411104056.1
申请日:2024-08-13
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明提供一种基于多密钥的联邦学习方法及系统,该方法包括:云服务器接收各参与方发送的模型梯度密文;利用服务器代理密钥对模型梯度密文进行计算,生成重加密密文;聚合所有重加密密文,得到聚合密文组;利用服务器私钥对聚合密文组解密得到聚合梯度数据,对聚合梯度数据进行加密,得到聚合梯度密文;将聚合梯度密文分发给各参与方。利用本发明方案,可以提升联邦学习中各参与方隐私数据的安全性。
-
公开(公告)号:CN118381600A
公开(公告)日:2024-07-23
申请号:CN202410837475.X
申请日:2024-06-26
Applicant: 中电科大数据研究院有限公司
IPC: H04L9/00 , H04L9/08 , H04L9/32 , H04L67/1095 , H04L67/1097 , G06N3/098 , G06N3/084 , G06F21/60 , G06F21/62
Abstract: 本发明提供一种联邦学习隐私保护方法及系统,该方法包括:中央服务器接收各参与方发送的基于同态加密的梯度密文;对接收的各参与方的梯度密文进行聚合及解密,得到聚合梯度信息;对聚合梯度信息进行数字签名,得到签名组;将签名组发送给共识节点;共识节点对签名组中的签名信息进行共识验证,验证通过后将签名组中的聚合梯度信息上传至区块链网络。利用本发明方案,可以有效地保护各参与方私有数据的安全性,并降低了参与方的计算开销,而且实现了对模型数据的全生命周期维护。
-
公开(公告)号:CN117151429B
公开(公告)日:2024-01-26
申请号:CN202311408966.4
申请日:2023-10-27
Applicant: 中电科大数据研究院有限公司
IPC: G06Q10/0631 , G06Q10/10 , G06Q50/26 , G06F16/36 , G06F40/30 , G06N3/006 , G06Q10/0633
Abstract: 本发明提供一种基于知识图谱的政务服务流程编排方法及装置,属于知识图谱技术领域,本发明实施例的一种基于知识图谱的政务服务流程编排方法,通过对请求信息进行语义分析进而识别出实体在目标政务知识图谱中对应的初始节点,利用粒子群优化算法在初始节点的基础上筛选得到与请求信息匹配程度较大的补充节点,尽可能扩大信息获取的范围,进而可以得到详细程度更高的信息,并再次利用粒子群优化算法在初始节点与补充节点中得到最终全局最优的目标节点来生成政务服务流程,提高了生成信息的详细程度与准确度,可以对用户输入的请求
-
-
-
-
-
-
-
-
-