-
公开(公告)号:CN119378554A
公开(公告)日:2025-01-28
申请号:CN202411942602.9
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F40/295 , G06F40/16 , G06F40/289
Abstract: 本发明属于命名实体识别技术领域,具体涉及一种基于深度学习的实体标注与识别方法及装置,所述方法包括:获取训练文本并采用BIO标注法对训练文本进行标注;将标注好的训练文本进行处理;将处理后的文本输入预训练好的BERT‑CRF模型,完成模型在命名实体识别上的微调;将待识别的文本A输入微调后的BERT‑CRF模型得到各类别的实体集合;利用训练好的LDA模型对待识别的文本A进行主题分析,得到文本A的主题以及所述主题下概率大于设定值的关键词;对所述的各类别的实体集合进行核验,将集合中与主体和关键词不匹配的实体进行修正。能够对实体进行人工的修正,提升了命名实体识别的准确率。
-
公开(公告)号:CN119378495A
公开(公告)日:2025-01-28
申请号:CN202411942600.X
申请日:2024-12-27
Applicant: 北京市大数据中心
IPC: G06F40/16 , G06F40/194 , G06F40/30 , G06N3/0455
Abstract: 本发明提出的一种数据目录匹配优化与生成方法、系统、装置及介质,属于数据处理技术领域。所述方法包括:获取待治理的文本数据,形成待优化数据和资源数据,并进行数据预处理;使用SBERT模型对预处理后的数据进行向量化处理,生成句子的嵌入向量;通过对句子的嵌入向量之间进行相似度度量,识别出相关的内容,基于相似度度量结果推荐数据目录项;基于推荐的数据目录项,进行质量校验和反馈。本发明通过对系统自定义文本数据以及数据目录文本的向量化处理并通过SBERT模型进行相似度计算以及智能化推荐,实现了对复杂信息系统目录匹配结果的完善与优化。
-
公开(公告)号:CN119358689A
公开(公告)日:2025-01-24
申请号:CN202411942597.1
申请日:2024-12-27
Applicant: 北京市大数据中心
Abstract: 本发明提出的一种面向多元关系场景的知识推理方法、系统、装置及介质,属于知识图谱的构建和多元关系推理技术领域。所述方法包括:识别文本中的实体,并将实体链接到知识图谱中的对应节点上;从文本中抽取实体间的关系,确定关系类型,并生成多元关系数据;对多元关系数据进行建模,并使用嵌入技术将知识图谱中的实体和实体间的关系映射到连续的向量空间以预测出未知的实体间未知的实体和实体间的关系,并更新知识图谱;利用图结构进行逻辑推理,从知识图谱中学习推理规则,搜索特定的路径以发现实体间的新关系。本发明能够快速准确构建实体间的多元关系和确定这些关系的类型,并扩展传统的知识图谱,以更好地表示实体之间的复杂关系。
-
公开(公告)号:CN119357348A
公开(公告)日:2025-01-24
申请号:CN202411301357.3
申请日:2024-09-18
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/3329 , G06F40/279 , G06F40/30 , G06N3/084
Abstract: 本发明提出的一种基于复杂网络语义的意图匹配方法、系统、装置及介质,所述方法包括:收集需求领域的问答数据集,对问答数据进行清洗、实体链接和词嵌入处理;基于LoRA对BERT模型进行调整和训练,在每轮训练中,进行向前传播、计算损失、反向传播和更新BERT模型参数;获取用户输入的问题数据,对问题数据进行处理和特征提取,输入到BERT模型中,生成意图匹配的最佳结果;通过收集用户输入的问答数据,定期更新BERT模型。本发明利用LoRA技术微调BERT模型,让模型在特定领域中进行训练,能够有效增强模型在特定领域中语义意图识别能力。
-
公开(公告)号:CN113536339A
公开(公告)日:2021-10-22
申请号:CN202110726166.1
申请日:2021-06-29
Applicant: 北京市大数据中心 , 中国电子系统技术有限公司
Abstract: 本发明涉及区块链技术领域,特别是指一种区块链节点快速部署方法及系统,方法由区块链节点快速部署系统实现,系统包括合约管理平台、待部署节点以及区块链管理平台;方法包括:区块链管理平台通过共识算法将智能合约模板及访问权限发布在合约管理平台,通过共识算法向待部署节点分发部署文件;将待部署节点的身份信息以及共识算法信息发送至合约管理平台;合约管理平台验证是否将待部署节点纳入区块链中;如果验证成功,区块链管理平台将待部署节点纳入区块链中,完成对节点的快速部署。本发明通过区块链的共识机制来对智能合约进行实时分发与使用,提升区块链组网建链的安全性、可靠性和稳定性。
-
公开(公告)号:CN113472566A
公开(公告)日:2021-10-01
申请号:CN202110657184.9
申请日:2021-06-11
Applicant: 北京市大数据中心 , 北京彩智科技有限公司
IPC: H04L12/24
Abstract: 本发明涉及区块链技术领域,特别是指一种联盟区块链的状态监控方法及主节点状态监控系统,该方法由主节点状态监控系统实现,所述主节点状态监控系统包括主orderer节点以及备份orderer节点,该方法包括:主orderer节点建立服务监听端口;备份orderer节点周期性轮询获取主orderer节点的状态信息,主orderer节点向备份orderer节点发送状态信息;备份orderer节点根据接收到的状态信息,判断当前主orderer节点的节点状态,如果判断当前主orderer节点的状态正常,则备份orderer节点进入休眠,如果判断当前主orderer节点的状态异常,则备份orderer节点进行异常通知;备份orderer节点启动数据恢复服务和接管服务。采用本发明,增强了区块链网络的稳定性和容错性。
-
公开(公告)号:CN119357754B
公开(公告)日:2025-04-08
申请号:CN202411911075.5
申请日:2024-12-24
Applicant: 北京市大数据中心 , 数据堂(北京)科技股份有限公司
IPC: G06F18/24 , G06N3/0455 , G06N3/098
Abstract: 本申请公开了一种联邦数据管控下的基于规则对齐的激励方法及装置,其首先指定联邦数据管控规则,同时从第一联邦节点和第二联邦节点获取用户的行为数据,并采用基于深度学习的数据处理技术对用户行为数据进行时序分析,以分别捕捉到第一联邦节点和第二联邦节点的用户行为特征,进而,通过将第一联邦节点用户行为特征和第二联邦节点用户行为特征分别与联邦数据管控规则进行语义关联分析,从而智能确定联邦节点的激励结果。这样,通过量化用户行为与联邦数据管控规则的一致性来调整联邦学习过程中各节点的权重分配,实现了对联邦学习参与者的公平激励,能够有效促进联邦学习环境中数据资源的高效利用,提高联邦学习的整体性能和隐私性。
-
公开(公告)号:CN119358667A
公开(公告)日:2025-01-24
申请号:CN202411302658.8
申请日:2024-09-18
Applicant: 北京市大数据中心
IPC: G06N5/04 , G06N5/022 , G06N3/0442 , G06N3/0464 , G06N3/08 , G06F40/295 , G06F40/30
Abstract: 本发明提供一种知识推理与关系生成方法、装置、设备及存储介质,属于城市级多源数据处理技术领域,收集城市运行管理的各领域数据;提取数据治理后各类数据中的文本特征;识别文本特征中的实体;抽取文本特征中实体之间的关系,将识别的实体以及抽取的实体之间的关系存储到图数据库,形成初始知识图谱;利用预设的知识推理引擎,生成治理后各领域数据对应新的实体与关系;基于新的实体与关系更新所述的初始知识图谱,得到城市级数据知识图谱。本发明通过结合演化算法的全局搜索能力和深度学习的特征提取能力,自动挖掘和生成知识图谱中实体之间的潜在关系,提高知识图谱的覆盖率和准确性。
-
公开(公告)号:CN119316229A
公开(公告)日:2025-01-14
申请号:CN202411845229.5
申请日:2024-12-16
Applicant: 北京市大数据中心 , 数据堂(北京)科技股份有限公司
IPC: H04L9/40
Abstract: 本发明涉及数据共享技术领域,且公开了一种基于前置节点的联邦数据共享方法和装置,其中方法包括:前置节点将获取到的联邦数据上传至私有链,前置节点上传本地区的基础公共服务信息到私有链,前置节点计算联邦数据特征,并上链请求验证,其他节点根据本地区实际情况,反馈验证值或对联邦数据进行修正,监管机构定期对整个链上的节点进行性能监管和数据统计分析,本发明通过在前置节点上进行数据预处理和加密,确保了数据在传输过程中的安全性和隐私性,前置节点作为中介,可以优化数据传输流程,提高处理效率,减轻链上节点的负载。
-
公开(公告)号:CN116017333A
公开(公告)日:2023-04-25
申请号:CN202211605899.0
申请日:2022-12-14
Applicant: 北京市大数据中心
Abstract: 本申请实施例提供了基于大数据信令处理的人口识别方法、系统及存储介质。该方法包括:根据终端用户的信令数据信息识别用户注册信息和通讯表数据筛选出第一标记用户并提取信令时间数据和信令标识地数据获取基站动态扇区交互信息,提取基站扇区标识动态响应数据并根据基站扇区栅格动态分布模型获取对应基站扇区动态栅格数据计算获得时间周期内的轨迹密度数据,根据轨迹密度数据进行阈值对比筛选人口属性类别;从而基于大数据信令技术对终端用户信令数据处理获取基站扇区数据和栅格数据计算获得轨迹密度数据对人口属性进行识别,实现根据信令数据进行用户轨迹驻停情况识别判断所属人口属性技术,提高对区域内流动人口属性识别判断的精准度。
-
-
-
-
-
-
-
-
-