-
公开(公告)号:CN115580648B
公开(公告)日:2023-07-25
申请号:CN202211211183.2
申请日:2022-09-30
Applicant: 北京大数据先进技术研究院
Abstract: 本发明提供了一种数据融合系统设计方法、系统、电子设备及储存介质,涉及计算机技术领域。方法包括:首先,确定目标应用场景和目标应用场景对应的目标数据源,并根据目标数据源和目标应用场景,从多个候选微服务中确定目标微服务。然后,建立每个目标微服务的数据分发关系,并确定每个目标微服务的执行次序和执行次数。最后,根据执行次序和执行次数,生成由目标微服务组成的数据融合程序流水线。在本申请中,通过将整体的数据融合微服务化,通流水线的方式组织排列目标微服务,再通过数据分发服务进行数据通信,从而搭建一个低耦合、高可扩展性、高可维护性的数据融合系统,并且维护简单,运维成本较低。
-
公开(公告)号:CN116340839A
公开(公告)日:2023-06-27
申请号:CN202310127816.X
申请日:2023-02-08
Applicant: 北京大数据先进技术研究院
IPC: G06F18/241 , G06F18/30 , G06N3/006
Abstract: 本发明提供了一种基于蚁狮算法的算法选择方法及装置,涉及计算机技术领域。包括:首先,构建初始蚂蚁种群,并计算每个蚂蚁个体对应的集成元算法的准确性和多样性以作为蚂蚁个体的适应度,然后通过适应度计算蚂蚁个体间的帕累托支配关系,选择蚂蚁中的帕累托解作为蚁狮从而构建初始蚁狮种群。然后,确定蚁狮种群中的精英蚁狮,并根据精英蚁狮,通过增强游走策略,生成新增蚂蚁种群。最后,迭代执行上述步骤,当满足迭代退出条件时,输出最后一次迭代得到的蚁狮种群以确定目标集成元算法,根据目标集成元算法,从备选算法中选择目标算法。在本发明中,通过选择性集成有效利用元算法的多样性,综合提升集成元算法的准确性和多样性。
-
公开(公告)号:CN115580648A
公开(公告)日:2023-01-06
申请号:CN202211211183.2
申请日:2022-09-30
Applicant: 北京大数据先进技术研究院
Abstract: 本发明提供了一种数据融合系统设计方法、系统、电子设备及储存介质,涉及计算机技术领域。方法包括:首先,确定目标应用场景和目标应用场景对应的目标数据源,并根据目标数据源和目标应用场景,从多个候选微服务中确定目标微服务。然后,建立每个目标微服务的数据分发关系,并确定每个目标微服务的执行次序和执行次数。最后,根据执行次序和执行次数,生成由目标微服务组成的数据融合程序流水线。在本申请中,通过将整体的数据融合微服务化,通流水线的方式组织排列目标微服务,再通过数据分发服务进行数据通信,从而搭建一个低耦合、高可扩展性、高可维护性的数据融合系统,并且维护简单,运维成本较低。
-
公开(公告)号:CN113408581A
公开(公告)日:2021-09-17
申请号:CN202110528389.7
申请日:2021-05-14
Applicant: 北京大数据先进技术研究院
Abstract: 本申请实施例涉及数据处理技术领域,具体涉及一种多模态数据匹配方法、装置、设备及存储介质,旨在实现低质量的跨模态数据的快速匹配。所述方法包括:将获取的多种单模态数据进行分类,得到多个数据集,其中,同一数据集中包括模态相同的多个单模态数据;对所述多个数据集中每个数据集的单模态数据进行特征提取,得到该数据集中多个所述单模态数据的高层特征,并将该数据集中的多个高层特征放入该数据集对应的特征数据集中;分别对每个所述特征数据集中的高层特征进行基于参考点的结构表征,得到所述特征数据集对应的参考表征;将多个特征数据集各自对应的参考表征输入预训练好的共同空间网络中,得到多组跨模态匹配的数据。
-
公开(公告)号:CN119719774A
公开(公告)日:2025-03-28
申请号:CN202411782183.7
申请日:2024-12-05
Applicant: 北京大数据先进技术研究院
IPC: G06F18/214 , G06F18/2431 , G06N3/09
Abstract: 本申请提供了一种基于联合度量指标选择的模型持续训练方法、装置和设备,包括:确定候选数据集针对第一小型语言模型的第一交叉熵损失值,确定训练数据集针对第二小型语言模型的第二交叉熵损失值,计算第一交叉熵损失值和第二交叉熵损失值的第一差值,基于第一差值,以及候选数据集与训练数据集之间的第一最优传输距离,从候选数据集中确定第一目标数据集,基于第一目标数据集,对第一小型语言模型进行持续训练,得到目标小型语言模型,一定程度上可以提升用于训练第一小型语言模型的第一目标数据集的数据质量,从而可以在一定程度上提升目标小型语言模型的预测准确度。
-
公开(公告)号:CN118394861B
公开(公告)日:2025-02-14
申请号:CN202410610987.2
申请日:2024-05-16
Applicant: 北京大数据先进技术研究院
IPC: G06F16/28 , G06F16/2457 , G06F21/62 , G06F21/31
Abstract: 本申请提供了一种基于语义映射文件的本体生成方法、装置和产品,涉及本体生成技术领域,所述方法包括:响应于用户发送的本体生成请求,获取关系型数据库中的语义映射文件,所述语义映射文件为所述关系型数据库的OBDA文件,用于描述所述关系型数据库中的多个关系数据库表的数据特征信息;从所述语义映射文件中提取类、数据属性和对象属性;根据提取得到的类、数据属性和对象属性,生成关系数据本体。
-
公开(公告)号:CN115577317B
公开(公告)日:2024-04-05
申请号:CN202211211195.5
申请日:2022-09-30
Applicant: 北京大数据先进技术研究院
Abstract: 本发明提供一种数据融合效果评估方法、系统、电子设备及储存介质,涉及计算机技术领域。根据目标任务场景,搭建虚拟任务环境和虚拟无人平台,并获取目标数据源的数据,然后,根据目标数据源的数据进行多源数据融合,并根据融合结果确定无人平台的操作控制指令,以控制虚拟无人平台在虚拟任务环境中执行目标任务。最后,采集目标任务的任务评价参数,根据任务评价参数和目标任务评价标准的匹配度,确定目标任务的完成度评价分数,并据其对数据融合模型的效果进行评估,以及根据评估结果对模型参数进行调整,得到目标数据融合模型。其通过搭建完全虚拟的仿真环境,对数据融合效果进行高效的评估和调整,达到模拟真实运行的效果以及相应的指标要求。
-
公开(公告)号:CN117609825A
公开(公告)日:2024-02-27
申请号:CN202311491426.7
申请日:2023-11-09
Applicant: 北京大数据先进技术研究院
IPC: G06F18/24 , G06F18/214
Abstract: 本公开关于一种高维不平衡缺失数据的分类方法、装置、电子设备及介质,该方法通过获取待分类的初始数据集;对初始数据集中的多个特征、预设数据填补算法、预设数据重采样算法进行指定数量次的编码,得到指定数量个目标向量;对于任一目标向量,得到目标向量对应的目标数据集;采用测试数据集或目标测试集对目标分类模型的性能进行评估,并将目标分类模型的性能参数作为目标向量的评估参数;基于各更新后的目标向量的评估参数,对最优向量进行更新;在最优向量的更新次数达到预设次数阈值的情况下,将最优向量对应的目标数据集作为最终数据集;对最终数据集中的数据进行分类。提高了针对不同数据集的处理灵活性。
-
公开(公告)号:CN116361398A
公开(公告)日:2023-06-30
申请号:CN202310147860.7
申请日:2023-02-21
Applicant: 北京大数据先进技术研究院
IPC: G06F16/28 , G06F18/214 , G06N3/04 , G06N3/08 , G06F16/23
Abstract: 本发明提供了一种用户信用评估方法、联邦学习系统、装置和设备,应用于联邦学习系统,该系统包括联邦服务器和多个联邦参与者,包括:联邦服务器根据联邦学习目标任务,编制联邦学习数据需求,联邦学习数据需求中的每个局部数据特征需求的需求数据格式为联邦学习目标任务规定的联邦学习所用的数据结构;多个联邦参与者根据接收到的局部数据特征需求,生成对应的OBDA映射文件,根据该OBDA映射文件,得到符合需求数据格式的局部数据特征;多个联邦参与者和联邦服务器利用局部数据特征,基于全局联邦学习模型,进行迭代训练,得到目标联邦学习模型;将待评估用户的数据输入任一的联邦参与者中的目标联邦学习模型,得到对该用户的信用评估结果。
-
公开(公告)号:CN120010550A
公开(公告)日:2025-05-16
申请号:CN202510473505.8
申请日:2025-04-16
Applicant: 北京大数据先进技术研究院
IPC: G05D1/695
Abstract: 本申请实施例公开了一种基于蚁狮优化的无人机集群任务分配方法、装置及介质,可以提升无人机集群任务分配的灵活性和全面性。该方法采用蚁狮优化算法解算任务分配结果,由此以多目标优化策略实现模型求解,并通过第一公式以将随机边界策略应用至蚁狮优化算法中,从而增加算法的多样性,提高算法的全局搜索能力,并保证解的多样性。
-
-
-
-
-
-
-
-
-