-
公开(公告)号:CN118503494B
公开(公告)日:2024-11-01
申请号:CN202410615911.9
申请日:2024-05-17
Applicant: 北京大数据先进技术研究院
IPC: G06F16/9032 , G06N5/022 , G06F16/903
Abstract: 本申请提供了一种面向多源异构知识库的大模型问答方法、装置和设备,涉及知识问答技术领域,该方法包括:获取用户输入的问题信息;利用关键信息抽取模型,从问题信息中提取关键信息,关键信息为问题信息中的实体;关键信息抽取模型为通过低秩自适应方法进行参数微调后的大模型;利用实体链接模型,将关键信息与多源异构知识库中的实体进行实体匹配,得到增量信息;多源异构知识库至少包括:图数据库、文本数据库、结构化知识库和非结构化知识库,实体链接模型是通过无监督SimCSE微调方法,对原始向量模型进行参数微调后得到的;使用知识问答模板对增量信息和问题信息进行拼接,输入原始问答模型,得到所述问题信息的答案。
-
公开(公告)号:CN118262125B
公开(公告)日:2024-11-01
申请号:CN202410461353.5
申请日:2024-04-17
Applicant: 北京大数据先进技术研究院
IPC: G06V10/70 , G06V10/776 , G06V10/774 , G06V10/764 , G06V10/762 , G06N3/006
Abstract: 本申请公开了一种图像分类模型获取方法和图像分类方法、装置和设备,所述图像分类模型获取方法包括:生成包含多个模型参数组合的第一种群;基于目标图像数据集和模型参数组合,确定多个模型参数组合分别对应的评价指标;对第一种群包含的各个模型参数组合进行预设轮数的交叉变异,得到每轮交叉变异对应的第二种群并计算第二种群中包含的各个模型参数组合分别对应的评价指标;基于所获得的所有评价指标中的最大值对应的目标模型参数组合,从分类器库中提取与目标模型参数组合包含的权重参数对应的分类器进行组合,得到目标图像分类模型,能够随机生成并筛选最优的分类模型,提升了图像分类效果的稳定性。
-
公开(公告)号:CN118503494A
公开(公告)日:2024-08-16
申请号:CN202410615911.9
申请日:2024-05-17
Applicant: 北京大数据先进技术研究院
IPC: G06F16/9032 , G06N5/022 , G06F16/903
Abstract: 本申请提供了一种面向多源异构知识库的大模型问答方法、装置和设备,涉及知识问答技术领域,该方法包括:获取用户输入的问题信息;利用关键信息抽取模型,从问题信息中提取关键信息,关键信息为问题信息中的实体;关键信息抽取模型为通过低秩自适应方法进行参数微调后的大模型;利用实体链接模型,将关键信息与多源异构知识库中的实体进行实体匹配,得到增量信息;多源异构知识库至少包括:图数据库、文本数据库、结构化知识库和非结构化知识库,实体链接模型是通过无监督SimCSE微调方法,对原始向量模型进行参数微调后得到的;使用知识问答模板对增量信息和问题信息进行拼接,输入原始问答模型,得到所述问题信息的答案。
-
公开(公告)号:CN118395188A
公开(公告)日:2024-07-26
申请号:CN202410608919.2
申请日:2024-05-16
Applicant: 北京大数据先进技术研究院
IPC: G06F18/214 , G06N3/006 , G06F18/211 , G06F18/10 , G06F18/24
Abstract: 本发明关于一种基于粒子群算法的数据处理方法、装置、电子设备及介质,涉及网络技术领域,该方法通过获取待处理的初始网络数据集;对待填补特征对应的数据以及初始网络数据集包含的数据特征进行编码,以生成多个待更新粒子;针对任一待更新粒子,为待更新粒子生成适应度评估值;对多个待更新粒子分别进行更新,得到多个待更新粒子各自对应的更新后粒子;将各更新后粒子作为新的待更新粒子,并迭代执行上述生成适应度评估值、选取最优粒子以及对待更新粒子进行更新的操作,并在满足更新结束条件时,将当前的最优粒子确定为目标粒子;将基于目标粒子得到的填补后数据集,确定为最终的目标数据集。保证数据处理的有效性。
-
公开(公告)号:CN117972530A
公开(公告)日:2024-05-03
申请号:CN202410361825.X
申请日:2024-03-28
Applicant: 北京大数据先进技术研究院
IPC: G06F18/241 , G06F18/10 , G06F18/2431 , G06N3/006
Abstract: 本申请提供了一种基于蚁狮优化的缺失不平衡数据多分类方法和设备,该方法包括:基于目标场景下第一待分类数据集的缺失数据个数生成至少一个第一编码,基于第一待分类数据集的预设类别数和分类器库所包含的分类器的类别数生成多个第二编码,基于第一编码和各个第二编码生成多个迭代编码,基于蚁狮优化算法,从多个迭代编码中筛选得到适应度最大的目标迭代编码,从分类器库中抽取目标迭代编码对应的分类器进行组合,得到目标分类器群,基于目标分类器群识别第一待分类数据集的类别,能够根据待识别数据的特征类型生成多个迭代编码,采用蚁狮优化算法筛选最优迭代编码并生成相应的分类器群进行目标场景下的数据分类,提升了分类的灵活性和分类效果的稳定性。
-
公开(公告)号:CN117955898A
公开(公告)日:2024-04-30
申请号:CN202410353875.3
申请日:2024-03-27
Applicant: 北京大数据先进技术研究院
IPC: H04L45/02 , H04L45/247 , G06N3/006 , G06N3/126
Abstract: 本申请提供了一种面向数据共享网络的负载均衡优化方法、装置和产品,涉及数据共享与网络优化技术领域,方法包括:以业务应用程序为逻辑网络节点,进行逻辑网络互联,得到逻辑网络;以通信设备为物理网络节点,进行物理网络互联,得到物理网络;通过绑定链路将逻辑网络节点挂靠在对应的物理网络节点上,得到数据共享网络;进行主路径和备份路径的鲁棒性设计;基于遗传算法,将多个负载均衡优化方案编码为种群个体,生成初始化种群;设计目标函数与约束条件;执行遗传算法,使初始化种群在约束条件下进行种群进化,直至目标函数收敛,确定最优负载均衡优化方案;按照最优负载均衡优化方案,为逻辑链路,确定对应的主路径和备份路径,分配负载资源。
-
公开(公告)号:CN117056527A
公开(公告)日:2023-11-14
申请号:CN202310907909.4
申请日:2023-07-21
Applicant: 北京大数据先进技术研究院
IPC: G06F16/36 , G06F40/295 , G06N5/02 , G06F40/30
Abstract: 本申请实施例提供了一种知识图谱的准确性分析方法及装置,属于计算机技术领域。包括:从知识图谱中随机获取至少两个样本三元组,根据样本三元组的头实体与尾实体在知识图谱中的拓扑关系,获得包含与头实体和尾实体相关的子图的模型训练集,基于子图中的三元组对初始模型进行训练,获得用于分析知识图谱准确性的预测模型。紧接着通过预测模型对知识图谱中的样本三元组进行准确性评估,获得评估分数,并根据评估分数确定不满足预设条件的目标三元组。最后通过外部开源信息对目标三元组的内容进行验证,获得针对知识图谱的准确性分析结果。
-
公开(公告)号:CN116450908B
公开(公告)日:2023-10-03
申请号:CN202310726336.5
申请日:2023-06-19
Applicant: 北京大数据先进技术研究院
IPC: G06F16/904 , G06F16/901 , G06F16/906 , G06F16/907 , G06F16/25 , G06F16/26
Abstract: 本发明提供了一种基于数据湖的自助式数据分析方法、装置和电子设备,该方法应用于数据处理技术领域,该方法包括:对数据湖的元数据信息进行管理,创建元数据图数据库,所述元数据图数据库以图结构的方式对所述元数据信息进行存储;对所述数据湖的数据进行分区分类,生成数据资产地图,所述数据资产地图以图形化的方式展示数据资产的分布情况和各个数据资产之间的关系;根据所述元数据图数据库和所述数据资产地图,定位待分析数据;对所述待分析数据进行ETL作业,收集作业过程中的SQL语句信息;根据所述SQL语句信息,生成血缘图谱;根据所述血缘图谱,生成对所述待分析数据的分析结果。
-
公开(公告)号:CN115203440B
公开(公告)日:2023-02-03
申请号:CN202211125561.5
申请日:2022-09-16
Applicant: 北京大数据先进技术研究院
IPC: G06F16/36 , G06F40/295 , G06F40/30
Abstract: 本申请公开了一种面向时空动向数据的事件图谱构建方法、装置及电子设备,该方法包括:构建时空动向事件本体模型,包括具有时空动向属性的实体模型、事件模型和关系模型;获取目标领域的时空动向数据;基于时空动向事件本体模型,利用预设时空动向事件识别策略对时空动向数据进行识别,得到时空动向数据对应的时空动向事件类型和事件元素;对时空动向数据对应的时空动向事件进行融合,得到面向时空动向数据的事件图谱。本申请基于时空动向数据构建了能够表征事件和实体随时空动向变化的事件图谱,可支持事件、节点、关系、路径的搜索和计算,满足了时空动向数据的语义搜索需求,实现了对时空动向事件的深度认知,为情报分析等领域提供了重要支撑。
-
公开(公告)号:CN119991919A
公开(公告)日:2025-05-13
申请号:CN202510466352.4
申请日:2025-04-15
Applicant: 北京大数据先进技术研究院
IPC: G06T15/20 , G06T15/04 , G06T3/4038 , G06T5/77
Abstract: 本公开提供了一种跨设备渲染方法、装置、设备和介质。旨在解决相关技术中三维高斯溅射模型泛化能力差的问题。所述方法包括:获取来自不同相机设备的原始图像;根据所述原始图像对应的原始相机模型与中间相机模型的映射关系,将所述原始图像转为中间图像,所述中间图像携带对应的中间位姿;根据所述中间图像和对应的中间位姿,构建三维高斯溅射模型;根据目标中间图像的渲染方向,利用所述三维高斯溅射模型渲染得到目标中间图像,并将所述目标中间图像逆映射到目标原始图像对应的逆映射区域,得到所述目标原始图像。
-
-
-
-
-
-
-
-
-