-
公开(公告)号:CN118503494B
公开(公告)日:2024-11-01
申请号:CN202410615911.9
申请日:2024-05-17
Applicant: 北京大数据先进技术研究院
IPC: G06F16/9032 , G06N5/022 , G06F16/903
Abstract: 本申请提供了一种面向多源异构知识库的大模型问答方法、装置和设备,涉及知识问答技术领域,该方法包括:获取用户输入的问题信息;利用关键信息抽取模型,从问题信息中提取关键信息,关键信息为问题信息中的实体;关键信息抽取模型为通过低秩自适应方法进行参数微调后的大模型;利用实体链接模型,将关键信息与多源异构知识库中的实体进行实体匹配,得到增量信息;多源异构知识库至少包括:图数据库、文本数据库、结构化知识库和非结构化知识库,实体链接模型是通过无监督SimCSE微调方法,对原始向量模型进行参数微调后得到的;使用知识问答模板对增量信息和问题信息进行拼接,输入原始问答模型,得到所述问题信息的答案。
-
公开(公告)号:CN118503494A
公开(公告)日:2024-08-16
申请号:CN202410615911.9
申请日:2024-05-17
Applicant: 北京大数据先进技术研究院
IPC: G06F16/9032 , G06N5/022 , G06F16/903
Abstract: 本申请提供了一种面向多源异构知识库的大模型问答方法、装置和设备,涉及知识问答技术领域,该方法包括:获取用户输入的问题信息;利用关键信息抽取模型,从问题信息中提取关键信息,关键信息为问题信息中的实体;关键信息抽取模型为通过低秩自适应方法进行参数微调后的大模型;利用实体链接模型,将关键信息与多源异构知识库中的实体进行实体匹配,得到增量信息;多源异构知识库至少包括:图数据库、文本数据库、结构化知识库和非结构化知识库,实体链接模型是通过无监督SimCSE微调方法,对原始向量模型进行参数微调后得到的;使用知识问答模板对增量信息和问题信息进行拼接,输入原始问答模型,得到所述问题信息的答案。
-
公开(公告)号:CN117056527A
公开(公告)日:2023-11-14
申请号:CN202310907909.4
申请日:2023-07-21
Applicant: 北京大数据先进技术研究院
IPC: G06F16/36 , G06F40/295 , G06N5/02 , G06F40/30
Abstract: 本申请实施例提供了一种知识图谱的准确性分析方法及装置,属于计算机技术领域。包括:从知识图谱中随机获取至少两个样本三元组,根据样本三元组的头实体与尾实体在知识图谱中的拓扑关系,获得包含与头实体和尾实体相关的子图的模型训练集,基于子图中的三元组对初始模型进行训练,获得用于分析知识图谱准确性的预测模型。紧接着通过预测模型对知识图谱中的样本三元组进行准确性评估,获得评估分数,并根据评估分数确定不满足预设条件的目标三元组。最后通过外部开源信息对目标三元组的内容进行验证,获得针对知识图谱的准确性分析结果。
-
公开(公告)号:CN116450908B
公开(公告)日:2023-10-03
申请号:CN202310726336.5
申请日:2023-06-19
Applicant: 北京大数据先进技术研究院
IPC: G06F16/904 , G06F16/901 , G06F16/906 , G06F16/907 , G06F16/25 , G06F16/26
Abstract: 本发明提供了一种基于数据湖的自助式数据分析方法、装置和电子设备,该方法应用于数据处理技术领域,该方法包括:对数据湖的元数据信息进行管理,创建元数据图数据库,所述元数据图数据库以图结构的方式对所述元数据信息进行存储;对所述数据湖的数据进行分区分类,生成数据资产地图,所述数据资产地图以图形化的方式展示数据资产的分布情况和各个数据资产之间的关系;根据所述元数据图数据库和所述数据资产地图,定位待分析数据;对所述待分析数据进行ETL作业,收集作业过程中的SQL语句信息;根据所述SQL语句信息,生成血缘图谱;根据所述血缘图谱,生成对所述待分析数据的分析结果。
-
公开(公告)号:CN118966231A
公开(公告)日:2024-11-15
申请号:CN202410937135.4
申请日:2024-07-12
Applicant: 北京大数据先进技术研究院
IPC: G06F40/30 , G06N3/0455 , G06N3/0442 , G06F16/35
Abstract: 本申请提供了一种基于多个共享向量模型的人格检测方法、系统和产品,涉及网络空间目标画像技术领域,获取待测用户的多个表达文本;所述多个表达文本为所述待测用户表达内容不同的文本信息;利用多个共享参数的向量模型对所述多个表达文本进行特征提取,得到所述待测用户的人格特征向量表示;将所述人格特征向量表示输入多专家系统,进行预测,得到所述待测用户的人格检测结果。
-
公开(公告)号:CN116049690B
公开(公告)日:2023-06-09
申请号:CN202310042929.X
申请日:2023-01-28
Applicant: 北京大数据先进技术研究院
IPC: G06F18/22 , G06F18/23213
Abstract: 本发明提供了一种移动目标的活动规律确定方法、装置、设备和介质,该方法包括:获取多个移动目标的时空动向信息;根据时空动向信息,确定每对移动目标的相似度;以每个移动目标为节点,连接每对相似度高于阈值的移动目标,构建时空特征网络;根据时空特征网络,获取每个移动目标的嵌入向量;根据嵌入向量的分布情况,确定各个移动目标属于低活跃度集合或高活跃度集合;根据移动目标所在的活跃度集合,和该移动目标的目标事件项,生成该移动目标的候选序列集;根据移动目标所在的活跃度集合,将候选序列集输入对应的序列模式挖掘模型,得到频繁序列模式集;根据频繁序列模式集,确定移动目标参与目标事件项的活动规律。
-
公开(公告)号:CN116049690A
公开(公告)日:2023-05-02
申请号:CN202310042929.X
申请日:2023-01-28
Applicant: 北京大数据先进技术研究院
IPC: G06F18/22 , G06F18/23213
Abstract: 本发明提供了一种移动目标的活动规律确定方法、装置、设备和介质,该方法包括:获取多个移动目标的时空动向信息;根据时空动向信息,确定每对移动目标的相似度;以每个移动目标为节点,连接每对相似度高于阈值的移动目标,构建时空特征网络;根据时空特征网络,获取每个移动目标的嵌入向量;根据嵌入向量的分布情况,确定各个移动目标属于低活跃度集合或高活跃度集合;根据移动目标所在的活跃度集合,和该移动目标的目标事件项,生成该移动目标的候选序列集;根据移动目标所在的活跃度集合,将候选序列集输入对应的序列模式挖掘模型,得到频繁序列模式集;根据频繁序列模式集,确定移动目标参与目标事件项的活动规律。
-
公开(公告)号:CN117094397B
公开(公告)日:2024-02-06
申请号:CN202311352557.7
申请日:2023-10-19
Applicant: 北京大数据先进技术研究院
Abstract: 本申请提供了一种基于短论元的细粒度事件信息抽取方法、装置和产品,涉及知识工程信息抽取技术领域,该方法为:利用短论元抽取模型,从待抽取文本中抽取得到事件短论元和所述事件短论元对应的触发词,所述事件短论元为事件论元中去除描述信息后的实体论元;利用短论元描述抽取模型,从所述待抽取文本中抽取得到短论元描述;所述短论元描述表示所述事件短论元的描述信息;将所述事件短论元、所述事件短论元对应的触发词和所述短论元描述进行匹配和递归,得到细粒度事件信息列表。
-
公开(公告)号:CN117094397A
公开(公告)日:2023-11-21
申请号:CN202311352557.7
申请日:2023-10-19
Applicant: 北京大数据先进技术研究院
Abstract: 本申请提供了一种基于短论元的细粒度事件信息抽取方法、装置和产品,涉及知识工程信息抽取技术领域,该方法为:利用短论元抽取模型,从待抽取文本中抽取得到事件短论元和所述事件短论元对应的触发词,所述事件短论元为事件论元中去除描述信息后的实体论元;利用短论元描述抽取模型,从所述待抽取文本中抽取得到短论元描述;所述短论元描述表示所述事件短论元的描述信息;将所述事件短论元、所述事件短论元对应的触发词和所述短论元描述进行匹配和递归,得到细粒度事件信息列表。
-
公开(公告)号:CN116450908A
公开(公告)日:2023-07-18
申请号:CN202310726336.5
申请日:2023-06-19
Applicant: 北京大数据先进技术研究院
IPC: G06F16/904 , G06F16/901 , G06F16/906 , G06F16/907 , G06F16/25 , G06F16/26
Abstract: 本发明提供了一种基于数据湖的自助式数据分析方法、装置和电子设备,该方法应用于数据处理技术领域,该方法包括:对数据湖的元数据信息进行管理,创建元数据图数据库,所述元数据图数据库以图结构的方式对所述元数据信息进行存储;对所述数据湖的数据进行分区分类,生成数据资产地图,所述数据资产地图以图形化的方式展示数据资产的分布情况和各个数据资产之间的关系;根据所述元数据图数据库和所述数据资产地图,定位待分析数据;对所述待分析数据进行ETL作业,收集作业过程中的SQL语句信息;根据所述SQL语句信息,生成血缘图谱;根据所述血缘图谱,生成对所述待分析数据的分析结果。
-
-
-
-
-
-
-
-
-