-
公开(公告)号:CN110321377A
公开(公告)日:2019-10-11
申请号:CN201910340361.3
申请日:2019-04-25
Applicant: 北京科技大学
IPC: G06F16/25
Abstract: 本发明提供一种多源异构数据真值确定方法及装置,能够对异构冲突数据进行联合处理并提高真值发现的准确率。所述方法包括:S1,获取来自于不同数据源的异构冲突数据;S2,对描述同一对象的冲突数据,针对所有数据源的每一对象及所有对象,分别构建以最大化声明值可信性加权和为目标的目标函数G和优化模型F;S3,针对每一对象,采用基于穷举法的真值选择策略,更新所有数据源的权重;S4,根据更新后的所有数据源的权重,计算F值,根据得到的F值判断优化模型F是否收敛,若不收敛,返回S3继续执行;若收敛,则得到的所有对象的最优真值组成最优真值集。本发明涉及数据挖掘领域。
-
公开(公告)号:CN110119779A
公开(公告)日:2019-08-13
申请号:CN201910389140.5
申请日:2019-05-10
Applicant: 北京科技大学
IPC: G06K9/62
Abstract: 本发明实施例提出了一种基于自编码器的跨网络数据任意维度融合方法和装置,所述方法包括:获取不同网络的嵌入表示数据信息以及节点属性信息;对嵌入表示的数据与残缺节点属性信息进行拼接,构造深度自编码器模型;对构造的深度自编码器模型的目标函数进行优化,得到模型输出后的融合数据特征。本发明通过将不同网络的嵌入数据与残缺属性信息相融合,同时利用两者信息特征进行相互融合最终得出任意维度的融合数据。
-
公开(公告)号:CN110119779B
公开(公告)日:2022-03-04
申请号:CN201910389140.5
申请日:2019-05-10
Applicant: 北京科技大学
IPC: G06K9/62
Abstract: 本发明实施例提出了一种基于自编码器的跨网络数据任意维度融合方法和装置,所述方法包括:获取不同网络的嵌入表示数据信息以及节点属性信息;对嵌入表示的数据与残缺节点属性信息进行拼接,构造深度自编码器模型;对构造的深度自编码器模型的目标函数进行优化,得到模型输出后的融合数据特征。本发明通过将不同网络的嵌入数据与残缺属性信息相融合,同时利用两者信息特征进行相互融合最终得出任意维度的融合数据。
-
公开(公告)号:CN114117229A
公开(公告)日:2022-03-01
申请号:CN202111447363.6
申请日:2021-12-01
Applicant: 北京科技大学
IPC: G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于有向和无向结构信息的图神经网络的项目推荐方法,包括:根据会话序列图的邻接关系,利用图卷积网络提取图中的无向结构信息,利用门控图神经网络提取图中的有向结构信息,再计算得到中间项目隐含向量,对得到的中间项目隐含向量通过线性变换得到最终的项目隐含向量;给会话序列中出现的重复点击项目分配更高的注意力,并在生成项目隐含向量的时候引入注意力机制,根据项目间依赖的程度修改相应项目的权重系数。本发明使得生成的会话向量在推荐过程中预测得更准确。
-
公开(公告)号:CN110321377B
公开(公告)日:2021-07-23
申请号:CN201910340361.3
申请日:2019-04-25
Applicant: 北京科技大学
IPC: G06F16/25
Abstract: 本发明提供一种多源异构数据真值确定方法及装置,能够对异构冲突数据进行联合处理并提高真值发现的准确率。所述方法包括:S1,获取来自于不同数据源的异构冲突数据;S2,对描述同一对象的冲突数据,针对所有数据源的每一对象及所有对象,分别构建以最大化声明值可信性加权和为目标的目标函数G和优化模型F;S3,针对每一对象,采用基于穷举法的真值选择策略,更新所有数据源的权重;S4,根据更新后的所有数据源的权重,计算F值,根据得到的F值判断优化模型F是否收敛,若不收敛,返回S3继续执行;若收敛,则得到的所有对象的最优真值组成最优真值集。本发明涉及数据挖掘领域。
-
公开(公告)号:CN110134688B
公开(公告)日:2021-06-01
申请号:CN201910396670.2
申请日:2019-05-14
Applicant: 北京科技大学
Abstract: 本发明提供一种在线社交网络中热点事件数据存储管理方法及系统,针对在线社交网络热点事件数据所具有的数据量大、跨平台数据间存在差异性、数据类型多以及数据价值密度低的问题,分别提出了分布式文件系统存储数据策略、清洗并稀疏多平台数据策略、划分数据类别的多种存储模式策略以及多维度的数据存储模型策略。有效解决了因在线社交网络热点事件数据本身的数据特征所带来的数据存储问题,透明化了不同在线社交网络平台中的热点事件数据,为有关在线社交网络热点事件数据的相关研究提供了有效的数据支持。
-
公开(公告)号:CN110134688A
公开(公告)日:2019-08-16
申请号:CN201910396670.2
申请日:2019-05-14
Applicant: 北京科技大学
Abstract: 本发明提供一种在线社交网络中热点事件数据存储管理方法及系统,针对在线社交网络热点事件数据所具有的数据量大、跨平台数据间存在差异性、数据类型多以及数据价值密度低的问题,分别提出了分布式文件系统存储数据策略、清洗并稀疏多平台数据策略、划分数据类别的多种存储模式策略以及多维度的数据存储模型策略。有效解决了因在线社交网络热点事件数据本身的数据特征所带来的数据存储问题,透明化了不同在线社交网络平台中的热点事件数据,为有关在线社交网络热点事件数据的相关研究提供了有效的数据支持。
-
公开(公告)号:CN111611498B
公开(公告)日:2024-01-02
申请号:CN202010338851.2
申请日:2020-04-26
Applicant: 北京科技大学
IPC: G06F16/9536 , G06F40/30 , G06N3/042 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于领域内部语义的网络表示学习方法及系统,该方法包括获取图信息和标签信息;基于所获取的图信息和标签信息,通过读出函数,概括出每一个可见类对应的类语义描述向量;通过预设的网络模型探索图结构信息,并将网络模型的输出投影到语义向量空间和图结构空间中,并在其中通过预设的损失函数计算损失,对输出结果进行优化;基于优化后的结果,输出学习到的网络表示学习结果。本发明可以利用节点特征并处理多标签情况。为了利用完全不平衡的标签,本发明采用了一种新的目标函数来探索类语义知识。本发明中使用的类语义描述不依赖于人工注释或任何第三方资源,非常适合于实际应用程序。
-
公开(公告)号:CN111611498A
公开(公告)日:2020-09-01
申请号:CN202010338851.2
申请日:2020-04-26
Applicant: 北京科技大学
IPC: G06F16/9536 , G06F40/30 , G06N3/08 , G06N3/04
Abstract: 本发明提供一种基于领域内部语义的网络表示学习方法及系统,该方法包括获取图信息和标签信息;基于所获取的图信息和标签信息,通过读出函数,概括出每一个可见类对应的类语义描述向量;通过预设的网络模型探索图结构信息,并将网络模型的输出投影到语义向量空间和图结构空间中,并在其中通过预设的损失函数计算损失,对输出结果进行优化;基于优化后的结果,输出学习到的网络表示学习结果。本发明可以利用节点特征并处理多标签情况。为了利用完全不平衡的标签,本发明采用了一种新的目标函数来探索类语义知识。本发明中使用的类语义描述不依赖于人工注释或任何第三方资源,非常适合于实际应用程序。
-
-
-
-
-
-
-
-