-
公开(公告)号:CN113806630B
公开(公告)日:2024-06-14
申请号:CN202110896075.2
申请日:2021-08-05
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9535 , G06F16/9536 , G06F18/25
Abstract: 本发明公开了一种基于注意力的多视角特征融合跨域推荐方法及装置,包括利用公共用户在源域的域特性特征#imgabs0#公共用户与物品在目标域的域特性特征#imgabs1#与域特性特征IT、公共用户与物品在源域与目标域之间的潜在可迁移特征#imgabs2#与潜在可迁移特征#imgabs3#进行融合;基于融合结果进行训练;在最优模型的基础上,获取最优偏好预测集,以对公共用户进行目标域中的物品推荐。本发明解决了源域和目标域之间潜在可迁移特征的捕获问题,对不同类型的特征设置不同的权值,实现不同类型特征的有机结合和充分利用,进而提高推荐系统的性能。
-
公开(公告)号:CN113626723A
公开(公告)日:2021-11-09
申请号:CN202110777236.6
申请日:2021-07-09
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明涉及一种基于表示学习的属性图社区搜索方法和系统。该方法以查询节点为随机游走的起点,使用节点的属性信息和结构信息引导随机游走的跳转,获取节点序列和属性关键词序列;分别对节点序列和属性关键词序列进行节点的表示学习,获得节点的拓扑表示和属性表示,将其结合作为节点表示信息;根据节点之间的相似度对原始图数据进行重构,得到重构图;基于重构图和节点表示信息建立社区模型;以建立的社区模型为指导寻找满足要求的目标社区。本发明降低了计算的规模,表示学习过程更加契合社区搜索关注局部特性的特点,并融入了节点在社区层面的信息,提高了节点特征挖掘的准确度,建立的社区模型兼顾了发现社区的可解释性、质量和效率。
-
公开(公告)号:CN104572828B
公开(公告)日:2018-01-19
申请号:CN201410743826.7
申请日:2014-12-08
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种基于空间位图模型的辅助索引方法及系统,包括以下步骤:获取日志文件、文件编号及其中的关键字;选择任一关键字作为当前关键字;对当前关键字做检测;在重新申请的索引空间中插入当前的文件编号;判断当前关键字的索引空间中实际有效文件范围是否小于索引空间的预定临界值;保存有效文件范围内的所有索引信息;利用顺序后移指针记录插入位置及偏移量的信息;将临时有效文件范围指针与顺序后移指针整合成新的索引空间的信息;判断整合后的索引空间的信息里是否出现了三个关于偏移量的单增区间;结束处理。本发明能够节省内存空间,在置位率较低或者插入位置较靠近最大更新位置时效率较高,并且能够进行空间动态调整。
-
公开(公告)号:CN106909623A
公开(公告)日:2017-06-30
申请号:CN201710043645.7
申请日:2017-01-19
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明公开了一种支持高效海量数据分析和检索的数据装置及数据存储方法。本装置包括若干文件夹,在每一文件夹中包含多个索引分段;每一索引分段包括一全文索引组件、一数据定位模块和一数据存储模块;全文索引组件用于存储索引分段中的记录的倒排索引信息;数据存储模块,包含多个横向分块,每个横向分块包含多个列分片,每个列分片包含多个用于存储数据记录的数据页;数据定位模块,提供针对数据存储模块的嵌套索引结构,每个横向分块索引存储了横向分块记录起始Id、横向分块位置、各列分片的位置以及列分片索引集合;每个列分片索引记录了列分片中数据页起始位置和数据页索引集合;每个数据页索引记录了数据页所在文件位置和页记录起始Id。
-
公开(公告)号:CN104182522A
公开(公告)日:2014-12-03
申请号:CN201410425094.7
申请日:2014-08-26
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30144 , G06F17/30106 , G06F17/30117 , G06F17/30191 , G06F17/30324 , G06F17/30336 , G06F17/30442 , G06F17/30454
Abstract: 本发明涉及一种基于循环位图模型的辅助索引方法及装置,包括以下步骤:从日志文件生产队列里获取当前的日志文件及其文件编号,为该日志文件中的所有关键字分别建立循环位图;判断文件编号是否在索引范围起始位与索引范围结束位之间;检查文件编号是否在索引范围起始位与有效索引范围终点之间;在日志文件的文件编号处执行置位操作;对有效索引范围终点与索引范围结束位之间做复位操作,在待置位的文件编号处执行置位操作,并将有效索引范围终点赋值为索引范围结束位;等待直到文件生产队列中生成新的日志文件,执行步骤1。本发明不随日志编号增加而扩展内存使用空间,能够在客户端和服务器实现,并针对客户端提出基于流水线的提速模型。
-
公开(公告)号:CN113722608B
公开(公告)日:2024-03-22
申请号:CN202110825699.5
申请日:2021-07-21
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9536 , G06F16/9535
Abstract: 本发明公开了一种迭代副信息指导下基于关联关系学习的协同过滤方法及装置,将用户与物品的异质副信息集成到评分记录矩阵;利用生成的偏好预测矩阵,对每一用户进行物品推荐。本发明通过对用户和物品的不同类型的异质副信息进行重要性区分,利用神经因子分解机挖掘各个类型的异质副信息之间的关联关系,并通过迭代的指导充分发挥用户和物品的异质副信息的作用,从而实现对用户和物品的综合理解,提高用户对物品偏好预测的准确度。
-
公开(公告)号:CN104572828A
公开(公告)日:2015-04-29
申请号:CN201410743826.7
申请日:2014-12-08
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30094 , G06F17/30138
Abstract: 本发明涉及一种基于空间位图模型的辅助索引方法及系统,包括以下步骤:获取日志文件、文件编号及其中的关键字;选择任一关键字作为当前关键字;对当前关键字做检测;在重新申请的索引空间中插入当前的文件编号;判断当前关键字的索引空间中实际有效文件范围是否小于索引空间的预定临界值;保存有效文件范围内的所有索引信息;利用顺序后移指针记录插入位置及偏移量的信息;将临时有效文件范围指针与顺序后移指针整合成新的索引空间的信息;判断整合后的索引空间的信息里是否出现了三个关于偏移量的单增区间;结束处理。本发明能够节省内存空间,在置位率较低或者插入位置较靠近最大更新位置时效率较高,并且能够进行空间动态调整。
-
公开(公告)号:CN113806630A
公开(公告)日:2021-12-17
申请号:CN202110896075.2
申请日:2021-08-05
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9535 , G06F16/9536 , G06K9/62
Abstract: 本发明公开了一种基于注意力的多视角特征融合跨域推荐方法及装置,包括利用公共用户在源域的域特性特征公共用户与物品在目标域的域特性特征与域特性特征IT、公共用户与物品在源域与目标域之间的潜在可迁移特征与潜在可迁移特征进行融合;基于融合结果进行训练;在最优模型的基础上,获取最优偏好预测集,以对公共用户进行目标域中的物品推荐。本发明解决了源域和目标域之间潜在可迁移特征的捕获问题,对不同类型的特征设置不同的权值,实现不同类型特征的有机结合和充分利用,进而提高推荐系统的性能。
-
公开(公告)号:CN113722608A
公开(公告)日:2021-11-30
申请号:CN202110825699.5
申请日:2021-07-21
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9536 , G06F16/9535
Abstract: 本发明公开了一种迭代副信息指导下基于关联关系学习的协同过滤方法及装置,将用户与物品的异质副信息集成到评分记录矩阵;利用生成的偏好预测矩阵,对每一用户进行物品推荐。本发明通过对用户和物品的不同类型的异质副信息进行重要性区分,利用神经因子分解机挖掘各个类型的异质副信息之间的关联关系,并通过迭代的指导充分发挥用户和物品的异质副信息的作用,从而实现对用户和物品的综合理解,提高用户对物品偏好预测的准确度。
-
公开(公告)号:CN106909624A
公开(公告)日:2017-06-30
申请号:CN201710043943.6
申请日:2017-01-19
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明公开了一种海量数据实时排序优化方法。本方法为:1)设置一集群级节点、若干节点级节点和若干文件级节点;2)集群级节点将收到的检索排序请求发送给各节点级节点,各节点级节点将该检索排序请求发送给本节点的文件级节点;3)各文件级节点根据该检索排序请求,将与本节点相关的日志文件排序后输出有序数据给节点级节点;4)各节点级节点根据该检索排序请求将本节点上符合时间范围和分区条件的日志数据排序后输出给该集群级节点;5)该集群级节点将各节点级节点发送过来的有序数据流进行排序汇总。在任意的排序场景中,本方法都能有效降低内存使用量。
-
-
-
-
-
-
-
-
-