-
公开(公告)号:CN103678519B
公开(公告)日:2017-03-29
申请号:CN201310618652.7
申请日:2013-11-29
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明公开了一种支持Hive DML(Data Manipulation Language)增强的混合存储系统及其方法,该存储系统基于DualTable表建立,包括:DualTable表创建模块和DualTable表执行模块;DualTable表创建模块用于建立包含主表和附表,为每行数据维护了唯一ID并基于代价模型对外提供特定操作集的DualTable表;DualTable表执行模块用于基于DualTable的主表和附表实现对DualTable表中的数据进行读取和查询,基于DualTable的附表实现对DualTable表中的数据进行更改,基于代价模型实现DualTable表提供的操作集,基于有序的每行数据唯一ID实现主表和附表数据读取时的合并。
-
公开(公告)号:CN104933139A
公开(公告)日:2015-09-23
申请号:CN201510337334.2
申请日:2015-06-17
Applicant: 中国科学院计算技术研究所
CPC classification number: G06F17/30864 , G06Q50/01
Abstract: 本发明提供一种社交网络用户身份虚实映射的方法及装置,涉及网络数据挖掘技术,能够较准确地推测出社交网络中个体用户的真实身份。所述方法包括:获取身份待定用户的三度好友并生成相应的社交网络拓扑结构图,所述三度好友包括所述身份待定用户的好友、好友的好友以及好友的好友的好友;在所述社交网络拓扑结构图中查找完全子图;根据所述完全子图中各身份已知的好友的身份特征属性,确定所述身份待定用户的身份特征属性。
-
公开(公告)号:CN104866558A
公开(公告)日:2015-08-26
申请号:CN201510252840.1
申请日:2015-05-18
Applicant: 中国科学院计算技术研究所
CPC classification number: G06F17/30598 , G06K9/66
Abstract: 本发明提供一种社交网络账号映射模型训练方法,包括:1)将映射关系已知的微博s账号集合中的任一个账号与微博t账号集合中的任一个账号进行两两组合构成训练集;2)对每一个账号组合提取账号组合特征向量,包括:该账号组合中两个账号各自的文本特征,两个账号在各自所属微博中的社交关系特征,以及两个账号的扩展共同邻居特征,扩展共同邻居是两个账号各自的邻居账号中,那些已知属于同一个自然人的邻居账号对;3)基于机器学习技术进行训练得到社交网络账号映射模型。本发明还提供了相应的社交网络账号映射方法及系统。本发明能够减少关系数据稀疏性对映射结果的不利影响,有效地提高社交网络账号映射的准确率。
-
公开(公告)号:CN103745014A
公开(公告)日:2014-04-23
申请号:CN201410042782.5
申请日:2014-01-29
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06Q50/01 , G06F17/3087
Abstract: 本发明提供一种社交网络用户虚实映射方法和系统,所述方法包括:根据社交网络用户的唯一标识获取该社交网络用户的地理位置信息,并且获取该地理位置信息对应的地理位置的周边单位名称列表;以及将所述周边单位名称列表中的每个单位名称与所述社交网络用户发布的消息内容进行匹配,根据匹配程度选择一个或多个单位名称。本发明可根据社交网络用户的唯一标识将该用户映射到一个或多个工作单位,提高了社交网络用户虚实映射的精确度。
-
公开(公告)号:CN103729474A
公开(公告)日:2014-04-16
申请号:CN201410032746.0
申请日:2014-01-23
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06F17/30705 , G06F17/30861
Abstract: 本发明提供了一种用于识别论坛用户马甲账号的方法。该方法基于训练集中各用户账号及每个文本的特征向量来训练分类模型,利用训练好的分类模型确定测试集中每个文本被分类到训练集中哪个用户账号,然后基于所述分类结果来识别马甲账号。该方法从论坛用户账号发言的文本数据中选取特征,通过挖掘账号的语言风格的相似性来判断属于同一人的多个账号间的关系,提高了识别马甲账号的概率。而且针对网络语言的语法不严谨,并且有许多的网络用语的特点,通过提取用户发言文本中有效的特征进行分析,规避了词库更新内容和速度跟不上网络语言的流行等问题,减少了维护分词词典的复杂操作,提高了马甲识别的准确率。
-
公开(公告)号:CN102497434A
公开(公告)日:2012-06-13
申请号:CN201110424401.6
申请日:2011-12-16
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种内核态虚拟网络设备的建立方法,包括:步骤1、虚拟机监控机扫描虚拟机用户态调用参数,对于参数中给出的每个虚拟网络设备,保存该虚拟网络设备的基本配置;步骤2、位于用户态的虚拟机监控机在初始化虚拟机上下文时,初始化虚拟机上下文内核态锁;和步骤3、来宾机的虚拟网络设备初始化过程中,在映射该设备的I/O端口或I/O内存映射地址时,根据所述虚拟网络设备基本配置,向内核注册虚拟网络设备结构。还提供一种基于内核态虚拟网络设备的网络包接收方法和发送方法。应用上述方法建立的虚拟设备,既避免了不必要的内核态/用户态切换开销和内核态/用户态数据拷贝开销,又具有较高的可扩展性和可操作性。
-
公开(公告)号:CN101005396B
公开(公告)日:2010-07-28
申请号:CN200610000955.2
申请日:2006-01-16
Applicant: 中国科学院计算技术研究所
Abstract: 一种网格环境下支持网格资源动态集成和协作的方法,包括以下步骤:事件模板创建步骤;事件订阅步骤;监听器部署和配置步骤;事件发送步骤;网格资源搜索步骤;协作请求事件发送步骤;服务端驱动步骤;操作结果监听/发送步骤;客户端管理域确定步骤;以及客户端驱动步骤。根据本发明,实时整合了企业内部和外部的资源,实现了这些资源之间的动态集成和协作,以应对外部多变的市场需求。
-
公开(公告)号:CN101005396A
公开(公告)日:2007-07-25
申请号:CN200610000955.2
申请日:2006-01-16
Applicant: 中国科学院计算技术研究所
Abstract: 一种网格环境下支持网格资源动态集成和协作的方法,包括以下步骤:事件模板创建步骤;事件订阅步骤;监听器部署和配置步骤;事件发送步骤;网格资源搜索步骤;协作请求事件发送步骤;服务端驱动步骤;操作结果监听/发送步骤;客户端管理域确定步骤;以及客户端驱动步骤。根据本发明,实时整合了企业内部和外部的资源,实现了这些资源之间的动态集成和协作,以应对外部多变的市场需求。
-
公开(公告)号:CN113516094B
公开(公告)日:2024-03-08
申请号:CN202110856600.8
申请日:2021-07-28
Applicant: 中国科学院计算技术研究所
IPC: G06V30/412 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
-
公开(公告)号:CN113051454B
公开(公告)日:2023-12-08
申请号:CN202110211500.X
申请日:2021-02-25
Applicant: 中国科学院计算技术研究所
IPC: G06F16/951
Abstract: 本发明提出一种基于学术网络的学者画像方法及系统,包括获取包括多类型节点的异质学术网络,并获取待画像识别学者的语义信息,通过在异质学术网络中选择符合语义信息的元路径,得到元路径集合,并为元路径集合中各元路径分配使用概率;根据学术网络中学者节点的度,得到从学者节点开始随机游走的采样长度,从元路径集合中根据使用概率选取元路径,并以选取的元路径对异质学术网络使用基于回退的随机游走采样,直到随机游走采样得到的节点序列长度达到采样长度,获得节点序列;将节点序列输入到Skip‑gram模型中获得特征向量,将特征向量投影到属性取值的概率空间,以选取概率值最大的属性作为待画像识别学者的画像识别结果。
-
-
-
-
-
-
-
-
-