-
公开(公告)号:CN101841557B
公开(公告)日:2013-01-02
申请号:CN201010117154.0
申请日:2010-03-02
Applicant: 中国科学院计算技术研究所
IPC: H04N21/63 , H04N21/239 , H04L29/08 , H04L29/06
Abstract: 本发明公开了一种基于十字链表的P2P流媒体下载方法和系统。所述方法,包括下列步骤:用户节点采用十字链表数据结构为每个邻居节点维护一个邻居节点下载任务队列,为每个数据分片维护一个数据分片下载任务队列,并将两个队列存储于用户节点本身;所述用户节点在拥有预备下载的数据分片的邻居节点集合中,选择所述用户节点本地所维护的下载任务十字链表中相应邻居节点的下载任务队列中所有任务的估计完成时间最小的邻居节点,将该下载任务交给该节点完成所述数据分片的下载任务,同时更新所述邻居节点下载任务队列和数据分片下载任务队列。
-
公开(公告)号:CN101697553B
公开(公告)日:2012-07-11
申请号:CN200910235678.7
申请日:2009-10-12
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种P2P环境下的数据传输方法,包括:对所要传输数据做分割后得到多组子数据流;在用户所登录的用户节点以及该用户节点的邻居节点上维护推送记录表,所述推送记录表用于记录所在节点所要推送以及所要接收的子数据流的信息;所述邻居节点按照随机的顺序将不同组的子数据流推送给所述用户节点,所述用户节点接收子数据流后结合所述推送记录表中的信息为所述邻居节点分配该邻居节点负责推送的子数据流;所述用户节点接收并保存所述邻居节点所推送的数据。本发明将推策略与拉策略相结合,能够尽可能地减少数据分片丢失情况的出现。本发明通过竞争机制实现子数据流的分配,能够减少冗余数据包的传输,提高整个系统的性能。
-
公开(公告)号:CN106503256A
公开(公告)日:2017-03-15
申请号:CN201611005521.1
申请日:2016-11-11
Applicant: 中国科学院计算技术研究所
CPC classification number: G06F17/30867 , G06Q50/01
Abstract: 本发明提供一种基于社交网络文档的热点信息挖掘方法,包括下列步骤:1)根据词项在热度统计窗口内的权重相对于该词项在语料库中的基准权重的波动程度,得出该词项在热度统计窗口内的热度;2)基于各个词项的热度排序,得出当前热度统计窗口内的热点词项。本发明能够提高社交网络中挖掘候选词的准确率;能够获得更准确的表达社交网络热点事件的语义。
-
公开(公告)号:CN103279482B
公开(公告)日:2015-05-13
申请号:CN201310143346.2
申请日:2013-04-23
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种面向微博客平台的社交朋友圈的挖掘方法及系统,其方法包括:步骤1,通过微博客平台所提供的数据接口得到待查看用户的朋友列表;步骤2,针对所述朋友列表中的每个朋友用户,通过微博客平台所提供的数据接口得到所述每个朋友用户的朋友列表;步骤3,计算所述待查看用户的朋友列表与所述每个朋友用户的朋友列表的邻里相似度;步骤4,取出邻里相似度大于指定阈值的朋友用户,作为所述待查看用户的现实朋友用户;步骤5,计算所述待查看用户与所述现实朋友用户所构成的有向连通图中的最强连通子图,所获得的每个最强连通子图构成所述待查看用户的社交朋友圈。本发明能够在海量用户中挖掘社交朋友圈。
-
公开(公告)号:CN103279479A
公开(公告)日:2013-09-04
申请号:CN201310138895.0
申请日:2013-04-19
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种面向微博客平台文本流的突发话题检测方法及系统,其中方法包括:步骤1,实时采集微博客平台的用户数据及用户生成消息数据,并提取出消息文本及配图;步骤2,设定时间窗口对所述消息文本进行划分,获得实时数据流和历史数据;步骤3,选取特征,进行流行度评估模型和长微博提取模型的训练;步骤4,对所述实时数据流利用所述流行度评估模型进行流行度评估,利用所述长微博提取模型进行长微博提取,并分别放入流行消息集合和长微博集合;步骤5,判断所述流行消息集合与所述长微博集合数量是否均达到预设的阈值,若达到,使用LDA模型或加权求和的方式进行话题提取对两个集合的数据提取突发话题,否则返回步骤1。
-
公开(公告)号:CN103198432A
公开(公告)日:2013-07-10
申请号:CN201310127459.3
申请日:2013-04-12
Applicant: 中国科学院计算技术研究所
IPC: G06Q50/00
Abstract: 本发明提供一种在线社会网络中网络群体的检测方法,所采集的节点集中随机选择一个节点,从所选节点的邻居节点中选择未与所选节点建立群关系的且收益最大的邻居节点并在该邻居节点与所选节点之间建立群关系;对所选节点进行策略更新,并重新计算由于所选节点的策略更新所影响到的所有节点的收益;不断上述步骤,直到所述节点集中没有收益可改进的节点时,输出节点集中互相之间存在群关系的所有节点作为所检测的网络群体。该方法结合在线社会网络中节点的信息交互行为和节点间的社会关系,可以在在线社会关系网络中发现具有动态特性和行为因素影响的网络群体。
-
公开(公告)号:CN103150678A
公开(公告)日:2013-06-12
申请号:CN201310077524.6
申请日:2013-03-12
Applicant: 中国科学院计算技术研究所
IPC: G06Q50/00
Abstract: 本发明提供一种微博中用户间潜在关注关系的发现方法,包括:根据用户集和用户间关注关系集构建用户关注关系矩阵;计算用户关注关系矩阵的两个非负分解矩阵;根据两个非负矩阵的乘积以及用户关注关系矩阵得到潜在关注关系矩阵。本发明结合了微博中用户间的关注关系和用户间交互行为信息来发现潜在关注关系,能够减少发现用户间潜在关注关系的结果误差。
-
公开(公告)号:CN101841557A
公开(公告)日:2010-09-22
申请号:CN201010117154.0
申请日:2010-03-02
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种基于十字链表的P2P流媒体下载方法和系统。所述方法,包括下列步骤:用户节点采用十字链表数据结构为每个邻居节点维护一个邻居节点下载任务队列,为每个数据分片维护一个数据分片下载任务队列,并将两个队列存储于用户节点本身;所述用户节点在拥有预备下载的数据分片的邻居节点集合中,选择所述用户节点本地所维护的下载任务十字链表中相应邻居节点的下载任务队列中所有任务的估计完成时间最小的邻居节点,将该下载任务交给该节点完成所述数据分片的下载任务,同时更新所述邻居节点下载任务队列和数据分片下载任务队列。
-
公开(公告)号:CN101697553A
公开(公告)日:2010-04-21
申请号:CN200910235678.7
申请日:2009-10-12
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种P2P环境下的数据传输方法,包括:对所要传输数据做分割后得到多组子数据流;在用户所登录的用户节点以及该用户节点的邻居节点上维护推送记录表,所述推送记录表用于记录所在节点所要推送以及所要接收的子数据流的信息;所述邻居节点按照随机的顺序将不同组的子数据流推送给所述用户节点,所述用户节点接收子数据流后结合所述推送记录表中的信息为所述邻居节点分配该邻居节点负责推送的子数据流;所述用户节点接收并保存所述邻居节点所推送的数据。本发明将推策略与拉策略相结合,能够尽可能地减少数据分片丢失情况的出现。本发明通过竞争机制实现子数据流的分配,能够减少冗余数据包的传输,提高整个系统的性能。
-
公开(公告)号:CN106844416B
公开(公告)日:2019-11-29
申请号:CN201611024146.5
申请日:2016-11-17
Applicant: 中国科学院计算技术研究所
IPC: G06F16/332 , G06F17/27
Abstract: 本发明提供一种子话题挖掘方法,包括:1)对语料库中每篇文档的每个词语的主题值进行初始化;2)基于当前的各篇文档的各个词语的主题值,对于每篇文章中的每个词语,分别计算该词语来自各个子话题的概率以及计算该词语来自背景模块的概率,然后基于所计算出的概率,利用吉布斯采样算法重新为每篇文章中的每个词语分配主题值;其中,词语来自背景模块的概率根据预先统计的背景模块中的词语分布向量计算,所述背景模块中的词语分布向量在迭代过程中始终恒定;3)如果满足停止迭代的条件则根据当前的的主题值信息得出LDA子话题,如果否,则回到步骤2)。本发明能够显著地提升针对专题文章集合的话题挖掘效果。
-
-
-
-
-
-
-
-
-