-
公开(公告)号:CN103514042B
公开(公告)日:2018-01-09
申请号:CN201210204459.4
申请日:2012-06-18
Applicant: 中国科学院计算机网络信息中心 , 北京北龙超级云计算有限公司
IPC: G06F9/50
Abstract: 本发明涉及一种双调归并排序调优方法及装置。根据GPU和CPU的运算能力,分配待排序数据集;GPU和CPU对各自分配的待排序数据集进行排序;其中,排序过程中,当GPU和CPU中的数据有无关性时,同时使用CPU和GPU分别排序,在两部分数据有相关性时,将数据汇集到GPU和CPU中的一个设备上排序。由此,可以更好的重叠计算、缩短双调归并排序的执行时间,提高执行效率。
-
公开(公告)号:CN102999477A
公开(公告)日:2013-03-27
申请号:CN201210563427.3
申请日:2012-12-21
Applicant: 中国科学院计算机网络信息中心
IPC: G06F17/18
Abstract: 本发明公开了一种基于MCMC的并行分类方法,包括:根据初始状态计算似然估计;根据似然估计计算出参数的后验概率;根据后验概率进行MCMC模拟运算,以当前状态为基础,产生新状态;根据新状态计算接受概率,并产生第一随机数,当第一随机数小于接受概率时,则下一时刻的状态为新状态,否则保持当前状态不变;产生同一列处理器中准备进行交换的马尔科夫链的标号;当处理器中的马尔科夫链参与了交换,则计算出交换概率,并产生第二随机数,判断交换概率和第二随机数的比较结果,当第二随机数小于交换概率时,则交换处理中的马尔科夫链的加热参数,否则交换不发生。本发明缩短了MC3算法和MCMC算法的执行时间,并减小了通讯开销。
-
公开(公告)号:CN103020258A
公开(公告)日:2013-04-03
申请号:CN201210564600.1
申请日:2012-12-21
Applicant: 中国科学院计算机网络信息中心
IPC: G06F17/30
Abstract: 本发明实施例涉及一种采用多核集群的LDA模型的训练方法、系统。方法包括:多核产生多个进程,每个进程均启动多个线程,用于分担处理多个训练文档;每个进程中的多个线程共同处理该进程负责处理的文档,每个线程给出其负责处理的文档的主题-词矩阵,该进程依据其所有线程给出的主题-矩阵得到该进程负责处理的文档的主题-词矩阵;根据所有的进程提供的主题-词矩阵得到所述多个训练文档的主题-词矩阵,并用该主题-词矩阵更新所述的LDA模型。本发明实施例采用多核并行处理,提高了主题-词矩阵的计算速度,有利于更快地更新LDA模型。
-
公开(公告)号:CN102750131A
公开(公告)日:2012-10-24
申请号:CN201210187386.2
申请日:2012-06-07
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明公开了一种面向GPU的双调排序方法和系统,通过一个线程操作向量来模拟多个比较器,多个线程并行执行归并排序,其中对同一个工作组内的线程同步使用同步函数来完成,对不同工作组内的线程同步通过CPU完成,进一步的可以使用多个向量来模拟更大长度向量,在排序过程中改变比较器操作数的写回地址,对内存读写进行优化。本发明在节省存储空间的基础上,有效地减少CPU和GPU之间的同步次数、减少执行指令的总量和延时、增加GPU计算单元的利用率。
-
公开(公告)号:CN103384205B
公开(公告)日:2016-05-25
申请号:CN201210134225.7
申请日:2012-05-02
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明涉及一种海量告警数据并行采集系统、装置及方法。所述系统包括主控机、至少一台采集机、至少一台告警采集代理服务器和至少一台待采集设备。主控机通过网线与采集机相连,采集机通过卫星网络或网线与告警采集代理服务器相连,告警采集代理服务器与至少一台待采集设备相连。主控机采用带宽资源目标和/或计算资源目标计算的双目标任务调度模式,确定一个采集任务触发周期内可以并行执行的采集子任务数,将采集子任务映射到采集机的物理处理单元,采集机通过告警采集代理服务器对待采集设备采集数据。本发明充分利用采集机的带宽资源和计算资源,提高了海量告警数据的采集效率。本发明的系统、装置及方法广泛适用于网络数据采集领域。
-
公开(公告)号:CN102999477B
公开(公告)日:2016-05-25
申请号:CN201210563427.3
申请日:2012-12-21
Applicant: 中国科学院计算机网络信息中心
IPC: G06F17/18
Abstract: 本发明公开了一种基于MCMC的并行分类方法,包括:根据初始状态计算似然估计;根据似然估计计算出参数的后验概率;根据后验概率进行MCMC模拟运算,以当前状态为基础,产生新状态;根据新状态计算接受概率,并产生第一随机数,当第一随机数小于接受概率时,则下一时刻的状态为新状态,否则保持当前状态不变;产生同一列处理器中准备进行交换的马尔科夫链的标号;当处理器中的马尔科夫链参与了交换,则计算出交换概率,并产生第二随机数,判断交换概率和第二随机数的比较结果,当第二随机数小于交换概率时,则交换处理中的马尔科夫链的加热参数,否则交换不发生。本发明缩短了MC3算法和MCMC算法的执行时间,并减小了通讯开销。
-
公开(公告)号:CN103514042A
公开(公告)日:2014-01-15
申请号:CN201210204459.4
申请日:2012-06-18
Applicant: 中国科学院计算机网络信息中心
IPC: G06F9/50
Abstract: 本发明涉及一种双调归并排序调优方法及装置。根据GPU和CPU的运算能力,分配待排序数据集;GPU和CPU对各自分配的待排序数据集进行排序;其中,排序过程中,当GPU和CPU中的数据有无关性时,同时使用CPU和GPU分别排序,在两部分数据有相关性时,将数据汇集到GPU和CPU中的一个设备上排序。由此,可以更好的重叠计算、缩短双调归并排序的执行时间,提高执行效率。
-
公开(公告)号:CN103384205A
公开(公告)日:2013-11-06
申请号:CN201210134225.7
申请日:2012-05-02
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明涉及一种海量告警数据并行采集系统、装置及方法。所述系统包括主控机、至少一台采集机、至少一台告警采集代理服务器和至少一台待采集设备。主控机通过网线与采集机相连,采集机通过卫星网络或网线与告警采集代理服务器相连,告警采集代理服务器与至少一台待采集设备相连。主控机采用带宽资源目标和/或计算资源目标计算的双目标任务调度模式,确定一个采集任务触发周期内可以并行执行的采集子任务数,将采集子任务映射到采集机的物理处理单元,采集机通过告警采集代理服务器对待采集设备采集数据。本发明充分利用采集机的带宽资源和计算资源,提高了海量告警数据的采集效率。本发明的系统、装置及方法广泛适用于网络数据采集领域。
-
-
-
-
-
-
-