-
公开(公告)号:CN112948712B
公开(公告)日:2022-03-25
申请号:CN202110326914.7
申请日:2021-03-26
Applicant: 北京理工大学
IPC: G06F16/9536 , G06F16/901
Abstract: 本发明公开了一种可重叠的社群发现方法,步骤如下:S1分布式计算图G中的所有极大团,统计极大团的数量信息并将极大团的数量信息发送到所有计算节点中;S2对所有的极大团进行排序和编码,给每个极大团分配唯一的编码确定极大团;S3计算极大团中的子团,将子团发送到不同计算节点中;S4在每个计算节点内,构建反向索引;S5对每个极大团,利用反向索引,计算与每个极大团与其同一个计算节点内有k‑1个共享顶点的极大团,使用并查集将极大团的I D保存在同一个集合中;S6合并不同集群中的并查集,求出相应的派系。采用上述结构的一种可重叠的社群发现方法,增加了系统对大图的处理能力,横向扩展更加容易且成本更低。
-
公开(公告)号:CN114168803A
公开(公告)日:2022-03-11
申请号:CN202111530839.2
申请日:2021-12-14
Applicant: 北京理工大学
IPC: G06F16/901 , G06F16/9536 , G06Q50/00
Abstract: 本发明公开了一种基于三角形的超图稠密度度量方法,步骤如下:S1、输入超图HG=(V,EH),初始化集合S为空,集合S为Set,不可添加相同元素;S2、按序号从小到大遍历超图中所有的超边,对每条超边进行操作。本发明采用上述的一种基于三角形的超图稠密度度量方法,可以计算超图中存在的三角形个数并枚举所有三角形,可以应用于社区发现,高阶的超图分析,超图的稠密度计算,衡量社区是否紧密等领域。本发明提供了一种新型的超图三角形定义,并实现了一种高效的方案来度量超图稠密度的指标。
-
公开(公告)号:CN111382316A
公开(公告)日:2020-07-07
申请号:CN202010151472.2
申请日:2020-03-06
Applicant: 北京理工大学
IPC: G06F16/901 , G06F16/90
Abstract: 本发明公开了一种基于位图近似的h-跳距离核分解方法,可用于许多大数据处理相关的应用,例如社交网络分析,合作网络分析及web网络分析等。本发明提出了基于位图近似的h-跳距离核分解方法,来提高大图处理的效率,该方法不仅使内存消耗还是时间消耗均得到了极大的改善,尤其是在时间效率上能够提升一到两个数量至多。该方法基于位图的存储技术来提高算法的时间和空间效率,而且精确算法在处理大图数据也相当困难的同时,本发明实施例在保证一定准确度的同时,大幅度提升算法的计算效率,以更高效率处理大数据。
-
公开(公告)号:CN110825775A
公开(公告)日:2020-02-21
申请号:CN201911067510.X
申请日:2019-11-04
IPC: G06F16/2455 , G06F16/25
Abstract: 本发明公开了一种Gaia系统中支持流数据与批数据交互的数据交换系统,实现了在Gaia的低纬度算子级的流数据与批数据连接,并且可实现对指定数据库的定向支持。为达到上述目的,该系统包括操作符模块、核心算子模块、批数据定义模块、缓存模块以及外部数据接口模块。该系统中其中批数据定义模块、缓存模块、核心算子模块可以分别从辅助工具模块中获取自己需要的工具类;核心算子模块通过调用批数据定义模块获取连接相关信息,并调用外部数据接口模块从不同数据源中获取批数据,调用缓存模块对数据进行缓存操作。操作符模块对核心算子模块和批数据定义模块进行了外部封装,使得Gaia系统可以进行统一调用。
-
公开(公告)号:CN114840772B
公开(公告)日:2025-03-14
申请号:CN202210414011.9
申请日:2022-04-14
Applicant: 北京理工大学
IPC: G06F16/9536 , G06F16/9538 , G06N3/042 , G06N3/045 , G06N3/0985 , G06Q50/00 , G06N3/048
Abstract: 本发明公开了一种基于同质超图注意力网络的个性化排序与推荐的方法;包括:获取当前所有用户与项目的交互图数据;根据该交互图数据以及项目阶数,计算当前所有用户与项目的最终超图邻接矩阵、结点度矩阵和超边度矩阵;基于此,结合项目表示矩阵,计算出用户表示传播序列;基于此,再通过注意力机制对序列加权计算并过滤得出用户表征矩阵;根据从用户表征矩阵中抽取的目标用户表示,同时结合目标用户的查询表示,对候选项目序列中的候选项进行评分并排序;按照排序之后的候选项目序列对目标用户进行推荐;通过该方法能够确保推荐系统在实现有效推荐的前提下,优化模型架构,减少参数数量,从而提高模型推荐效率。
-
公开(公告)号:CN118227653A
公开(公告)日:2024-06-21
申请号:CN202410434738.2
申请日:2024-04-11
Applicant: 北京理工大学
IPC: G06F16/242 , G06F16/2457 , G06F16/28 , G06N5/022 , G06F16/2453
Abstract: 本发明公开了一种全链路的自然语言转换为结构化查询语言的方法,属于数据处理领域,包括以下步骤:S1、采用现有语料和提示工程预训练开源大语言模型;S2、基于知识图谱构建针对具体应用场景的NL2SQL语料库,获取训练集和测试集;S3、获得最佳开源大语言模型;S4、向最佳开源大语言模型中输入自然语言,查询并生成SQL语句。本发明采用上述全链路的自然语言转换为结构化查询语言的方法,结合知识图谱的结构化知识和开源大语言模型的强大自然语言处理能力,能够更好地理解查询中的实体和它们之间的关系,从而精准地捕捉用户的查询意图,即使在面对复杂或模糊的查询时也能保持较高的理解准确率。
-
公开(公告)号:CN115238075B
公开(公告)日:2023-04-07
申请号:CN202210912341.0
申请日:2022-07-30
Applicant: 北京理工大学
Abstract: 本发明公开了基于超图池化的文本情感分类方法,将文本数据转化为文本超图,然后输入到超图模型中;超图模型设置有三个模块,每个模块均分为卷积层、池化层和读出层,且前一个模块输出的超图数据输入到后一个模块继续计算;超图卷积层通过超图卷积更新节点特征;超图池化层通过多层感知器线性变换得到节点重要度评分,并通过PageRank算法得到超边重要度评分,然后根据综合得分过滤节点;超图读出层读取每个维度节点特征的最大值和平均值,并进行求和;最后,将三个模块的读出层数值求和得到最终的文本超图特征表示,然后送入线性层进行文本情感分类。本发明采用上述文本情感分类方法,能够得到准确的文本情感信息,在情感分类任务中得到良好的表现效果。
-
公开(公告)号:CN111680311B
公开(公告)日:2022-12-20
申请号:CN202010470037.6
申请日:2020-05-28
Applicant: 北京理工大学
Abstract: 本发明公开的一种基于区块链的数据交换系统及方法,该系统包括:注册节点模块、要约邀请模块、要约响应模块、数据加密模块、数据验证模块、私钥分发模块、私钥验证模块和数据互换模块。基于区块链技术,全程留痕,可存证,实现了数据交易双方无需知晓对方身份就可实现公平交易;数据碎片化的验证,方便对方在不获得整个数据文件的情况下对文件进行真实性验证;随机选取可信第三方群成员,保障交易双方的安全;由于可信第三方群的选取是随机的,交易双方均无法掌控,且联合多数群成员共同作恶的难度较大,保障了交易双方无论交易成功与否时刻是均势;同时为了提高可信第三方群成员的积极性,采用悬赏的方式提高参与度,保证交易正常进行。
-
公开(公告)号:CN115238075A
公开(公告)日:2022-10-25
申请号:CN202210912341.0
申请日:2022-07-30
Applicant: 北京理工大学
Abstract: 本发明公开了基于超图池化的文本情感分类方法,将文本数据转化为文本超图,然后输入到超图模型中;超图模型设置有三个模块,每个模块均分为卷积层、池化层和读出层,且前一个模块输出的超图数据输入到后一个模块继续计算;超图卷积层通过超图卷积更新节点特征;超图池化层通过多层感知器线性变换得到节点重要度评分,并通过PageRank算法得到超边重要度评分,然后根据综合得分过滤节点;超图读出层读取每个维度节点特征的最大值和平均值,并进行求和;最后,将三个模块的读出层数值求和得到最终的文本超图特征表示,然后送入线性层进行文本情感分类。本发明采用上述文本情感分类方法,能够得到准确的文本情感信息,在情感分类任务中得到良好的表现效果。
-
公开(公告)号:CN110908796B
公开(公告)日:2022-03-18
申请号:CN201911067587.7
申请日:2019-11-04
IPC: G06F9/50
Abstract: 本发明公开了一种Gaia系统中的多作业合并与优化系统及方法,属于大数据处理技术领域,解决了Gaia系统中用户作业和用户指定的资源大小方面的不匹配问题。本发明方案为:代理层通过集群交互层与集群进行数据交互。代理层,包括:作业信息采集模块,用于收集用户提交的作业,解析获得作业信息;作业分类模块,用于根据作业信息将作业分类为可合并型作业和不可合并型作业并送入作业缓冲池进行缓冲存储;作业合并模块,用于提取作业缓冲池中的可合并型作业进行合并,得到合并后的作业送入作业优化模块。作业优化模块,用于对合并后的作业进行优化,优化后的作业送入作业缓冲池进行缓冲存储。集群通过集群交互层从作业缓冲池中读取优化后的作业并执行。
-
-
-
-
-
-
-
-
-