一种基于线性代数的个性化网页排名方法及系统

    公开(公告)号:CN116226525A

    公开(公告)日:2023-06-06

    申请号:CN202310194387.8

    申请日:2023-03-02

    Abstract: 本发明公开了一种基于线性代数的个性化网页排名方法及系统,将图表示为邻接矩阵并进行代数计算,实现良好的并行性从而高效计算个性化网页排名。具体为:以一组网页对应的原始图数据作为输入网页集,起始网页集为输入网页集的子集,根据原始图数据构建图邻接矩阵。在图邻接矩阵上使用代数Trim‑1方法发现节点数为1的强连通分量并对邻接矩阵进行重构,得到使用重构的邻接矩阵表示的图。使用基于代数广度优先搜索的代数FW‑BW算法来寻找图中的最大强连通分量。使用基于矩阵乘法的代数标签传播算法来寻找使用邻接矩阵表示的图中的强连通分量。在重构的有向无环图上利用PM算法计算个性化网页排名,用于表明网页与起始网页集的关联紧密程度。

    区块链下的支持多种数据类型的统一表达与发布方法

    公开(公告)号:CN116226149A

    公开(公告)日:2023-06-06

    申请号:CN202310216219.4

    申请日:2023-03-02

    Abstract: 本发明涉及区块链下的支持多种数据类型的统一表达与发布方法,属于计算机区块链技术领域,更具体的说是涉及一种基于区块链的面向关系型数据、图式数据、文本数据、键值数据的统一表达与发布方法。本发明实现了执行和共识阶段的高度并发,并采用了混合存储的方式压缩存储开销,以实现低开销、高性能和高可扩展性,并通过设计分布式应用协作索引进行并发控制,在不需要额外通信开销的前提下保证各节点的一致性与提交结果的可序列化。本发明中设计的数据统一表达与发布方法及相关工作流程能够为制造业后续流程中的数据管理、索引设计等任务提供基础,并可广泛迁移至其他对安全性、机密性及数据统一表达的应用情景中。

    一种优化网络多连接的系统和方法

    公开(公告)号:CN110750560B

    公开(公告)日:2023-02-03

    申请号:CN201911021143.X

    申请日:2019-10-25

    Abstract: 本发明公开一种优化网络多连接的系统和方法,属于大数据处理技术领域。该系统包括基于数据字典的连接预算模块和逻辑图重构模块,其中基于数据字典的连接预算模块包括等深直方图生成单元和统计信息管理单元,并基于数据字典设计连接预算模型来描述数据分布质量s,用于连接逻辑图重构模块;逻辑图重构模块又分为连接顺序重排单元和DAG重构单元,运用该系统进行网络多连接优化的方法采用了启发式MMAS算法,保证在相对低的时间复杂度内得到近似最优解,大幅降低了多数据集连接计算的时间,解决现有技术中无法自动优化多连接顺序的问题,能够有效地减少程序的执行时间和网络传输、IO吞吐。

    一种面向数据湖的多表语义连接方法

    公开(公告)号:CN115017151A

    公开(公告)日:2022-09-06

    申请号:CN202210413337.X

    申请日:2022-04-20

    Abstract: 本发明提供的一种面向数据湖的多表语义连接方法,基于两个构建列嵌入向量模型构建孪生网络模型,将步骤一获得新表格,根据给定的标签,组建表格对;将多组表格对输入到孪生网络模型中,对其进行训练,因此只需要提供表格具有基本的内容信息就能够进行表格的可连接性预测,并快速计算出结果;该方法没有多余的预处理不需要额外的计算步骤,且设计简单容易实现,提高了多表语义连接方法和预测模型的效率,具备良好的可扩展性、鲁棒性和稳定性;采用Simhash对表格内的行进行抽样,只需按照相同的比例重新构造一张数据行更少的新表格作为输入,这既可以减小表格的输入规模,又可以最大限度的保留表格的特征。

    一种图像文本匹配的方法
    98.
    发明公开

    公开(公告)号:CN114743029A

    公开(公告)日:2022-07-12

    申请号:CN202210394752.5

    申请日:2022-04-14

    Abstract: 本发明提供了一种图像文本匹配的方法,包括:利用深度神经网络分别提取多尺度的图像特征和文本特征;利用自注意力机制方法计算多个尺度的全局相似性;进行节点级匹配和结构级匹配,利用结构级匹配结果计算多个尺度的局部相似性;根据计算出的多个尺度的全局相似性和局部相似性计算最终总相似性;进行监督学习模型训练,根据损失函数更新模型参数,得到训练后的模型;利用训练后的模型计算输入图像和文本的最终总相似性,根据最终总相似性大小得到匹配的文本或图像。本发明可以在网络训练完成的前提下更快速地找出匹配的图像或文本;利用原始数据的多尺度特征以及更全面的相似性度量方法得到更准确的结果。

    一种跨链系统的数据并行查询方法及装置

    公开(公告)号:CN114579611B

    公开(公告)日:2022-07-05

    申请号:CN202210478504.9

    申请日:2022-05-05

    Abstract: 本文涉及区块链数据查询领域,提供了一种跨链系统的数据并行查询方法及装置,方法包括:解析各源区块链发送的总查询请求得到同构总查询请求;将各同构总查询请求中的查询内容拆分为子查询请求;根据同构总查询请求及子查询请求,修改查询请求管理表及查询队列表;将查询队列表中子查询请求类型标识及子查询请求转换为目的区块链识别格式后发送至目的区块链;接收目的区块链发送的查询结果,根据查询结果修改链查询请求管理表及查询队列表;根据查询请求管理表,将同构总查询请求对应的子查询请求状态均为查询成功的查询结果进行汇总及格式转换后,发送至相关源区块链。本文能够实现跨链区块链查询高效并行处理,保证一致性及安全性。

    一种Gaia系统中基于数据特征的动态优先级迭代器

    公开(公告)号:CN112527483B

    公开(公告)日:2022-06-10

    申请号:CN202011473342.7

    申请日:2020-12-15

    Abstract: 本发明提供一种Gaia系统中基于数据特征的动态优先级迭代器,涉及分布式大数据计算技术领域。该迭代器包括优先级调度模块、全量迭代计算模块和增量迭代计算模块;优先级调度模块读取数据源的数据作为迭代计算的初始工作集,并在每次迭代任务执行过程中维护一个用于查找和选择数据单元的跳表,以及一个用于保存数据单元对应的状态信息的状态表;并在每次迭代任务开始时按照优先级调整公式来更新状态表,当本次迭代任务所输入的数据单元全部更新完后,确定每个数据单元的优先级;Gaia系统则根据各个数据单元的优先级信息进行迭代计算;全量迭代模块由BulkIterate算子实现迭代计算,增量迭代模块由Delta Itreate算子实现迭代计算。

Patent Agency Ranking