一种异构并行程序自动移植和优化方法

    公开(公告)号:CN111966397B

    公开(公告)日:2025-01-07

    申请号:CN202010710022.2

    申请日:2020-07-22

    Abstract: 一种异构并行程序自动移植和优化方法,属于异构并行程序开发技术。本发明是为了实现CPU并行程序自动移植、在减轻开发人员工作负担的同时提高程序性能,从而解决并行指令转换、数据传输管理及优化问题。技术要点:构建异构并行程序自动移植系统的框架,异构并行程序自动移植系统用于将OpenMP CPU并行程序自动翻译为OpenMP Offloading异构并行程序;一致性状态转换形式化,保证数据一致性的前提下,优化传输操作,减少冗余数据传输;运行时库设计,运行时库用于提供自动数据传输管理和优化功能,维护每个变量内存区域一致性状态;源到源翻译器设计,翻译器用于自动转换并行指令及自动插入运行时API。该方法可以自动识别CPU并行指令并转换为加速器并行指令,提高程序性能。

    一种基于传播路径间与传播路径内影响力建模的信息传播预测方法及系统

    公开(公告)号:CN115660147B

    公开(公告)日:2024-10-15

    申请号:CN202211171903.7

    申请日:2022-09-26

    Abstract: 一种基于传播路径间与传播路径内影响力建模的信息传播预测方法及系统,涉及信息传播预测技术领域,用以解决在一段时间之后信息在社交网络中流行度增长量的预测问题。本发明的技术要点包括:使用图神经网络对级联图进行建模,得到聚合邻居节点状态与特征的节点表示;通过深度游走算法对整体级联网络图进行采样,获得级联图的序列集合,将图形神经网络嵌入表示与Deepwalk嵌入表示进行拼接来更新序列中各个节点的信息;将附有邻居信息的节点表示序列输入双向LSTM中,同时将时序信息经过注意力机制引导对序列进行整合,增强了级联预测模型的理解能力与预测能力。本发明兼顾级联传播路径间与传播路径内影响力传递性,以及纳入时序与结构因素互补性的有效性。

    一种基于多特征融合的新闻推荐方法及装置

    公开(公告)号:CN112182351B

    公开(公告)日:2024-08-13

    申请号:CN202011042260.7

    申请日:2020-09-28

    Abstract: 本申请公开了一种基于多特征融合的新闻推荐方法,该方法包括:在达到向目标用户进行新闻推荐的触发条件时,获得待推荐新闻集合中每条待推荐新闻的多特征向量;确定目标用户的用户画像;基于用户画像与待推荐新闻集合中每条待推荐新闻的主题特征向量,确定第一推荐结果;基于目标用户的当前浏览新闻与待推荐新闻集合中每条待推荐新闻的关键词向量、标题与摘要特征向量,确定第二推荐结果;根据第一推荐结果和第二推荐结果,确定最终推荐结果,并推荐给目标用户。应用本申请所提供的技术方案,推荐给用户的新闻更符合用户的兴趣,更有针对性,提升了用户的浏览体验。本申请还公开了一种基于多特征融合的新闻推荐装置,具有相应技术效果。

    一种基于图神经网络的多行为社会化推荐方法及系统

    公开(公告)号:CN117171448B

    公开(公告)日:2024-05-28

    申请号:CN202311015948.X

    申请日:2023-08-11

    Abstract: 一种基于图神经网络的多行为社会化推荐方法及系统,涉及推荐技术领域,为了解决现在的推荐方法没有区分与交互行为相关联的信任传播过程。本发明提出一个多行为社会化推荐框架MB‑Soc模型,该模型将细粒度的多行为信息集成到社交推荐架构中,MB‑Soc架构由四个主要部分组成:嵌入层、传播层、多行为集成层和预测层。本发明提出了一种全新的多行为社会化推荐框架MB‑Soc来探索社交推荐中的细粒度信任传播过程,对实体的多种类行为在社交网络中的传播进行区分,并完成在社会化推荐场景下的差分化传播。本发明完成了在真实数据集上的可扩展实验,大量实验证明了本发明所提出的MB‑Soc模型的优越性和有效性。

    一种无模型的GPU在线能效优化方法及系统

    公开(公告)号:CN117891677A

    公开(公告)日:2024-04-16

    申请号:CN202310843318.5

    申请日:2023-07-10

    Abstract: 一种无模型的GPU在线能效优化方法及系统,属于计算机能效优化技术,为了实现GPU在线自动能效优化而提出。技术要点:性能基准在线测量,在默认频率配置下全面收集GPU kernel活动信息,设计覆盖度指标,评估收集信息的完备度;应用性能在线评估,在某种特定频率配置下收集GPU kernel活动信息,通过比较此时的GPU kernel活动信息与默认配置下的对应GPU kernel活动信息,设计复合性能指标,来在线评估当前频率配置下的相对性能;基于PID的频率调节算法,使用经典的离散PID控制器,将性能损失设为控制目标,在性能损失约束范围内,尝试降低频率以优化性能;控制稳定判定算法,通过最近几次控制的结果判断PID控制稳定性,若稳定则暂停控制以减小开销;应用负载变化检测算法,测量低开销GPU运行特征向量,设计算法比较特征向量之间的距离,以检测应用负载变化,若发生负载变化则重启PID控制。降低GPU能耗,提高GPU能效,减少碳排放。

    一种基于图结构的多源迁移学习方法

    公开(公告)号:CN112085085B

    公开(公告)日:2024-02-23

    申请号:CN202010917529.5

    申请日:2020-09-03

    Abstract: 一种基于图结构的多源迁移学习方法,属于人工智能领域,为了解决单纯利用图结构数据的节点实体特征不能准确预测目标域节点标签的问题。该方法通过构建节点T‑邻域结构,获得T‑邻域结构集合;并对T‑邻域结构集合进行去重,获得子图集B;通过学习子图集B,获得通用结构;利用通用结构分别获得源域节点结构特征和目标域节点结构特征;将节点实体特征和节点结构特征相结合,分别获得源域新特征和目标域新特征,从而获得目标域节点标签。本发明方法可以应用于目标任务相同的同构迁移学习和异构迁移学习,在具有图结构的数据中具有很好的预测效果,可以对一个新未知网络进行较为准确的节点标签信息预测。

    一种基于DNS系统的通用网络标识解析方法及系统

    公开(公告)号:CN114285823B

    公开(公告)日:2024-02-02

    申请号:CN202111654983.7

    申请日:2021-12-30

    Abstract: 一种基于DNS系统的通用网络标识解析方法及系统,涉及网络标识解析技术领域,用以解决现有的多标识体系由于不能实现体系间标识数据交换而导致协同工作困难的问题。本发明的技术要点包括:获取用户输入的带有网络标识的解析请求,其中,所述解析请求为符合预定义格式的解析请求,其包括两种类型:HTTP模型和标识协议模型;对所述解析请求进行转换,获得可解析URL;基于预先部署的DNS权威服务器,根据可解析URL进行DNS解析,获取对应标识权威服务器的IP地址;基于预先部署的标识权威服务器,访问DNS解析获得的标识权威服务器的IP地址,根据可解析URL进行标识解析,获取网络标识对应的数据。本发明方便了各种标识体系的协同解析功能,降低了部署成本。

    一种无服务计算中加速启动方法及系统

    公开(公告)号:CN113703867B

    公开(公告)日:2024-01-30

    申请号:CN202110985231.2

    申请日:2021-08-26

    Abstract: 一种无服务计算中加速启动方法及系统,涉及无服务计算技术领域,用以解决现有无服务计算中由于冷启动的存在而导致任务执行的响应时间过长的问题。本发明的技术要点包括:构建两层容器:用户容器和任务容器,每个用户容器对应一个用户设备,对于每个任务请求,容器启动的过程包括查找该任务请求对应的用户容器,如果没有查找到则创建对应的用户容器;创建成功或查找到则将该任务请求转发至用户容器;在用户容器中启动任务容器处理任务请求。本发明中用户容器负责隔离,任务容器负责执行任务,任务容器经过裁剪具有很低的启动延迟;利用过去调用规律预测未来启动来减少冷启动次数,进一步降低启动延迟,相比现有冷启动回收机制具有大幅度提升。

    一种基于协议无感知转发的NDN模态实现方法

    公开(公告)号:CN114244919B

    公开(公告)日:2024-01-26

    申请号:CN202111549823.6

    申请日:2021-12-17

    Abstract: 一种基于协议无感知转发的NDN模态实现方法及NDN控制器应用程序,涉及NDN模态实现技术领域,用以解决现有POF不能直接支撑NDN的有状态转发需求且不能对TLV结构报文进行字段检查和操作的问题。本发明的技术要点包括:一个主机将NDN报文转换为NDN模态报文,NDN模态报文为NDN报文附加NDN前置头后形成的报文;多模态网络转发NDN模态报文,转发过程经过一个或多个POF交换机,在每个POF交换机中由流表流水线和有状态转发模块协同对NDN模态报文进行处理并向多模态网络发出,直至到达另一个主机;另一个主机将NDN模态报文转换为NDN报文。本发明提高了多模态网络的通用性、NDN转发的效率和NDN路由与转发策略管理的便捷性。本发明可应用于在多模态网络中运行NDN。

Patent Agency Ranking