-
公开(公告)号:CN117149795A
公开(公告)日:2023-12-01
申请号:CN202311197360.0
申请日:2023-09-15
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于混合内存的自适应图计算更新方法及系统。本发明首先将有向图数据以出边方式进行存储时,按照顶点区间均匀划分得到顶点区间及其对应的出边数据块;以入边方式进行存储时,按照顶点区间均匀划分得到顶点区间及其对应的入边数据块;构建子图时,直接利用对应入边数据块、出边数据块,从而避免遍历所有数据块;为提高子图数据的访问效率,本发明将图数据的入边数据、出边数据分别存储在两个NUMA节点中;其次,采用一种基于数据驱动的推‑拉自适应的数据更新策略,以优化迭代图计算过程中消息更新的流程。本发明解决了混合内存图计算模型存在的子图构建和更新模式问题,大大提升了图计算的效率。
-
公开(公告)号:CN116628303B
公开(公告)日:2025-03-14
申请号:CN202310462355.1
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/951 , G06F16/958 , G06F16/353 , G06F18/2415 , G06F40/186 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于提示学习的半结构化网页属性值抽取方法和系统,涉及互联网领域,首先根据DOM树简化算法检索变量节点的DOM树视角提示,然后设计包含任务描述的任务模板获得模板视角提示信息,最后引入基于encoder‑decoder结构的预训练语言模型,并以“提示”为核心操作,全面分析领域数据特点和目标任务特点,设计两种视角的提示信息,通过模板填充融合双视角提示信息,通过提示学习的方式在语义层面和任务层面联合引导预训练语言模型进行任务学习,实现预训练语言模型和属性值抽取任务的有效结合,实现了领域标注数据稀缺场景下优越的模型性能。
-
公开(公告)号:CN116628303A
公开(公告)日:2023-08-22
申请号:CN202310462355.1
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/951 , G06F16/958 , G06F16/35 , G06F18/2415 , G06F40/186 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于提示学习的半结构化网页属性值抽取方法和系统,涉及互联网领域,首先根据DOM树简化算法检索变量节点的DOM树视角提示,然后设计包含任务描述的任务模板获得模板视角提示信息,最后引入基于encoder‑decoder结构的预训练语言模型,并以“提示”为核心操作,全面分析领域数据特点和目标任务特点,设计两种视角的提示信息,通过模板填充融合双视角提示信息,通过提示学习的方式在语义层面和任务层面联合引导预训练语言模型进行任务学习,实现预训练语言模型和属性值抽取任务的有效结合,实现了领域标注数据稀缺场景下优越的模型性能。
-
-