-
公开(公告)号:CN114819152A
公开(公告)日:2022-07-29
申请号:CN202210060387.4
申请日:2022-01-19
Applicant: 浙江大学
IPC: G06N5/02
Abstract: 本发明公开了一种基于强化学习增强的图嵌入实体对齐方法。本发明采用构建异构子图的方式,仅对待对齐实体对的n‑hop邻居进行消息聚合,直接降低计算资源要求。使用基于特征线性调制的图嵌入学习算法,引入超网络思想,以少量参数完成高计算复杂性的消息传递机制与节点更新机制,从而更好地利用节点间的交互信息。此外,本发明提出了一种强化学习增强的节点选择器,提出并在节点选择器中应用基于自监督信号的可靠性度量方法,采样一定数量的可靠边,在限制异构子图的大小的同时过滤问题边,保证参与节点更新的边的可靠性。本发明还实现了一种基于强化学习的节点采样数量更新策略,动态优化采样节点数目,增强节点选择器。
-
公开(公告)号:CN114519344A
公开(公告)日:2022-05-20
申请号:CN202210087670.6
申请日:2022-01-25
Applicant: 浙江大学
IPC: G06F40/216 , G06N20/00
Abstract: 本发明公开了一种基于论元子图提示生成与引导的篇章级多事件抽取方法。本发明使用篇章级长文本编码器,以获取完备的文本特征,可以同时利用篇章级信息和句子级信息。通过多元论元关系抽取生成的事件草图来实现多事件的指代和定位,使用基于提示范式的预训练模型方法进行事件槽填充来实现论元的分类,从而提升多事件抽取准确率。该方法无需使用触发词,降低了对于数据集的标注负担。
-
公开(公告)号:CN114519344B
公开(公告)日:2024-09-10
申请号:CN202210087670.6
申请日:2022-01-25
Applicant: 浙江大学
IPC: G06F40/216 , G06N20/00
Abstract: 本发明公开了一种基于论元子图提示生成与引导的篇章级多事件抽取方法。本发明使用篇章级长文本编码器,以获取完备的文本特征,可以同时利用篇章级信息和句子级信息。通过多元论元关系抽取生成的事件草图来实现多事件的指代和定位,使用基于提示范式的预训练模型方法进行事件槽填充来实现论元的分类,从而提升多事件抽取准确率。该方法无需使用触发词,降低了对于数据集的标注负担。
-
公开(公告)号:CN116561688B
公开(公告)日:2024-03-22
申请号:CN202310517066.7
申请日:2023-05-09
Applicant: 浙江大学
IPC: G06F18/2433 , G06N5/01 , G06F18/241 , G06F18/25
Abstract: 本发明公开了基于动态图异常检测的新兴技术识别方法。本发明基于新兴技术为已有技术的新型组合假设,通过构建面向技术领域的动态图数据,利用多种时空耦合特征与自注意力深度神经网络算法,将技术领域节点之间的关系表征为融合结构信息与时序信息的特征向量,并计算得出技术组合的异常得分,并进一步将高分技术组合视为新兴技术领域的候选集合,再通过人工判断得出最终的新兴技术领域结果。该方法在特征输入与神经网络中均充分利用了动态图中的空间与时间耦合信息,在常规的异常检测任务中取得了优于其他同类最新方法的效果,并创新性地应用于新兴技术识别任务中,起到了筛选候选领域的作用,显著降低解决此任务的成本。
-
公开(公告)号:CN114817571B
公开(公告)日:2023-03-28
申请号:CN202210530426.2
申请日:2022-05-16
Applicant: 浙江大学
Abstract: 本发明公开了一种基于动态知识图谱的成果被引用量预测方法、介质及设备。本发明通过构建面向科技成果的动态时序知识图谱数据,利用图神经网络、循环神经网络、时序预测函数等算法模块,将成果的特征表示为成果相关多维度属性历史特征的聚合,并以成果历史引用量为标签,对成果未来多年的引用量进行预测。该方法可充分利用成果属性和成果间引用关系所构成的图谱结构信息,可支持对刚发布的成果进行较为准确的预测以解决冷启动问题。此外,该方法将图谱结构与时间序列特征充分融合,在特征表示和特征聚合环节均引入时间维度,训练所得到的模型在误差指标评估方面比同类任务方法有明显的提升。该方法可被用于解决科技创新场景下的多种实际任务。
-
公开(公告)号:CN114519108B
公开(公告)日:2024-10-11
申请号:CN202210060374.7
申请日:2022-01-19
Applicant: 浙江大学
IPC: G06F16/36 , G06F16/335 , G06F16/38 , G06N20/00
Abstract: 本发明公开了一种推荐架构下的基于对比学习调优的论文作者消歧方法。本发明将论文作者消歧任务抽象为单塔推荐架构下的推荐排序问题。提出基于Wide&Deep推荐架构的排序算法解决基于表示的深度学习模型的语义漂移问题,实现基于多字段多实例注意力机制的深度模型与基于特征工程的线性模型相结合,使模型同时具备较强的泛化能力与记忆能力。此外,注意到真实匹配对之间应存在一定潜在模式的数据特点,针对性提出一种对比学习调优算法,引入对比学习损失,构建对比学习的正负样本,促使模型学习区分真实匹配对的高层次特征。
-
公开(公告)号:CN115146626B
公开(公告)日:2024-10-15
申请号:CN202210519548.1
申请日:2022-05-12
Applicant: 浙江大学
Abstract: 本发明提供了一种基于图神经网络的上下位关系抽取方法。该方法首先通过字符串匹配的方式从文献库中发现出现待预测术语的文献,将这些文献的标题、摘要和待预测术语本身进行分级建图,同时,应用预训练语言模型获取图中每个节点的语义特征表示从而完成数据关联,得到描述每对待判别术语之间上下位关系的特征图;应用图表示学习算法学习图中每个节点的特征表示;对于图中学习到的每个节点的特征,分别聚合待判别术语对在不同节点上的特征表示;根据构建的待判别术语对的特征表示,判断两个术语之间是否具有上下位的关系。本发明提出的方法能聚合上下位词在不同篇章之内的信息,从而更加准确的判别上下位关系。
-
公开(公告)号:CN118520086A
公开(公告)日:2024-08-20
申请号:CN202410662569.8
申请日:2024-05-27
Applicant: 浙江大学
IPC: G06F16/332 , G06F16/35 , G06F40/186 , G06F40/295 , G06F16/31 , G06F16/33 , G06F16/338
Abstract: 本发明公开了一种全流程大语言模型小样本学习下的知识库问答方法及系统,该方法包括问题解析,通过大语言模型对原始的用户问题进行候选三元组和问题类型的识别;查询模板生成,针对用户问题生成带有占位符的知识库查询语句模板;知识库链接,结合大语言模型和已构建的实体信息索引为查询语句模板中的占位符获取匹配的表达;答案生成,生成可在知识库查询语言并返回最终结果。本发明通过利用大模型的小样本学习能力,针对知识库问答任务重新设计了检索流程,无需单独训练模型,简化了问答流程;利用大模型的强大知识储备,提升了问答效果和泛化能力。
-
公开(公告)号:CN112612871B
公开(公告)日:2023-09-15
申请号:CN202011496007.9
申请日:2020-12-17
Applicant: 浙江大学
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06N3/0442 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于序列生成模型的多事件检测方法。为了解决现有方法对触发词抽取的过度依赖和对事件共现关系、事件类别语义信息忽略的缺陷,本发明利用序列生成模型可以生成不定长序列的特性,实现了在无需进行触发词抽取的情况下也能进行多事件检测的效果,降低了对数据集的标注要求,增强了方法的可用性。在构建序列生成模型时,使用编码器‑解码器的架构,在解码预测输出的过程中使用上一时间步的输出作为输入,因此可以学习各事件类别间的共现关系。此外,本发明同时编码事件文本语义和事件类别名称的语义信息,使得在数据量较少的情况下也能加入更多先验信息得到良好的效果。
-
公开(公告)号:CN115146626A
公开(公告)日:2022-10-04
申请号:CN202210519548.1
申请日:2022-05-12
Applicant: 浙江大学
Abstract: 本发明提供了一种基于图神经网络的上下位关系抽取方法。该方法首先通过字符串匹配的方式从文献库中发现出现待预测术语的文献,将这些文献的标题、摘要和待预测术语本身进行分级建图,同时,应用预训练语言模型获取图中每个节点的语义特征表示从而完成数据关联,得到描述每对待判别术语之间上下位关系的特征图;应用图表示学习算法学习图中每个节点的特征表示;对于图中学习到的每个节点的特征,分别聚合待判别术语对在不同节点上的特征表示;根据构建的待判别术语对的特征表示,判断两个术语之间是否具有上下位的关系。本发明提出的方法能聚合上下位词在不同篇章之内的信息,从而更加准确的判别上下位关系。
-
-
-
-
-
-
-
-
-