-
公开(公告)号:CN113961706A
公开(公告)日:2022-01-21
申请号:CN202111291168.9
申请日:2021-11-02
Applicant: 南京大学
IPC: G06F16/35 , G06F16/335 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于神经网络自注意力机制的精确文本表示方法,包括以下步骤:根据不同类型任务,对数据集预处理;根据语义向量模型字级别表示向量初始化表征;使用Bi‑LSTM神经网络模型获取初级全局词表示;使用自注意力机制融合全局信息,得到上下文筛选向量;针对不同文本任务适配两种精确文本表示向量模型,对于摘要任务,得到词粒度的精确文本表示,基于Seq2Seq模型与注意力机制解码生成摘要文本;对于分类任务,得到句粒度的精确文本表示,得到预测结果。本发明模拟真实场景下人的思考路径,通读文本获取上下文信息,确定每个单词的重要程度,从语义层面筛选重要文本信息,提升文本表示向量的精确性,提高了文本摘要与文本分类任务的准确性。
-
公开(公告)号:CN113076089B
公开(公告)日:2023-11-21
申请号:CN202110404660.6
申请日:2021-04-15
Applicant: 南京大学
IPC: G06F8/30 , G06F8/70 , G06N3/0455 , G06N3/0442 , G06N3/08
-
公开(公告)号:CN113076089A
公开(公告)日:2021-07-06
申请号:CN202110404660.6
申请日:2021-04-15
Applicant: 南京大学
Abstract: 本发明公开了一种基于对象类型的API补全方法,包括以下步骤:基于Github代码托管平台生成Java代码数据集;基于Java代码数据集,使用eclipseAST的API解析抽象语法树,再遍历抽象语法树,生成GROUM,构建一个Java JDK的API调用序列数据集;基于LSTM和注意力机制搭建深度学习训练模型;开发一个基于本发明模型的IDEA插件;借助插件客户端对当前代码分析后获取API序列和空缺位置,传给服务器,服务器中模型解析结果并返回API补全推荐列表。本发明旨在为程序开发者在实际编程过程中,提供切实可用的API补全方案,实现了一个基于对象类型的深度学习模型以及IDEA插件用于API补全推荐,提高了API补全的准确性与易用性。
-
-