-
公开(公告)号:CN117034135A
公开(公告)日:2023-11-10
申请号:CN202310778665.4
申请日:2023-06-29
Applicant: 南通大学
IPC: G06F18/2415 , G06F18/214 , G06F18/2113
Abstract: 本发明提供一种基于提示学习和双信息源融合的API推荐方法,包括如下步骤:S1、从SO问答网站StackOverflow中筛选出与API相关的问题,捕获对话文本中的单词;S2、从API参考文档中提取相关信息;S3、通过两类API知识的融合,构建基于启发式方法的API与问答QA的关系;S4、将融合的知识表示训练BERT变体模型RoBERTa;S5、输入查询语句得到一组候选API;S6、利用提示学习计算概率对候选API进行重排序。本发明利用双信息源融合,来提高API检索的效率,API参考文档和SO问答网站相互补充,可共同为API查询与检索提供支持。本发明在训练模型阶段,不同于以往对模型的微调,将查询语句作为提示符,提供了足够的上下文信息使RoBERTa模型适应API推荐任务,提高了API推荐的准确性。
-
公开(公告)号:CN115841297A
公开(公告)日:2023-03-24
申请号:CN202211320107.5
申请日:2022-10-26
Applicant: 南通大学
Abstract: 本发明提供一种基于智能合约的项目实施进度监管方法,包括如下步骤:S1、以ubantu系统作为搭建基底,通过Go‑Ethereum软件对区块链进行创世区块的初始化以及私人网络的构建;S2、以Remix ide为开发平台,通过solidity语言对企业项目实施进度的上链提交撰写智能合约;S3、反复测试智能合约的性能与安全性,用户上链确权,进行项目进度提交,成功确权。本发明针对企业实施项目的进度监管,提供了一种基于智能合约的项目实施进度监管方法,通过上链确权,用户将每日项目进度如实提交,达到项目按计划定时定量完成的目标。
-
公开(公告)号:CN114860595A
公开(公告)日:2022-08-05
申请号:CN202210491038.8
申请日:2022-05-07
Applicant: 南通大学
Abstract: 本发明属于软件缺陷预测技术领域,提供一种基于特征相关性分析的实例选择跨项目缺陷预测方法,包括如下步骤:S1、构建项目实例向量集CPIVS;S2、构建相关性权重索引集CWIS;S3、构建相关性特征集CFS;S4、计算实例相关性特征之间距离;S5、构建基于相关性训练集CTS;S6、构建基于特征相关性分析的实例选择跨项目缺陷预测方法FCADP。本发明通过计算每一个目标实例选择出的项目特征与源项目选择出的特征之间的相似度进行源实例选择,将选出的所有源实例组成训练数据集,根据目标实例特征进一步合理的选择源实例。
-
公开(公告)号:CN112925563B
公开(公告)日:2022-01-04
申请号:CN202110205302.2
申请日:2021-02-24
Applicant: 南通大学
Abstract: 本发明提供一种面向代码重用的源代码推荐方法,主要用于帮助公司程序员根据软件需求规范查找实例代码和相关实现,包括如下步骤:源代码预处理和验证;生成函数摘要;获取函数标签词;构造键值对;生成问题词条;查询匹配度计算;搜索结果输出;本发明新提出的代码推荐方法具有较高的实用性和正确性,能有效辅助程序员理解软件需求文档,实现功能,节省软件开发时间。
-
公开(公告)号:CN112966095A
公开(公告)日:2021-06-15
申请号:CN202110368686.X
申请日:2021-04-06
Applicant: 南通大学
IPC: G06F16/335 , G06F8/71
Abstract: 本发明提供一种基于JEAN的软件代码推荐方法,主要用于解决在软件开发中向开发人员推荐代码段的问题。包括如下步骤:S1、构建JEAN模型;S2、从GitHub上收集带有描述的java代码段数据集,并对其预处理用作训练集,用来训练JEAN模型;S3、构建代码库,使用JEAN模型中的代码嵌入表示模块将代码库中的所有代码段嵌入成代码向量;S4、开发人员进行在线搜索代码,输入查询后,JEAN模型中的描述嵌入表示模块将查询嵌入成查询向量;S5、使用余弦相似性计算查询向量和代码库中的所有代码向量之间的相似性,返回与查询向量最相关的向量的代码段。本发明能够有效地帮助软件开发人员根据自己的需求推荐合适的代码段,具有较高的精确率和效率。
-
公开(公告)号:CN112906397A
公开(公告)日:2021-06-04
申请号:CN202110366911.6
申请日:2021-04-06
Applicant: 南通大学
IPC: G06F40/295 , G06F16/35 , G06N3/04
Abstract: 本发明提供一种基于深度学习的短文本实体消歧方法,主要用于解决语句中的实体在不同的短文本中存在含义不同指向的问题,包括如下步骤:步骤1、使用jieba分词技术对语句进行分词,找出待消歧实体,并且使用上市公司实体及其缩写作为词典;步骤2、对句子以待消歧实体为中心,32字大小进行切分;步骤3、将含有待消歧实体的语句转换为Bidirectional Encoder Representation from Transformers(BERT)词向量模型;步骤4、将词向量模型分批次放入到Long‑Short Term Memory RNN(LSTM)模型中,通过交叉熵进行损失函数计算,不断优化参数,获得最终模型。本发明不仅可以在特殊领域如公司实体上取得很好的结果,也可以在一般领域取得不错的结果。
-
公开(公告)号:CN110990003A
公开(公告)日:2020-04-10
申请号:CN201911118507.6
申请日:2019-11-15
Applicant: 南通大学
IPC: G06F8/36 , G06F40/216
Abstract: 本发明提供一种基于词嵌入技术的API推荐方法,给开发人员推荐合适的API,属于代码推荐的技术领域,包括如下步骤:步骤1、收集Java帮助文档和Stack Overflow上Java语言的问答数据集;步骤2、通过收集得到的Stack Overflow中的数据进行词嵌入建模;步骤3、通过UI界面收集开发者输入的问题,使用单词模型和TF-IDF来计算与目标问题集之间的相似度,并使用LSA模型来过滤候选问题列表;步骤4、通过LDA提取主题词,最后从Java帮助文档中得到API推荐信息,开发者使用本发明进行API查询的时候,能够给开发者推荐出较为准确的API信息。
-
公开(公告)号:CN108122006A
公开(公告)日:2018-06-05
申请号:CN201711380265.9
申请日:2017-12-20
Applicant: 南通大学
IPC: G06K9/62
CPC classification number: G06K9/6256 , G06K9/6215 , G06K9/6235 , G06K2009/6236
Abstract: 本发明公开了一种基于不等权局部保持嵌入的故障诊断方法,该方法旨在解决的问题是:针对现代工业过程数据的复杂动态特性,如何构建动态的有向图谱结构,既保持原始样本的局部近邻关系,又能保持原始特征变量的局部结构关系,嵌入后的低维数据结构关系与原始空间的保持一致。该发明方法利用图谱的不等权连接边构建有向网络,并计算概率距离引导的样本相似度矩阵,形成不等权局部保持嵌入模型,有效表征动态过程的样本局部近邻关系;同时,将特征变量也纳入图谱构建中,保留特征变量的局部关系信息,选取对过程故障产生重要影响的特征变量,进一步增强诊断模型的分类精度。与邻域保持嵌入方法相比,本发明方法不仅表征了过程数据的拓扑结构关系,而且构建了不等权局部保持的有向图谱,获取了样本之间的近邻关系,更好地表征特征变量的局部流形结构,反映过程的动态变化情况。因此,本发明方法所涉及的不等权局部保持嵌入模型能取得更优越的动态过程的故障诊断效果。
-
公开(公告)号:CN105205355B
公开(公告)日:2018-04-10
申请号:CN201510746611.5
申请日:2015-11-05
Applicant: 南通大学
IPC: G06F21/10
Abstract: 本发明涉及基于语义角色位置映射的文本水印嵌入及提取方法,嵌入方法包括如下步骤:1)对水印信息进行预处理,将水印字符转换成由码元构成的信息串;2)通过自然语言处理技术找出文本中语义角色,得到语义角色的位置信息,且将语义角色类型与表示水印信息的码元一一对应;3)逐个取出水印信息串中的码字,将该码字与所对应类型语义角色的一个位置相映射,完成水印的嵌入。提取方法包括:根据嵌入水印时得到语义角色的位置信息,找到文本中该位置的语义角色,再反向映射得到由所述码元表示的水印信息串,最终将其转换成原始水印信息。上述方法对文本格式与内容不做任何改变,具有良好的隐蔽性和鲁棒性,能有效抵抗各种常见的格式变换和攻击。
-
公开(公告)号:CN107577756A
公开(公告)日:2018-01-12
申请号:CN201710773342.0
申请日:2017-08-31
Applicant: 南通大学
Abstract: 本发明公开了一种基于多层迭代的改进递归数据流匹配方法,具体包含如下步骤;步骤1,将规则库分割成几个规则子集;步骤2,将每个规则子集中的规则存储在一个RFC数据结构中,每个规则子集用一个索引规则来进行描述,将所有的索引规则存储在一个RFC索引中,将RFC索引指向相应的RFC数据结构对RFC进行改进以减少内存消耗,通过把规则库分成几个子集,每个规则存储在一个独立的子集中,另外本发明采用了多种方法对RFC数据结构进行了精简以便进一步改善算法的速度和内存性能,本发明对RFC的改进算法大大降低了RFC总体内存消耗,极大提高了包匹配的性能。
-
-
-
-
-
-
-
-
-