-
公开(公告)号:CN115587168A
公开(公告)日:2023-01-10
申请号:CN202110764787.9
申请日:2021-07-06
Applicant: 南京大学
IPC: G06F16/332 , G06N3/04 , G06N3/08 , G06F40/268 , G06F40/289 , G06F40/295
Abstract: 本发明是一个根据上下文及答案自动化生成问题的方法。该方法通过把文本的深度语义特征融合到大型预训练模型(BERT、ULMFit)中,进而获取文本的深层次的语义表示。该方法不仅考虑了典型的文本语言信息(如POS、NER),还针对QG问题提出了一种新的语言学特征QAF。经过大量的实验,结果表明该方法达到目前最优水平。本发明的目的在于提供一种高质量的问题生成方法,促进问答技术等领域的发展,加速实现智能化的人机交互,进而促进社会发展和高效率运行。
-
公开(公告)号:CN115587159A
公开(公告)日:2023-01-10
申请号:CN202110764789.8
申请日:2021-07-06
Applicant: 南京大学
IPC: G06F16/33 , G06F16/332
Abstract: 本发明提出了一种社区问答系统关键信息补充方法,用于帮助提问者回顾自己的提问方式,补充遗漏的要素便于网友更快地解决这一问题,亦或是在这一环节中引导提问者自行解决问题。该发明的主要创新在于(1)使用Similar Questions Model框架中的相似度算法从数据集中计算问题帖之间的相似度;(2)使用BM25完成问题匹配,相似度计算工作;(3)通过RAKE算法生成关键词或者关键短语。
-
公开(公告)号:CN111459604A
公开(公告)日:2020-07-28
申请号:CN201910055700.3
申请日:2019-01-18
Applicant: 南京大学
Abstract: 本发明是一种基于窥孔优化的智能合约性能优化方法,该方法首先对智能合约进行收集,对智能合约集合中的每一个智能合约进行拆分指令序列处理,获得的所有指令序列再次进行去重,得到指令序列集。获得指令序列集后进行标准化处理,对指令中可能重复出现的寄存器、常数进行标准化。标准化后的指令集需进行等价指令序列识别,即将等价的指令序列分类,并记录执行时间,每一类作为一个替换规则。在优化过程中使用替换规则进行匹配,如果碰到等价片段,则选择执行时间最短的片段将其替换,如果该等价片段性能优于性能最好片段则不进行替换。最后将该等价片段更新到替换规则中以提升优化效果。
-
公开(公告)号:CN111191455A
公开(公告)日:2020-05-22
申请号:CN201811298288.X
申请日:2018-10-26
Applicant: 南京大学
IPC: G06F40/30 , G06F40/279 , G06F16/35
Abstract: 本发明涉及一种交通事故损害赔偿中法律条文预测方法。该方法基于特征提取对事实文本和法律条文进行数据清洗和特征选择,构建用于模型训练的特征和特征向量,使用TwitterLDA学习法条的文本表示,使用word2vec提取案情特征;在此基础上,应用支持向量机方法构建预测模型,生成一个法条预测模型svm-Model;最后,将事实的特征向量输入到svm-Model中,最终生成当前案情涉及到的法律条文。本发明目的在于解决目前存在的法律智能中通过事实对法条预测的难题,进而帮助公众更多地了解法律知识,清楚地了解案件的情况,还可以为行业提供辅助意见,避免个人主观性导致的差异,从而实现司法公正,提高社会效益。
-
公开(公告)号:CN109840532A
公开(公告)日:2019-06-04
申请号:CN201711200604.0
申请日:2017-11-24
Applicant: 南京大学
Abstract: 本发明提出了一种基于k-means的法院类案推荐方法,用于帮助法律人员快速方便地找到当前需要的进一步参考和分析的相似案例,节省查阅案例的时间,提高工作的效率。该发明的主要创新在于(1)对案例文书进行分词和关键词的提取,对关键词进行归一化处理(2)使用关键词归一化处理的结果建立新的向量模型(3)将k-means和余弦相似度相结合,使得类案推荐结果更优。本发明最终基于k-means开发的类案推荐,可以有效地帮助法律人员进行公证判决。
-
公开(公告)号:CN102411754A
公开(公告)日:2012-04-11
申请号:CN201110385722.X
申请日:2011-11-29
Applicant: 南京大学
IPC: G06Q30/02
Abstract: 一种基于商品属性熵值的个性化推荐方法,通过脚本获取电子商务网站用户的浏览记录,对其进行剖析,产生推荐结果进行个性化推荐。本发明基于属性分类熵值的用户剖面可以帮助推荐算法找到用户在不同属性分类上的偏好,利用用户浏览过程中的信息,根据用户的实际选择产生不同推荐,从而提高商品页面推荐的多样性。对于一个需要个性化推荐的推荐系统,本发明在保持推荐命中率的同时,还提高推荐的多样性。本发明方法还可以在不进行大量更改的前提下,对其它推荐算法产生的结果进行重新排序,这样一方面使得原有推荐算法的效果不受影响,另一方面提高了商品页个性化推荐的多样性,从而使商品页的推荐更为有效。
-
公开(公告)号:CN111190997B
公开(公告)日:2024-01-05
申请号:CN201811298287.5
申请日:2018-10-26
Applicant: 南京大学
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F40/289
Abstract: 一种使用神经网络和机器学习排序算法的问答系统实现方法,其根据自然语言格式的问题,使用维基百科文档集作为数据源,给出短文本格式的答案。该方法分为文档检索和机器阅读理解两部分。文档检索部分使用LSI模型对问题和文档进行建模,根据用户提出的问题在维基百科文档库中查找最相关的五篇文档,然后将问题和这五篇文档作为下一阶段的输入,阅读理解部分使用双向神经网络分别对问题和文章中的段落进行建模,最后再使用一个双向神经网络学习最优的答案片段,将最终答案和答案所在段落反馈给用户。
-
公开(公告)号:CN115587909A
公开(公告)日:2023-01-10
申请号:CN202110764875.9
申请日:2021-07-06
Applicant: 南京大学
IPC: G06Q50/18 , G06N3/04 , G06N3/08 , G06F16/34 , G06F40/289
Abstract: 一种基于生成式对抗网络的司法文本数据扩增方法,将生成式对抗网络进行改进,使其适用于文本数据的生成,并将其应用于司法文本的数据扩增中,以获得更为丰富的训练文本数据。主要分为三个步骤,第一个步骤为对抗生成网络模型的搭建,将传统的生成式对抗网络进行改进,使其可以应用于文本的生成;第二个步骤是文本的预处理,进行分词及词向量的应用等操作;最后一个步骤为司法文本数据的生成,将司法文本数据预处理后输入对抗生成网络中,进行司法文本数据的生成。本发明可以基于生成式对抗网络进行司法文本的生成,可应用于深度学习的数据扩增中,生成一批与原数据具有相同分布的训练及测试数据,可以更有效地使用现有数据,缓解神经网络泛化能力差的情况,从而促进司法领域深度学习模型的发展。
-
公开(公告)号:CN115586900A
公开(公告)日:2023-01-10
申请号:CN202110764933.8
申请日:2021-07-06
Applicant: 南京大学
IPC: G06F8/41
Abstract: 本发明提出了一种基于自注意力机制的路径融合的代码理解方法,用于将Java源代码文件理解为低维稠密语义向量,并基于该向量表示代码中的语义与语法信息。同时,本方法基于代码方法名称预测与代码文本相似度评估两个方面,对代码理解方法进行训练以及评估。该发明的主要创新在于(1)基于自注意力机制,提出了一种全新的AST路径解析方法;(2)提出了一种基于循环神经网络的源代码理解方法,获得更为全面准确的语义信息;(3)提出了更为合理的源代码翻译模型与相似度评估模型,并超越了现有方法。
-
公开(公告)号:CN110609961A
公开(公告)日:2019-12-24
申请号:CN201810561270.8
申请日:2018-05-29
Applicant: 南京大学
IPC: G06F16/9536 , G06F17/27
Abstract: 本发明是一个解决司法研究中的罚金推断问题的推荐方法。该方法以两种方式来推断罚金,一是通过对法律案件进行聚类,然后通过多数投票策略获得目标案件的判罚;另一种是通过协同过滤,即查找目标案件的邻居,然后再次采用投票策略。引入了词嵌入技术,它将文档作为词矩阵进行处理,即嵌入法通过word2vec方法,用浅层神经网络语言模型来学习每个词的向量。本发明目的在于对法官们进行法律案件的最终判决和罚金数额的确定起到实际的指导作用,进而有利于司法事业的发展和社会效率的提高。
-
-
-
-
-
-
-
-
-