一种基于深度学习和特征融合的文本情感分类方法

    公开(公告)号:CN110750648A

    公开(公告)日:2020-02-04

    申请号:CN201911003328.8

    申请日:2019-10-21

    Applicant: 南京大学

    Abstract: 本发明提出一种基于深度学习和特征融合的文本情感分类方法,该方法通过整合层次特征学习文本表示,包括:根据文本极性及否定词,为情感词设计不同环境的向量表示;为词性采样得到向量区分同形词;结合表情符优化词向量,使用神经网络模型学习基于词向量的单句特征;通过字序列学习基于字向量的单句特征;两部分拼接得到句子级特征;对于至少包含两个单句的文档,句向量序列输入到上层神经网络学习基于神经网的文档特征,并对段首、段尾和包含总结词的句子取平均获得基于规则的文档特征,两部分拼接获得文档级特征。针对具体任务,将单句或文档特征输入随机森林分类器即可预测情感类别。与基础模型相比,本发明能够有效提高文本情感分类的准确性。

    一种移动云计算环境下的视频传输调度方法

    公开(公告)号:CN107277862A

    公开(公告)日:2017-10-20

    申请号:CN201710381696.0

    申请日:2017-05-24

    Applicant: 南京大学

    CPC classification number: H04W28/20 H04L67/06 H04W72/0446

    Abstract: 本发明公开了一种移动云计算环境下的视频传输调度方法,该发明属于移动云计算中的移动视频调度方法,旨在解决移动云计算基础设施向移动设备传输视频的调度问题,该方法在不影响移动用户的视频体验的基础上去优化视频传输过程,从而实现节约带宽成本与能源的目的。本发明与贪心算法相比,其显著优点是:在不影响用户视频体验的基础上,通过采用李雅普诺夫优化技术,尽最大可能减少调度带宽成本和能耗,该算法不仅能最大限度地提高平均视频吞吐率和平均移动设备能耗的共同效用,而且在工作量和信道状态均未知时仍可做到自适应。

    一种基于神经网络自注意力机制的精确文本表示方法

    公开(公告)号:CN113961706A

    公开(公告)日:2022-01-21

    申请号:CN202111291168.9

    申请日:2021-11-02

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于神经网络自注意力机制的精确文本表示方法,包括以下步骤:根据不同类型任务,对数据集预处理;根据语义向量模型字级别表示向量初始化表征;使用Bi‑LSTM神经网络模型获取初级全局词表示;使用自注意力机制融合全局信息,得到上下文筛选向量;针对不同文本任务适配两种精确文本表示向量模型,对于摘要任务,得到词粒度的精确文本表示,基于Seq2Seq模型与注意力机制解码生成摘要文本;对于分类任务,得到句粒度的精确文本表示,得到预测结果。本发明模拟真实场景下人的思考路径,通读文本获取上下文信息,确定每个单词的重要程度,从语义层面筛选重要文本信息,提升文本表示向量的精确性,提高了文本摘要与文本分类任务的准确性。

    一种基于GAT图神经网络模型的代码克隆检测方法

    公开(公告)号:CN113961241A

    公开(公告)日:2022-01-21

    申请号:CN202111291169.3

    申请日:2021-11-02

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于GAT图神经网络模型的代码克隆检测方法,包括以下步骤:根据克隆代码的定义,从编程竞赛网站和现有代码克隆数据集提取生成相应定义的克隆代码数据;解析代码文本生成AST抽象语法树;在AST抽象语法树的基础上增加人工定义的附加边生成表示图;将代码表示图输入GAT网络模型训练获得图表征向量;拼接克隆代码对的表征向量输入二分类网络;判别输出代码克隆预测结果。本发明解决了代码克隆检测领域对代码语义型克隆检测能力不足的问题,通过将代码文本转换为图结构表示,从语义与结构层面表征了克隆代码信息,能准确获得学习克隆代码的内在联系并进行克隆代码判别预测,提高了代码克隆检测的准确性。

    基于词向量模型的法条推荐方法

    公开(公告)号:CN109446416B

    公开(公告)日:2021-09-28

    申请号:CN201811170180.2

    申请日:2018-09-26

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于词向量模型的法条推荐方法,该发明属于推荐系统技术领域中的协同过滤推荐技术,协同过滤是通过借助相似的事物来为事物推荐或者筛选信息的技术,推荐法条需要借助裁判文书中的基本案件情况获取其他案情相近的文书,然后根据多个前例推荐法条。本发明与现有方法相比,其显著优点是:引入词向量模型后,通过词向量的计算能够更准确地表达两段案件基本情况的相似程度,从而为裁判文书找到案情更相似的文书。并且根据多个相似案情的文书可以采取多种协同过滤推荐策略,获得更准确的推荐结果。

    一种面向软件资产复用的众包需求管理和分析框架

    公开(公告)号:CN110888629A

    公开(公告)日:2020-03-17

    申请号:CN201911048873.9

    申请日:2019-10-30

    Applicant: 南京大学

    Abstract: 本发明公开了一种面向软件资产复用的众包需求管理和分析框架,包括以下步骤:由项目发布者发布项目;通过众包平台收集项目需求;将收集到的项目需求进行预处理,包括检验需求重复/冲突并进行需求分类,对需求进行优先级排序等以及对收集到的项目需求做初步筛选;对经过筛选的项目需求进行一些软件资产完善操作,包括UML图的绘制、软件设计、项目文档的编辑以及相关代码的提交;将已生成的软件资产同项目需求或其他软件产物进行关联;生成软件资产关联表。本发明可以帮助快速定位到其他可复用的软件资产,即尽可能早地实现软件资产复用,实现在整个研发过程中软件资产关联明确化,大大节省众包需求管理的时间,提高了工作效率。

    基于词向量模型的法条推荐方法

    公开(公告)号:CN109446416A

    公开(公告)日:2019-03-08

    申请号:CN201811170180.2

    申请日:2018-09-26

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于词向量模型的法条推荐方法,该发明属于推荐系统技术领域中的协同过滤推荐技术,协同过滤是通过借助相似的事物来为事物推荐或者筛选信息的技术,推荐法条需要借助裁判文书中的基本案件情况获取其他案情相近的文书,然后根据多个前例推荐法条。本发明与现有方法相比,其显著优点是:引入词向量模型后,通过词向量的计算能够更准确地表达两段案件基本情况的相似程度,从而为裁判文书找到案情更相似的文书。并且根据多个相似案情的文书可以采取多种协同过滤推荐策略,获得更准确的推荐结果。

    一种面向裁判文书的文本标注方法

    公开(公告)号:CN109408788A

    公开(公告)日:2019-03-01

    申请号:CN201811170433.6

    申请日:2018-09-26

    Applicant: 南京大学

    Abstract: 本发明公开了一种面向裁判文书的文本标注方法,包括以下步骤:从裁判文书文本中分段抽取与文本分割,形成Excel格式的待标注数据文件;管理员登录与待标注数据导入;管理员创建普通用户;管理员创建待标注项目与为普通用户分配待标注数据;普通用户登录与提交标注;管理员导出标注后的数据。本发明加强了对项目参与人员的管理,采用输入序号分配文本的设计,集成了标注任务分配、标注数据采集和导出的功能,提高了面向裁判文书的文本标注的工作效率。

    一种证据链关系图建模方法

    公开(公告)号:CN109360127A

    公开(公告)日:2019-02-19

    申请号:CN201811272642.1

    申请日:2018-10-24

    Applicant: 南京大学

    Abstract: 本发明公开了一种证据链关系图建模方法,属于可视化建模方法与法院审判业务相结合的应用技术。证据链关系图建模方法包括如下步骤:载入并分解双方证据列表,计算链头短文本,质证与采信,载入并分解事实文本、计算联结点短文本,计算链头短文本与联结点短文本的相似性并确立彼此的连接关系,绘制证据链关系图,输出证据链关系图的XML格式。本发明的方法能够辅助法官在审理案件时,通过可视化建模工具梳理证据并构建证据链,以更加直观的方式展现某个案件的证据与证据链接关系。

    一种裁判文书的检索方法
    20.
    发明公开

    公开(公告)号:CN109359173A

    公开(公告)日:2019-02-19

    申请号:CN201811272641.7

    申请日:2018-10-24

    Applicant: 南京大学

    Abstract: 本发明公开了一种裁判文书的检索方法,包括以下步骤:(1)根据裁判文书内容定义索引字段,设置字段类型,创建索引;(2)将裁判文书文件导入索引;(3)对裁判文书进行检索,并根据检索条件,按照匹配程度排序并分页显示结果列表,进一步筛选以缩小结果集;(4)对结果列表中的单篇裁判文书具体信息分节点异步加载和展示;(5)对结果列表中的裁判文书文件进行下载。本发明能提供高效的裁判文书全文检索和清晰的裁判文书阅读体验,显著降低了裁判文书的检索难度和阅读难度,极大的提升了法律从业人员的工作效率。

Patent Agency Ranking