一种基于深度学习的量刑预测方法

    公开(公告)号:CN110991694A

    公开(公告)日:2020-04-10

    申请号:CN201911049086.6

    申请日:2019-10-30

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于深度学习的量刑预测方法,包括以下步骤:步骤(1)根据案由从裁判文书数据库中提取裁判文书集,构建训练语料,裁判文书预处理,进行分词分句,转化为词向量;相关法条预处理,将法条转化为词向量;提取文书特征信息,使用深度学习和正则表达式结合的方式获取文本特征;进行量刑预测;输出量刑结果和罚金。本发明模拟法官在实际审判过程中,提取文书特征并作证发条以得出量刑预测的真实场景,从文书特征提取入手,说明了一种量刑预测方法。

    一种基于多层知识门的法条与事实关系计算方法

    公开(公告)号:CN110737781A

    公开(公告)日:2020-01-31

    申请号:CN201911003330.5

    申请日:2019-10-21

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于多层知识门的法条与事实关系计算方法,包括以下步骤:提取裁判文书集并预处理文书;构建法律专用停用词典;训练词向量模型;对用户输入进行预处理;输出事实与法条关系的预测结果。本发明用于法官在实际审判过程中或审判结束后对案件进行梳理或检查的真实场景,基于输入文本的先验知识,采用多层知识门机制的方法过滤事实和法条正文中的噪声,得到的事实法条的新向量表达,能够有效提升模型预测的准确度。同时,利用法条上级目录之间的层级关系大大提高了门机制的过滤效果。

    一种可复用的法条推荐框架

    公开(公告)号:CN110717843A

    公开(公告)日:2020-01-21

    申请号:CN201911009434.7

    申请日:2019-10-21

    Applicant: 南京大学

    Abstract: 本发明公开了一种可复用的法条推荐框架,包括以下步骤:提取裁判文书集构建训练语料;对裁判文书进行预处理,包括抽取出案件基本情况段落和引用法条列表,对案件基本情况进行中文分词,学习案件基本情况的向量表示模型,构建法条推荐任务的输出空间以及学习法条的语义向量模型;对用户输入的案件情况进行预处理;设计多标签分类模型对法条集进行预排序获得候选推荐法条集;对候选推荐法条集进行二次排序,获得最终推荐结果;输出推荐法条列表。本发明模拟给定案件基本情况筛选相关法条进行引用的真实场景,额外考虑法条自身的语义信息、法条与法条之间的关联进行法条推荐,通过再排序策略优化推荐结果,提高了法条推荐的准确性。

    一种基于词向量学习模型的微博中文情感词典构建方法

    公开(公告)号:CN109376251A

    公开(公告)日:2019-02-22

    申请号:CN201811143903.X

    申请日:2018-09-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于词向量学习模型的微博中文情感词典构建方法,包括:(1)针对当前微博数据的特征来获取相应的训练语料;(2)对训练语料进行数据预处理工作;(3)构造候选词典;(4)构造种子情感词典;(5)训练参数与配置的选取和定义;(6)训练词向量学习模型;(7)评估词向量学习模型训练结果;(8)迭代执行步骤(6),直到所有参数遍历训练完毕;(9)选择最优评估结果的词向量;(10)训练词语级情感极性分类器;(11)应用词语级情感极性分类器并获取最终的目标情感词典。本发明设计了一个结合语义和情感信息的词向量学习模型,由此设计了面向微博的中文情感词典构建方法,可以提升获取中文情感词典的效率与质量。

    一种基于深度强化学习的计算卸载调度方法

    公开(公告)号:CN109257429A

    公开(公告)日:2019-01-22

    申请号:CN201811143682.6

    申请日:2018-09-25

    Applicant: 南京大学

    Abstract: 本发明是一种基于深度强化学习的计算卸载调度方法,为物联网设备提供了一种计算卸载作出卸载决策方法,包括针对计算卸载的基本模型,对需要卸载的各个方面进行决策。基于不同的优化目标,通过改变价值函数,以达到不同的优化目标。本算法中的Deep-SARSA算法相似于DQN算法是结合强化学习与深度学习的深度强化学习算法,在配合了经验池可以有效的将卸载状态与卸载动作转变为深度学习的可训练样本。本发明能够有效的对不限维度的卸载状态模型进行机器学习,降低学习的复杂度,该方法使用神经网络作为Q值得线性逼近器,可以有效的提高训练速度,减少训练所需要的样本,该方法能有效的在既定模型和优化目标下,通过深度强化学习,作出最优的决策。

    一种基于PageRank和信息熵的裁判文书的文本分词方法

    公开(公告)号:CN108776653A

    公开(公告)日:2018-11-09

    申请号:CN201810534689.4

    申请日:2018-05-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于PageRank和信息熵的裁判文书的文本分词方法,该发明属于自然语言处理领域中的中文分词技术,主要采用了改进的PageRank算法、信息熵、互信息以及关键词词典对中文文本进行分词。本发明针对法律领域的裁判文书,在PageRank算法基础上建立了分词方法,根据Rank向量切分候选词,并利用信息熵对候选词进行修正,再依据裁判文书的关键词词典做术语合并,最终输出分词结果,该方法能够较为准确地对裁判文书进行分词。本发明与现有方法相比,其显著优点是:不需要通过大量文本语料库进行统计或训练以建立大规模的词典,仅对输入文本进行统计,将输入文本作为现有语料库进行统计挖掘,最终结合裁判文书的关键词术语词典即可完成分词。

    一种基于文本相似度的裁判文书的证据链关系模型构建方法

    公开(公告)号:CN108763485A

    公开(公告)日:2018-11-06

    申请号:CN201810534766.6

    申请日:2018-05-25

    Applicant: 南京大学

    CPC classification number: G06F17/271 G06F17/2775 G06F17/2785

    Abstract: 本发明是一种基于文本相似度的裁判文书证据链关系模型构建方法,该构建方法的主要步骤包括:(1)针对中文裁判文书进行文本预处理;(2)读取预处理后裁判文书中的证据段与事实段;(3)抽取证据链体及事实的What、Where、Who、When和How Much这五类关键要素;(4)通过计算关键要素联结计算构造证据链关系模型中的证据与证据的关联以及证据与事实的关联完成模型构建;(5)并计算建模后的证据链关系模型中每条证据链的权重;(6)将构建出的模型以Excel表格格式输出;(7)使用证据链建模工具展示生成的证据链关系模型的结构。本发明主要针对中国法律裁判文书说理评估中的证据链关系模型构建任务,根据裁判文书说理的特征和法院文书的结构特点,改善裁判文书预处理方法,优化关键要素提取技术,能够有效运用于评估裁判文书的事实说理水平。

    基于主题模型的裁判文书相似度分析方法

    公开(公告)号:CN107291688A

    公开(公告)日:2017-10-24

    申请号:CN201710376341.2

    申请日:2017-05-22

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于主题模型的裁判文书相似度分析方法。该方法采用机器学习中的LDA(Latent Dirichlet Allocation)主题模型,针对裁判文书,提出一种基于语义的、半自动化的、通用的相似度分析方法。本方法主要包括选取语料、建立相似度标注、文本预处理、输入选取、参数设置、迭代训练、生成模型和应用模型等步骤。该方法在一般相似度分析方法的基础上,充分考虑裁判文书内容上专业词汇丰富、语义复杂的特点,利用裁判文书半结构化的特性,从而提升了裁判文书相似度分析的准确性和适用性。

    基于前驱任务的工作流挖掘方法

    公开(公告)号:CN104835015A

    公开(公告)日:2015-08-12

    申请号:CN201510272608.4

    申请日:2015-05-25

    Applicant: 南京大学

    Abstract: 本发明公开了基于前驱任务的工作流挖掘方法,通过分析事件日志中任务,包括对工作流的事件日志中前驱任务进行分析;以事件日志为输入,以Petri网描述的工作流模型为输出结果;该方法使用基于前驱任务的事件日志,前驱任务是指当前任务执行前依赖的需要完成的任务的集合,为当前任务的输入,即在事件日志中包含前驱任务的信息;前驱任务的事件日志的形式化定义为:T是任务集,T*是包含n个任务的任务序列,E=[θ]T是在任务集T基础上的事件集;前驱任务序列表示为σ∈E*,前驱任务的事件日志表示为WE*。本发明在理论上提出了新型挖掘方法,而且在Activiti平台和ProM平台上都实现了实际工具。

Patent Agency Ranking