基于前驱任务的工作流挖掘方法

    公开(公告)号:CN104835015B

    公开(公告)日:2019-01-22

    申请号:CN201510272608.4

    申请日:2015-05-25

    Applicant: 南京大学

    Abstract: 本发明公开了基于前驱任务的工作流挖掘方法,通过分析事件日志中任务,包括对工作流的事件日志中前驱任务进行分析;以事件日志为输入,以Petri网描述的工作流模型为输出结果;该方法使用基于前驱任务的事件日志,前驱任务是指当前任务执行前依赖的需要完成的任务的集合,为当前任务的输入,即在事件日志中包含前驱任务的信息;前驱任务的事件日志的形式化定义为:T是任务集,T*是包含n个任务的任务序列,E=[θ]T是在任务集T基础上的事件集;前驱任务序列表示为σ∈E*,前驱任务的事件日志表示为WE*。本发明在理论上提出了新型挖掘方法,而且在Activiti平台和ProM平台上都实现了实际工具。

    一种面向裁判文书的法条名称规范化及案由与法条的关联统计方法

    公开(公告)号:CN108897770A

    公开(公告)日:2018-11-27

    申请号:CN201810534856.5

    申请日:2018-05-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种面向裁判文书的法条名称规范化及案由与法条的关联统计方法。本方法面对法院的裁判文书,采用了编辑距离算法,对法条法规进行规范化处理,针对裁判文书中案由和法条之间的密切关系,提出了案由法条关联统计分析方法。本方法主要包括裁判文书的半结构化预处理,读取结构化文书中案由和法条信息,法律法条的规范化处理,法律法条按实体法真实情况进行筛选并建立数据库,生成EXCEL表单形式的案由法条关联统计信息,生成TXT形式的法条案由关联统计信息。本方法充分考虑裁判文书人为书写错误,规范化法条名称,统计出各案由的常引法条的规律。

    一种面向裁判文书的文本信息抽取方法

    公开(公告)号:CN108763483A

    公开(公告)日:2018-11-06

    申请号:CN201810534632.4

    申请日:2018-05-25

    Applicant: 南京大学

    Abstract: 本发明是一种面向裁判文书的文本信息抽取方法,主要步骤包括:根据中文裁判文书的书写规律与文书结构,设计文书分段模型存储逻辑段;分析文书各逻辑段的内容,确定每个逻辑段包含的信息项,设计文书信息项模型;以裁判文书为输入,逻辑段特征为依据,输出文书分段模型;以文书分段模型为输入,信息项特征为依据,提取信息项内容,构建文书信息项模型;将文书信息项模型转化为XML格式文档。本发明主要针对民事一审、民事二审、刑事一审、刑事二审、行政一审、行政二审共六类案件的裁判文书,设计了一种面向裁判文书的文本信息抽取方法,能够对任意一篇裁判文书做文本信息抽取,并输出XML格式文档,其结果将为面向裁判文书的文本分析提供重要基础。

    一种应用于云工作流调度的数据预取方法

    公开(公告)号:CN104834571A

    公开(公告)日:2015-08-12

    申请号:CN201510272832.3

    申请日:2015-05-25

    Applicant: 南京大学

    Abstract: 一种应用于云工作流调度的数据预取方法,在工作流调度过程中,汇聚活动的多个前驱活动执行的完成时间存在先后次序,当某个前驱活动执行完成后,可以在该资源传输带宽空闲的情况下,预先把某个前驱活动执行完成后输出文件传输到工作流调度过程共同后继所在的资源上,这种优化方法称为数据预取;工作流调度过程中,步骤S1和S2都为数据预取,区别在于数据预取的时机不同;在前驱活动的资源分配时刻,进行数据预取;如果一个活动是某个汇聚活动的前驱活动,那么在分配资源给该前驱活动之后,需进行目标资源的设定,并且将其他已完成的前驱活动的输出文件或数据预先传输到设定的目标资源上。

    一种基于联合深度学习模型的法条推荐方法

    公开(公告)号:CN110750635B

    公开(公告)日:2023-12-15

    申请号:CN201911009433.2

    申请日:2019-10-21

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于法条关系的法条推荐方法,包括以下步骤:从中国裁判文书网收集裁判文书,构成训练语料;对训练语料进行预处理,包括对案件事实、指控罪名、引用法条三者的不同处理;对用户输入进行预处理;划分数据集,训练本发明设计的一个基于法条关系的联合生成模型,该模型基于罪名预测任务辅助法条推荐任务进行学习;根据训练好的联合生成模型提取推荐法条集;输出推荐法条集。本发明利用编码器‑解码器框架,基于法条关系,结合案件事实、控告罪名、引用法条三者之间的深度关联,设计了一种全新的联合生成模型。实现表明,该模型改善了法条推荐任务的预测效果,适用于真实场景下的法条推荐任务。

    一种基于主动学习的用户需求标注过程管理方法

    公开(公告)号:CN112560410A

    公开(公告)日:2021-03-26

    申请号:CN202110045602.9

    申请日:2021-01-14

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于主动学习的用户需求标注过程管理方法,包括以下步骤:用户需求特征抽取,包括抽取关键词频率向量、抽取启发式属性向量和计算TF‑IDF向量;用户需求排序,包括用户需求排序、文本预处理、根据文本相似度调整和根据聚类结果排序;训练分类模型,包括嵌入向量、利用卷积神经网络处理用户需求文本矩阵、用户需求的特征整合和神经网络预测分类;用户需求再排序,包括计算差异性、用户需求预处理、计算不确定性和对用户需求重新排序。本发明利用了案件类别信息辅助法条推荐,同时使用了注意力机制,能够更多得关注于重点词汇,提高了法条推荐的准确性。

    一种基于托肯日志的过程模型相似性度量方法

    公开(公告)号:CN112434760A

    公开(公告)日:2021-03-02

    申请号:CN202110045604.8

    申请日:2021-01-14

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于托肯日志的过程模型相似性度量方法,包括以下步骤:输入待对比的过程模型的结构图;运行过程模型结构图,并保存运行事件日志为托肯日志;预处理过程模型的托肯日志,包括去除重复的运行实例和归并重复运行的循环结构;依据托肯日志挖掘过程模型中的特殊结构,包括顺序结构,并发结构,选择结构和循环结构,并根据特殊结构中的任务之间的发生关系生成任务关系矩阵;基于有权重的Jaccard系数对比任务关系矩阵相似性;输出过程模型的相似性。本发明为解决大型过程模型库检索、管理等难题,从过程模型的行为角度度量了过程模型的相似性,能更加高效的获得相似的过程模型,提高了过程模型库管理的效率。

    一种基于法条共现的法条推荐方法

    公开(公告)号:CN112148868A

    公开(公告)日:2020-12-29

    申请号:CN202011036948.4

    申请日:2020-09-27

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于法条共现的法条推荐方法,包括以下步骤:从中国裁判文书网上下载裁判文书,构建训练语料;将裁判文书进行预处理,包括中文分词、去停止词、文本特征化及数据降维;对用户输入的案件情况进行预处理;训练基于人工神经网络的案由分类模型,根据案件基本情况预测案由;针对不同的案由分别训练一个基于人工神经网络的法条分类模型,根据案由缩小适合被推荐的法条的范围;对候选推荐法条集进行共现分析,输出推荐法条列表。本发明模拟法官在实际审判过程中,通过判断案由缩小法条引用的范围继而寻找合适法条的真实场景,依靠法条间的共现分析对候选推荐法条集重新排序,从而改善法条推荐的效果,提高了法条推荐的准确性。

    一种基于法条关系的法条推荐方法

    公开(公告)号:CN112148867A

    公开(公告)日:2020-12-29

    申请号:CN202011036946.5

    申请日:2020-09-27

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于法条关系的法条推荐方法,包括以下步骤:从中国裁判文书网收集裁判文书,构成训练语料;对训练语料进行预处理,包括对案件事实、指控罪名、引用法条三者的不同处理;对用户输入进行预处理;划分数据集,训练本发明设计的一个基于法条关系的联合生成模型,该模型基于罪名预测任务辅助法条推荐任务进行学习;根据训练好的联合生成模型提取推荐法条集;输出推荐法条集。本发明利用编码器‑解码器框架,基于法条关系,结合案件事实、控告罪名、引用法条三者之间的深度关联,设计了一种全新的联合生成模型。实现表明,该模型改善了法条推荐任务的预测效果,适用于真实场景下的法条推荐任务。

Patent Agency Ranking