-
公开(公告)号:CN118069789B
公开(公告)日:2024-07-23
申请号:CN202410464773.9
申请日:2024-04-18
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明公开一种面向立法意见的关键信息抽取方法、系统及设备,涉及自然语言处理技术领域。该方法包括对证据信息的输入文本和所有待分类关系类别标签进行预处理,得到预处理后的文本;所述预处理包括:文档分割和预训练语言模型的处理;根据预处理后的文本,采用因果驱动的证据语义模型和因果驱动的标签语义模型,基于连续优化的NoTEARS因果发现算法以及L层R‑GCN图神经网络,确定去噪后证据信息和语义增强后的标签信息;根据去噪后证据信息和语义增强后的标签信息进行双向语义匹配,并将双向语义匹配的匹配分数进行聚合,得到综合打分;根据综合打分进行实体关系抽取。本发明能够充分利用外部知识,解决数据标签分布不均衡问题。
-
公开(公告)号:CN111708875B
公开(公告)日:2023-11-03
申请号:CN202010491272.1
申请日:2020-06-02
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/335 , G06F16/33 , G06Q50/18
Abstract: 本申请涉及一种基于处罚特征的行政执法类案推荐方法,该方法,包括:采集未结案案件的文本信息;根据未结案案件的文本信息,获取未结案案件与已结案的行政处罚案件的相似度;根据未结案案件与已结案的行政处罚案件的相似度确定与未结案案件相似的案件。本申请提供的技术方案,类案推荐结果的精确度高,效率高,更符合使用者期望。
-
公开(公告)号:CN111797241B
公开(公告)日:2023-08-22
申请号:CN202010552821.1
申请日:2020-06-17
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明涉及一种基于强化学习的事件论元抽取方法及装置,包括构建事件检测模型,构建论元检测模型,构建实体选择模型,将实体选择模型选择的待检测实体输入到论元检测模型进行检测,采集预测结果的损失,根据预测结果的损失更新论元检测模型的参数;根据待检测实体更新实体选择模型;通过更新后的论元检测模型和更新后的实体选择模型对句子中的实体进行检测,并将检测结果引入更新后的论元检测模型和更新后的实体选择模型进行更新,循环直至遍历所有实体。本发明能够在检测当前论元的时候,引入已知论元的信息,通过引入已知论元信息和强化学习技术,能够有效利用论元间交互关系,提高论元检测效果。
-
公开(公告)号:CN111797225B
公开(公告)日:2023-08-22
申请号:CN202010550450.3
申请日:2020-06-16
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/34 , G06F40/284 , G06N3/0464 , G06N3/0442 , G06N3/049 , G06N3/08
Abstract: 本发明公开了一种文本摘要生成方法和装置,涉及自然语言文本的自动摘要技术;在获取输入文本之后,通过采用编码器对文本进行处理得到编码器的环境向量;然后再根据根据编码器的环境向量采用解码器解码生成摘要。在编码器对整个文本信息编码过程中加入具有感知关键词注意力机制网络的合并层,调整最终得到的编码器的环境向量。使编码器的环境向量既考虑文本的整体性,又关注文本中的关键词。最终通过解码器解码后得到的摘要更加精确,更加符合输入文本。
-
公开(公告)号:CN109614460B
公开(公告)日:2023-03-10
申请号:CN201811542431.5
申请日:2018-12-17
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/30 , G06F16/2458 , G06Q50/18
Abstract: 本申请涉及法条数据处理方法、装置、存储介质及电子设备,属于数据处理技术领域。本申请包括:获取数据库中的法条数据;通过预设的规则确定法条的句式复杂程度,所述句式复杂程度包括:句式简单或者句式复杂;根据确定出的所述句式复杂程度对法条进行拆分处理。通过本申请可以实现根据法条的句式复杂程度对法条进行相应的拆分处理,有助于满足对法条的拆分处理精准度需求。
-
公开(公告)号:CN115080985A
公开(公告)日:2022-09-20
申请号:CN202210887831.X
申请日:2022-07-27
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明涉及一种基于分块的大规模代码静态分析方法和系统。其中方法包括:将大规模工程程序按照工程粒度需求进行分块;针对各块,构建值依赖模型,将块对应的值依赖子图存储到数据库中作持久化保存;分析各块的值依赖子图中的程序漏洞,构建块漏洞表;遍历各块漏洞表,将漏洞表内的漏洞分类为可信漏洞和不可信漏洞;分析不可信漏洞,根据当前值依赖子图中的漏洞与数据库中其他值依赖子图之间的关联性对子图进行拓展,获得根据漏洞完整化的拓展子图;分析所有拓展子图,验证已发现漏洞并检测是否包含新漏洞,将获取的结果与可信漏洞合并后输出。本发明适用于上亿行代码的静态代码分析,可以实现准确有效的分析。
-
公开(公告)号:CN114550194B
公开(公告)日:2022-08-19
申请号:CN202210441221.7
申请日:2022-04-26
Applicant: 北京北大软件工程股份有限公司
Abstract: 本申请实施例提供一种识别信访件的方法和装置,该方法包括:获取待识别信访件;对待识别信访件进行格式转换,得到待识别信访件的图像;对待识别信访件的图像中的指定内容进行识别,得到识别结果;其中,指定内容包括红头标题、文号、日期、公章和手写签名中的至少一个内容。借助于上述技术方案,本申请实施例能够减轻信访工作人员工作量与压力,提升信访件处理效率。
-
公开(公告)号:CN114912445A
公开(公告)日:2022-08-16
申请号:CN202210399116.1
申请日:2022-04-15
Applicant: 北京北大软件工程股份有限公司
IPC: G06F40/289 , G06F40/216 , G06F16/35
Abstract: 本申请实施例提供一种识别案源线索文本数据的方法、装置、存储介质和电子设备,该方法包括:获取案源线索文本数据;对案源线索文本数据进行预处理,得到待识别的词向量;将待识别的词向量输入到预先训练好的基于转换器的双向编码表征BERT模型中,以便于BERT模型对待识别的词向量进行识别,得到案源线索文本数据对应的至少一种违法业务中每种违法业务的概率;将概率最大的违法业务确定为案源线索文本数据的最终违法业务。本申请实施例能够提高审核效率。
-
公开(公告)号:CN114385512B
公开(公告)日:2022-07-19
申请号:CN202210284843.3
申请日:2022-03-23
Applicant: 北京北大软件工程股份有限公司
IPC: G06F11/36
Abstract: 本申请涉及一种软件源代码缺陷检测方法及装置,软件源代码缺陷检测方法包括获取源软件代码,根据源软件代码构造代码属性图,将代码属性图输入预设基于图神经网络的源代码缺陷检测模型,预设基于图神经网络的源代码缺陷检测模型用于生成自适应接收路径,并根据自适应接收路径输出检测结果,可以减少无关代码信息的影响,提高代码漏洞检测的效率。
-
公开(公告)号:CN114692779A
公开(公告)日:2022-07-01
申请号:CN202210397776.6
申请日:2022-04-15
Applicant: 北京北大软件工程股份有限公司
Abstract: 本申请一些实施例提供一种训练行为预测模型的方法、装置、系统及存储介质,该方法包括获取训练数据集,其中,所述训练数据集包括多组训练数据,每组训练数据至少包括:用于表征事件复杂程度的多个子特征,用于表征事件处理情况的多个子特征,用于表征目标对象特征的多个子特征以及转化标签,所述转化标签用于表征与一个事件对应的相邻两次求助行为的升级、降级或不变的情况;根据所述训练数据集中的数据对行为预测模型进行训练,得到目标行为预测模型,其中,所述目标行为预测模型能够对输入的目标事件的求助行为转化进行预测。本申请一些实施例可以训练出精准度较高的目标行为预测模型,准确预测目标对象的行为变化情况。
-
-
-
-
-
-
-
-
-