-
公开(公告)号:CN117421609B
公开(公告)日:2024-04-02
申请号:CN202311722719.1
申请日:2023-12-15
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明公开了一种应用于社交媒体的图像与文本语义相似度计算方法及系统,涉及语义相似度计算技术领域,该方法包括:通过图像场景图生成模型和文本场景图生成模型分别将图像和文本转化为图像场景图和文本场景图;根据图像场景图和文本场景图中物体‑关系‑物体三元组分别构建图像高层语义子图和文本高层语义子图;基于图像场景图和文本场景图中的物体节点和关系节点,利用向量点积计算局部细节匹配分数;基于高层语义子图和文本高层语义子图计算高层语义匹配分数;基于局部细节匹配分数和高层语义匹配分数计算图像与文本的语义相似度。本发明从底层局部细节到高层语义信息来衡量两个模态语义的相关程度,得到更加准确的图像与文本的语义相似度。
-
公开(公告)号:CN111583072B
公开(公告)日:2023-11-07
申请号:CN202010342334.2
申请日:2020-04-27
Applicant: 北京北大软件工程股份有限公司
IPC: G06Q50/18 , G06F40/211 , G06F40/284 , G06N3/0442 , G06N3/045 , G06N3/08
Abstract: 本申请涉及法条上下位关系判断方法及处理终端,属于自然语言处理技术领域。本申请包括:获取法条数据;将法条数据输入训练好的文本关联度计算模型,文本关联度计算模型包括:编码模块、局部推理模块、推理合成模块和预测结果模块,经所述编码模块、局部推理模块、推理合成模块和预测结果模块的依次处理,得到法条间的上下位关系。通过本申请,有助于提升上下位法条关系判断的准确率。
-
公开(公告)号:CN114550194A
公开(公告)日:2022-05-27
申请号:CN202210441221.7
申请日:2022-04-26
Applicant: 北京北大软件工程股份有限公司
Abstract: 本申请实施例提供一种识别信访件的方法和装置,该方法包括:获取待识别信访件;对待识别信访件进行格式转换,得到待识别信访件的图像;对待识别信访件的图像中的指定内容进行识别,得到识别结果;其中,指定内容包括红头标题、文号、日期、公章和手写签名中的至少一个内容。借助于上述技术方案,本申请实施例能够减轻信访工作人员工作量与压力,提升信访件处理效率。
-
公开(公告)号:CN118069789B
公开(公告)日:2024-07-23
申请号:CN202410464773.9
申请日:2024-04-18
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明公开一种面向立法意见的关键信息抽取方法、系统及设备,涉及自然语言处理技术领域。该方法包括对证据信息的输入文本和所有待分类关系类别标签进行预处理,得到预处理后的文本;所述预处理包括:文档分割和预训练语言模型的处理;根据预处理后的文本,采用因果驱动的证据语义模型和因果驱动的标签语义模型,基于连续优化的NoTEARS因果发现算法以及L层R‑GCN图神经网络,确定去噪后证据信息和语义增强后的标签信息;根据去噪后证据信息和语义增强后的标签信息进行双向语义匹配,并将双向语义匹配的匹配分数进行聚合,得到综合打分;根据综合打分进行实体关系抽取。本发明能够充分利用外部知识,解决数据标签分布不均衡问题。
-
公开(公告)号:CN111708875B
公开(公告)日:2023-11-03
申请号:CN202010491272.1
申请日:2020-06-02
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/335 , G06F16/33 , G06Q50/18
Abstract: 本申请涉及一种基于处罚特征的行政执法类案推荐方法,该方法,包括:采集未结案案件的文本信息;根据未结案案件的文本信息,获取未结案案件与已结案的行政处罚案件的相似度;根据未结案案件与已结案的行政处罚案件的相似度确定与未结案案件相似的案件。本申请提供的技术方案,类案推荐结果的精确度高,效率高,更符合使用者期望。
-
公开(公告)号:CN114550194B
公开(公告)日:2022-08-19
申请号:CN202210441221.7
申请日:2022-04-26
Applicant: 北京北大软件工程股份有限公司
Abstract: 本申请实施例提供一种识别信访件的方法和装置,该方法包括:获取待识别信访件;对待识别信访件进行格式转换,得到待识别信访件的图像;对待识别信访件的图像中的指定内容进行识别,得到识别结果;其中,指定内容包括红头标题、文号、日期、公章和手写签名中的至少一个内容。借助于上述技术方案,本申请实施例能够减轻信访工作人员工作量与压力,提升信访件处理效率。
-
公开(公告)号:CN118069789A
公开(公告)日:2024-05-24
申请号:CN202410464773.9
申请日:2024-04-18
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明公开一种面向立法意见的关键信息抽取方法、系统及设备,涉及自然语言处理技术领域。该方法包括对证据信息的输入文本和所有待分类关系类别标签进行预处理,得到预处理后的文本;所述预处理包括:文档分割和预训练语言模型的处理;根据预处理后的文本,采用因果驱动的证据语义模型和因果驱动的标签语义模型,基于连续优化的NoTEARS因果发现算法以及L层R‑GCN图神经网络,确定去噪后证据信息和语义增强后的标签信息;根据去噪后证据信息和语义增强后的标签信息进行双向语义匹配,并将双向语义匹配的匹配分数进行聚合,得到综合打分;根据综合打分进行实体关系抽取。本发明能够充分利用外部知识,解决数据标签分布不均衡问题。
-
公开(公告)号:CN113806548A
公开(公告)日:2021-12-17
申请号:CN202111372528.8
申请日:2021-11-19
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/35 , G06F40/205 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于深度学习模型的信访要素抽取方法、抽取系统、电子设备及计算机可读存储介质,包括:提取信访件的文本内容中目标文本数据;对目标文本数据进行预处理,生成针对多种深度学习模型的对应的数据;将预处理后的多种文本数据中的关于信访人的相关信息、受信人相关信息以及信访诉求的文本数据输入到要素抽取模型中进行要素抽取;将关于信访内容以及信访目的的文本数据输入到文本分类模型中进行分类,分别得到要素抽取的结果以及文本分类的结果;将得到的要素抽取的结果以及文本分类的结果推送到终端设备。该方法采用多种模型,能适应不同类型信访件,具有普遍性,并且无需人工进行繁琐要素抽取工作,提高信访人员工作效率。
-
公开(公告)号:CN111694945A
公开(公告)日:2020-09-22
申请号:CN202010493887.8
申请日:2020-06-03
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/335 , G06N3/04
Abstract: 本发明涉及一种基于神经网络的法条关联推荐方法及装置,包括获取待分析的相关法条,对相关法条进行处理转化为特征向量;相关法条包括上位法条集合和下位法条集合;构建LSTM网络模型,将特征向量输入LSTM网络模型中,获取相应的上位法条输出单元向量和下位法条输出单元向量;计算上位法条输出单元向量和下位法条输出单元向量的曼哈顿距离值,将上位法条输出单元向量、下位法条输出单元向量及曼哈顿距离值组合作为输出向量;对LSTM网络模型进行修正,将输出向量输入到修正后的LSTM网络模型中计算上位法条集合和下位法条集合的相似度,根据相似度输出推荐结果。本发明用于上下位法律条款识别时,能够有效的识别上下位法条之间的相似度并根据相似度为用户提供相应的法律法条。
-
公开(公告)号:CN111666419A
公开(公告)日:2020-09-15
申请号:CN202010462778.X
申请日:2020-05-27
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/36 , G06F16/35 , G06F40/242 , G06F40/295
Abstract: 本申请涉及法律数据的知识图谱构建方法及装置,属于知识图谱技术领域。本申请包括:步骤S101、对法律数据进行知识抽取,以提取用于知识图谱构建的实体、属性以及关系,其中,法律数据包括:案件和法律法规数据;步骤S102、对提取的实体以及关系采取不同的知识表示方式进行建模;步骤S103、利用gStore作为存储系统,生成能够进行多跳关系查询的法律垂直领域知识图谱。通过本申请,有助于使知识表示更加全面,提高查询准确率以及提高应用效率。
-
-
-
-
-
-
-
-
-