-
公开(公告)号:CN117421609A
公开(公告)日:2024-01-19
申请号:CN202311722719.1
申请日:2023-12-15
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明公开了一种应用于社交媒体的图像与文本语义相似度计算方法及系统,涉及语义相似度计算技术领域,该方法包括:通过图像场景图生成模型和文本场景图生成模型分别将图像和文本转化为图像场景图和文本场景图;根据图像场景图和文本场景图中物体‑关系‑物体三元组分别构建图像高层语义子图和文本高层语义子图;基于图像场景图和文本场景图中的物体节点和关系节点,利用向量点积计算局部细节匹配分数;基于高层语义子图和文本高层语义子图计算高层语义匹配分数;基于局部细节匹配分数和高层语义匹配分数计算图像与文本的语义相似度。本发明从底层局部细节到高层语义信息来衡量两个模态语义的相关程度,得到更加准确的图像与文本的语义相似度。
-
公开(公告)号:CN118069789B
公开(公告)日:2024-07-23
申请号:CN202410464773.9
申请日:2024-04-18
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明公开一种面向立法意见的关键信息抽取方法、系统及设备,涉及自然语言处理技术领域。该方法包括对证据信息的输入文本和所有待分类关系类别标签进行预处理,得到预处理后的文本;所述预处理包括:文档分割和预训练语言模型的处理;根据预处理后的文本,采用因果驱动的证据语义模型和因果驱动的标签语义模型,基于连续优化的NoTEARS因果发现算法以及L层R‑GCN图神经网络,确定去噪后证据信息和语义增强后的标签信息;根据去噪后证据信息和语义增强后的标签信息进行双向语义匹配,并将双向语义匹配的匹配分数进行聚合,得到综合打分;根据综合打分进行实体关系抽取。本发明能够充分利用外部知识,解决数据标签分布不均衡问题。
-
公开(公告)号:CN114692779A
公开(公告)日:2022-07-01
申请号:CN202210397776.6
申请日:2022-04-15
Applicant: 北京北大软件工程股份有限公司
Abstract: 本申请一些实施例提供一种训练行为预测模型的方法、装置、系统及存储介质,该方法包括获取训练数据集,其中,所述训练数据集包括多组训练数据,每组训练数据至少包括:用于表征事件复杂程度的多个子特征,用于表征事件处理情况的多个子特征,用于表征目标对象特征的多个子特征以及转化标签,所述转化标签用于表征与一个事件对应的相邻两次求助行为的升级、降级或不变的情况;根据所述训练数据集中的数据对行为预测模型进行训练,得到目标行为预测模型,其中,所述目标行为预测模型能够对输入的目标事件的求助行为转化进行预测。本申请一些实施例可以训练出精准度较高的目标行为预测模型,准确预测目标对象的行为变化情况。
-
公开(公告)号:CN114490953B
公开(公告)日:2022-08-19
申请号:CN202210401413.5
申请日:2022-04-18
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/126 , G06F40/279
Abstract: 本申请实施例提供了训练事件抽取模型、事件抽取的方法和目标事件抽取模型,该方法包括:对目标事件抽取模型的第i次训练过程包括如下步骤:根据所有实体标签获取目标训练文本编码,并且获取所有论元角色编码;将所述目标训练文本编码和所有论元角色编码通过注意力机制模块进行融合,获得融合论元角色编码和融合训练文本编码;基于所述融合论元角色编码对事件检测模块进行训练,以及基于所述融合训练文本编码对论元分类模块进行训练;其中,i为大于或等于1的整数。通过本申请的一些实施例能够实现无需使用触发词即可实现事件抽取任务,同时能够提高事件抽取任务的准确率。
-
公开(公告)号:CN114490953A
公开(公告)日:2022-05-13
申请号:CN202210401413.5
申请日:2022-04-18
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/126 , G06F40/279
Abstract: 本申请实施例提供了训练事件抽取模型、事件抽取的方法和目标事件抽取模型,该方法包括:对目标事件抽取模型的第i次训练过程包括如下步骤:根据所有实体标签获取目标训练文本编码,并且获取所有论元角色编码;将所述目标训练文本编码和所有论元角色编码通过注意力机制模块进行融合,获得融合论元角色编码和融合训练文本编码;基于所述融合论元角色编码对事件检测模块进行训练,以及基于所述融合训练文本编码对论元分类模块进行训练;其中,i为大于或等于1的整数。通过本申请的一些实施例能够实现无需使用触发词即可实现事件抽取任务,同时能够提高事件抽取任务的准确率。
-
公开(公告)号:CN118069789A
公开(公告)日:2024-05-24
申请号:CN202410464773.9
申请日:2024-04-18
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明公开一种面向立法意见的关键信息抽取方法、系统及设备,涉及自然语言处理技术领域。该方法包括对证据信息的输入文本和所有待分类关系类别标签进行预处理,得到预处理后的文本;所述预处理包括:文档分割和预训练语言模型的处理;根据预处理后的文本,采用因果驱动的证据语义模型和因果驱动的标签语义模型,基于连续优化的NoTEARS因果发现算法以及L层R‑GCN图神经网络,确定去噪后证据信息和语义增强后的标签信息;根据去噪后证据信息和语义增强后的标签信息进行双向语义匹配,并将双向语义匹配的匹配分数进行聚合,得到综合打分;根据综合打分进行实体关系抽取。本发明能够充分利用外部知识,解决数据标签分布不均衡问题。
-
公开(公告)号:CN113806548A
公开(公告)日:2021-12-17
申请号:CN202111372528.8
申请日:2021-11-19
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/35 , G06F40/205 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于深度学习模型的信访要素抽取方法、抽取系统、电子设备及计算机可读存储介质,包括:提取信访件的文本内容中目标文本数据;对目标文本数据进行预处理,生成针对多种深度学习模型的对应的数据;将预处理后的多种文本数据中的关于信访人的相关信息、受信人相关信息以及信访诉求的文本数据输入到要素抽取模型中进行要素抽取;将关于信访内容以及信访目的的文本数据输入到文本分类模型中进行分类,分别得到要素抽取的结果以及文本分类的结果;将得到的要素抽取的结果以及文本分类的结果推送到终端设备。该方法采用多种模型,能适应不同类型信访件,具有普遍性,并且无需人工进行繁琐要素抽取工作,提高信访人员工作效率。
-
公开(公告)号:CN117421609B
公开(公告)日:2024-04-02
申请号:CN202311722719.1
申请日:2023-12-15
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明公开了一种应用于社交媒体的图像与文本语义相似度计算方法及系统,涉及语义相似度计算技术领域,该方法包括:通过图像场景图生成模型和文本场景图生成模型分别将图像和文本转化为图像场景图和文本场景图;根据图像场景图和文本场景图中物体‑关系‑物体三元组分别构建图像高层语义子图和文本高层语义子图;基于图像场景图和文本场景图中的物体节点和关系节点,利用向量点积计算局部细节匹配分数;基于高层语义子图和文本高层语义子图计算高层语义匹配分数;基于局部细节匹配分数和高层语义匹配分数计算图像与文本的语义相似度。本发明从底层局部细节到高层语义信息来衡量两个模态语义的相关程度,得到更加准确的图像与文本的语义相似度。
-
-
-
-
-
-
-