-
公开(公告)号:CN111783418B
公开(公告)日:2024-04-05
申请号:CN202010517766.2
申请日:2020-06-09
Applicant: 北京北大软件工程股份有限公司
IPC: G06F40/205 , G06F40/247 , G06F40/30
Abstract: 本发明涉及一种中文词义表示学习方法及装置,包括获取训练语料,生成全局上下文矩阵;对HowNet知识库进行解析,生成词义‑词相似度矩阵;根据所述全局上下文矩阵和词义‑词相似度矩阵,计算生成全局词义上下文向量;对所述全局词义上下文向量进行词义软消歧;采用基于注意力拓展的跳字模型对词义软消歧后的词义向量进行训练,输出词义向量。本发明通过提出的上下文软消歧机制,能够捕捉词的真正词义,提高深度学习模型在下游任务的效果。
-
公开(公告)号:CN110413954B
公开(公告)日:2023-08-04
申请号:CN201910686793.X
申请日:2019-07-29
Applicant: 北京北大软件工程股份有限公司
IPC: G06F40/106 , G06F40/186 , G06F3/12
Abstract: 本发明涉及一种制式文件打印预览方法、装置、设备和存储介质,该方法包括:获取格式优化规则、打印设置参数、表单模板数据和表单数据;装载并解析所述表单模板数据和表单数据,以确定生成所述制式文件的基础框架信息和版式调优过程的客体信息;根据所述格式优化规则、打印设置参数、基础框架信息和客体信息,基于已装载模板文件进行格式优化和调整,以生成页面形式的制式文件;将所述页面形式的制式文件转化为矢量图形式进行预览。实现了打印格式的智能优化,以及,在脱离打印设备情况下的制式文件预览生成。
-
公开(公告)号:CN114490953B
公开(公告)日:2022-08-19
申请号:CN202210401413.5
申请日:2022-04-18
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/126 , G06F40/279
Abstract: 本申请实施例提供了训练事件抽取模型、事件抽取的方法和目标事件抽取模型,该方法包括:对目标事件抽取模型的第i次训练过程包括如下步骤:根据所有实体标签获取目标训练文本编码,并且获取所有论元角色编码;将所述目标训练文本编码和所有论元角色编码通过注意力机制模块进行融合,获得融合论元角色编码和融合训练文本编码;基于所述融合论元角色编码对事件检测模块进行训练,以及基于所述融合训练文本编码对论元分类模块进行训练;其中,i为大于或等于1的整数。通过本申请的一些实施例能够实现无需使用触发词即可实现事件抽取任务,同时能够提高事件抽取任务的准确率。
-
公开(公告)号:CN114490953A
公开(公告)日:2022-05-13
申请号:CN202210401413.5
申请日:2022-04-18
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/126 , G06F40/279
Abstract: 本申请实施例提供了训练事件抽取模型、事件抽取的方法和目标事件抽取模型,该方法包括:对目标事件抽取模型的第i次训练过程包括如下步骤:根据所有实体标签获取目标训练文本编码,并且获取所有论元角色编码;将所述目标训练文本编码和所有论元角色编码通过注意力机制模块进行融合,获得融合论元角色编码和融合训练文本编码;基于所述融合论元角色编码对事件检测模块进行训练,以及基于所述融合训练文本编码对论元分类模块进行训练;其中,i为大于或等于1的整数。通过本申请的一些实施例能够实现无需使用触发词即可实现事件抽取任务,同时能够提高事件抽取任务的准确率。
-
公开(公告)号:CN111708875A
公开(公告)日:2020-09-25
申请号:CN202010491272.1
申请日:2020-06-02
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/335 , G06F16/33 , G06Q50/18
Abstract: 本申请涉及一种基于处罚特征的行政执法类案推荐方法,该方法,包括:采集未结案案件的文本信息;根据未结案案件的文本信息,获取未结案案件与已结案的行政处罚案件的相似度;根据未结案案件与已结案的行政处罚案件的相似度确定与未结案案件相似的案件。本申请提供的技术方案,类案推荐结果的精确度高,效率高,更符合使用者期望。
-
公开(公告)号:CN110413954A
公开(公告)日:2019-11-05
申请号:CN201910686793.X
申请日:2019-07-29
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明涉及一种制式文件打印预览方法、装置、设备和存储介质,该方法包括:获取格式优化规则、打印设置参数、表单模板数据和表单数据;装载并解析所述表单模板数据和表单数据,以确定生成所述制式文件的基础框架信息和版式调优过程的客体信息;根据所述格式优化规则、打印设置参数、基础框架信息和客体信息,基于已装载模板文件进行格式优化和调整,以生成页面形式的制式文件;将所述页面形式的制式文件转化为矢量图形式进行预览。实现了打印格式的智能优化,以及,在脱离打印设备情况下的制式文件预览生成。
-
公开(公告)号:CN119003791B
公开(公告)日:2025-01-21
申请号:CN202411455598.3
申请日:2024-10-18
Applicant: 北京北大软件工程股份有限公司
Abstract: 本申请公开了一种篇章级关系抽取方法、装置、设备、介质及产品,涉及自然语言处理技术领域,该方法包括:获取待抽取篇章级关系的目标篇章文档;获取目标篇章文档中的第一关系三元组;根据第一关系三元组中的关系在预设规则库中获取与关系对应的目标规则,目标规则包括:关系与新推断关系的映射关系,以及新推断关系中的实体的属性信息;根据目标篇章文档、第一关系三元组中包括的实体的属性信息和目标规则,推断第一关系三元组中包含的新推断关系三元组;输出第一关系三元组和新推断关系三元组。本申请可以提升推断出的新的关系组的准确性。
-
公开(公告)号:CN118627506B
公开(公告)日:2024-11-08
申请号:CN202411110723.7
申请日:2024-08-14
Applicant: 北京北大软件工程股份有限公司
IPC: G06F40/284 , G06F18/22 , G06N3/0499 , G06N3/0464
Abstract: 本申请公开了一种答案文段提取方法、装置、设备、介质及产品,涉及自然语言处理技术领域,该方法包括:接收用户问题和对应答案所在的文档;分别获取用户问题中词元的词向量、文档中词元的词向量和全局词元的词向量;获取文档中词元的词向量对应的所有候选答案文段的表示向量;获取用户问题中词元的词向量对应的问题表示向量和全局词元的词向量对应的全局阈值表示向量;获取各个候选答案文段的表示向量与问题表示向量之间的第一相似度,以及全局阈值表示向量与问题表示向量之间的第二相似度;获取第一相似度中大于第二相似度的目标相似度;输出目标相似度对应的目标候选答案文段。本申请可以处理文档中的答案文段是由多个文段组成的任务。
-
公开(公告)号:CN111475623B
公开(公告)日:2023-08-22
申请号:CN202010273401.X
申请日:2020-04-09
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/36
Abstract: 本申请涉及一种基于知识图谱的案件信息语义检索方法及装置,基于知识图谱的案件信息语义检索方法包括根据法律文书构建法治知识图谱;对用户输入的问题进行简单识别和意图识别;定义sparql语言查询模板,根据意图识别结果匹配相应sparql语言查询模板在法治知识图谱中进行第一检索,为第一检索结果赋予第一置信度;搭建全文搜索引擎,将简单识别结果在全文搜索引擎中进行第二检索,为第二检索结果赋予第二置信度;根据第一置信度和所述第二置信度输出最终检索结果。本申请可以充分挖掘实体之间的联系,完成复杂的多跳语义检索,即使法治知识图谱的语义检索出现不能满足要求的输出时也可以基于全文搜索引擎返回检索结果,进一步提高检索效率和准确性。
-
公开(公告)号:CN114860873A
公开(公告)日:2022-08-05
申请号:CN202210424334.6
申请日:2022-04-22
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/33 , G06F16/34 , G06F40/194 , G06F40/242 , G06F40/253 , G06K9/62
Abstract: 本申请一些实施例提供了一种生成文本摘要的方法、装置及存储介质,涉及信息处理技术领域,该方法包括对初始文本进行分块处理,获取处理后的文本数据;将所述文本数据输入到目标摘要生成模型,获取目标摘要,其中,所述目标摘要生成模型包括第一目标文本模型和第二目标文本模型,所述第一目标文本模型是通过训练第一文本模型得到的,所述第二目标文本模型是通过训练第二文本模型得到的,所述第一目标文本模型用于提取所述文本数据包括的目标信息,所述第二目标文本模型用于根据所述目标信息生成所述目标摘要。本申请一些实施例可以对文本进行准确地信息提取,生成质量较高的文本摘要,且解决了文本信息丢失的问题。
-
-
-
-
-
-
-
-
-