-
公开(公告)号:CN119003791A
公开(公告)日:2024-11-22
申请号:CN202411455598.3
申请日:2024-10-18
Applicant: 北京北大软件工程股份有限公司
Abstract: 本申请公开了一种篇章级关系抽取方法、装置、设备、介质及产品,涉及自然语言处理技术领域,该方法包括:获取待抽取篇章级关系的目标篇章文档;获取目标篇章文档中的第一关系三元组;根据第一关系三元组中的关系在预设规则库中获取与关系对应的目标规则,目标规则包括:关系与新推断关系的映射关系,以及新推断关系中的实体的属性信息;根据目标篇章文档、第一关系三元组中包括的实体的属性信息和目标规则,推断第一关系三元组中包含的新推断关系三元组;输出第一关系三元组和新推断关系三元组。本申请可以提升推断出的新的关系组的准确性。
-
公开(公告)号:CN111708875B
公开(公告)日:2023-11-03
申请号:CN202010491272.1
申请日:2020-06-02
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/335 , G06F16/33 , G06Q50/18
Abstract: 本申请涉及一种基于处罚特征的行政执法类案推荐方法,该方法,包括:采集未结案案件的文本信息;根据未结案案件的文本信息,获取未结案案件与已结案的行政处罚案件的相似度;根据未结案案件与已结案的行政处罚案件的相似度确定与未结案案件相似的案件。本申请提供的技术方案,类案推荐结果的精确度高,效率高,更符合使用者期望。
-
公开(公告)号:CN109614460B
公开(公告)日:2023-03-10
申请号:CN201811542431.5
申请日:2018-12-17
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/30 , G06F16/2458 , G06Q50/18
Abstract: 本申请涉及法条数据处理方法、装置、存储介质及电子设备,属于数据处理技术领域。本申请包括:获取数据库中的法条数据;通过预设的规则确定法条的句式复杂程度,所述句式复杂程度包括:句式简单或者句式复杂;根据确定出的所述句式复杂程度对法条进行拆分处理。通过本申请可以实现根据法条的句式复杂程度对法条进行相应的拆分处理,有助于满足对法条的拆分处理精准度需求。
-
公开(公告)号:CN109684448B
公开(公告)日:2021-01-12
申请号:CN201811542429.8
申请日:2018-12-17
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/332 , G06F16/36
Abstract: 本申请涉及一种智能问答方法,属于自然语言处理技术领域。本申请在获取用户输入的自然语言问句后,通过预设的组合模板判断该问句是否存在复杂语义,如果判断出存在复杂语义,利用组合模板解析复杂语义部分内容得到第一解析信息,以及利用自然语言模型解析简单语义部分内容得到第二解析信息,然后综合第一解析信息和第二解析信息得到能够表达自然语言问句完整语义的图查询语言,进而进行查询得到答案。本申请使用组合模板对问句复杂语义内容进行处理,并基于知识图谱作问答,利用知识图谱对数据非常好的描述能力,实现本申请在具体应用中无需使用大量的质量高的问答语料,进而有助于提升对包含复杂语义的自然语言问句回答的准确性。
-
公开(公告)号:CN109523446A
公开(公告)日:2019-03-26
申请号:CN201811220594.1
申请日:2018-10-19
Applicant: 北京北大软件工程股份有限公司
IPC: G06Q50/26
Abstract: 本发明实施例公开一种面向价格领域的大数据处理分析系统,包括:价格数据获取模块,用于利用预设数据获取方式,获取多源异构的价格数据;分布式处理模块,用于采用大数据分布式处理技术,对价格数据进行处理;大数据分析模块,用于对处理后的价格数据进行大数据分析;可视化展示模块,用于将大数据分析后得到的数据结果通过可视的、交互的方式进行展示。本发明实施例采用多样化的先进数据采集方式,能高效、准确的获取不同渠道多种复杂数据结构的价格数据,通过采用可靠、高效、高扩展性、高容错性的分布式数据处理方法,提高了数据处理效率,通过可视化展示模块可随时查看、监测和管理,能实现价格数据资源及时交换共享,大数据融合处理。
-
公开(公告)号:CN118627506A
公开(公告)日:2024-09-10
申请号:CN202411110723.7
申请日:2024-08-14
Applicant: 北京北大软件工程股份有限公司
IPC: G06F40/284 , G06F18/22 , G06N3/0499 , G06N3/0464
Abstract: 本申请公开了一种答案文段提取方法、装置、设备、介质及产品,涉及自然语言处理技术领域,该方法包括:接收用户问题和对应答案所在的文档;分别获取用户问题中词元的词向量、文档中词元的词向量和全局词元的词向量;获取文档中词元的词向量对应的所有候选答案文段的表示向量;获取用户问题中词元的词向量对应的问题表示向量和全局词元的词向量对应的全局阈值表示向量;获取各个候选答案文段的表示向量与问题表示向量之间的第一相似度,以及全局阈值表示向量与问题表示向量之间的第二相似度;获取第一相似度中大于第二相似度的目标相似度;输出目标相似度对应的目标候选答案文段。本申请可以处理文档中的答案文段是由多个文段组成的任务。
-
公开(公告)号:CN111553160B
公开(公告)日:2024-02-02
申请号:CN202010332120.7
申请日:2020-04-24
Applicant: 北京北大软件工程股份有限公司
IPC: G06F40/295 , G06F40/35 , G06F16/332 , G06F16/33 , G06F16/35 , G06Q50/18
Abstract: 本发明公开了一种获取法律领域问句答案的方法和系统,属于语义理解领域,在获取用户的自然语言问句后生成词语的实体,识别实体并将实体分为命名实体和一般实体,根据命名实体和一般实体的关系生成语法依存树,根据语法依存树生成实体间的谓词路径,在根据谓词路径生成查询语句,执行查询语句从数据库中获取用户问句的答案。通过上述方案能够理解用户的语义,帮助用户快速准确的获取问句的答案,同时获取的答案更全面。
-
公开(公告)号:CN111858732A
公开(公告)日:2020-10-30
申请号:CN202010672743.9
申请日:2020-07-14
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/25 , G06F16/28 , G06F16/215 , G06F40/295 , G06N20/00 , G06F16/2458 , G06F16/248
Abstract: 本申请涉及数据融合方法及终端,属于数据融合技术领域。本申请包括:接收输入的数据,基于数据的元数据进行数据理解处理,包括:根据数据的数据值进行属性分类,以及为各属性建立对应的有效性判断和数据转换解析器;确定数据的数据值分布情况,并利用有效性判断和数据转换解析器进行有效性判断;对判断为有效的数据,利用对应的有效性判断和数据转换解析器,进行数据转换,输出融合数据进行存储。通过本申请,有助于实现形成元数据规范,数据标准统一,数据格式整齐的数据融合。
-
公开(公告)号:CN111475623A
公开(公告)日:2020-07-31
申请号:CN202010273401.X
申请日:2020-04-09
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/36
Abstract: 本申请涉及一种基于知识图谱的案件信息语义检索方法及装置,基于知识图谱的案件信息语义检索方法包括根据法律文书构建法治知识图谱;对用户输入的问题进行简单识别和意图识别;定义sparql语言查询模板,根据意图识别结果匹配相应sparql语言查询模板在法治知识图谱中进行第一检索,为第一检索结果赋予第一置信度;搭建全文搜索引擎,将简单识别结果在全文搜索引擎中进行第二检索,为第二检索结果赋予第二置信度;根据第一置信度和所述第二置信度输出最终检索结果。本申请可以充分挖掘实体之间的联系,完成复杂的多跳语义检索,即使法治知识图谱的语义检索出现不能满足要求的输出时也可以基于全文搜索引擎返回检索结果,进一步提高检索效率和准确性。
-
公开(公告)号:CN109684448A
公开(公告)日:2019-04-26
申请号:CN201811542429.8
申请日:2018-12-17
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/332 , G06F16/36
Abstract: 本申请涉及一种智能问答方法,属于自然语言处理技术领域。本申请在获取用户输入的自然语言问句后,通过预设的组合模板判断该问句是否存在复杂语义,如果判断出存在复杂语义,利用组合模板解析复杂语义部分内容得到第一解析信息,以及利用自然语言模型解析简单语义部分内容得到第二解析信息,然后综合第一解析信息和第二解析信息得到能够表达自然语言问句完整语义的图查询语言,进而进行查询得到答案。本申请使用组合模板对问句复杂语义内容进行处理,并基于知识图谱作问答,利用知识图谱对数据非常好的描述能力,实现本申请在具体应用中无需使用大量的质量高的问答语料,进而有助于提升对包含复杂语义的自然语言问句回答的准确性。
-
-
-
-
-
-
-
-
-