-
公开(公告)号:CN114139547B
公开(公告)日:2023-07-04
申请号:CN202111416144.1
申请日:2021-11-25
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30 , G06F40/295
Abstract: 本公开涉及一种知识融合方法、装置、设备、系统及介质。其中,知识融合法包括:基于第一实体数据中的第一实体名,获取第一实体数据对应的实体的至少一个实体别称,得到实体名称集;基于实体名称集,检测第一实体名和第二实体数据中的第二实体名是否匹配;在检测到第一实体名和第二实体名匹配时,将第一实体数据和第二实体数据进行融合,得到融合实体数据。根据本公开实施例,能够根据两条实体数据中的实体名是否匹配来判断它们是否需要融合,以减少计算量,提高融合效率,并且在两条实体数据中的实体名不匹配时,能够根据该两条实体数据的多维度相似度进行融合判别,以提高判别精度,进而实现多来源知识的融合,达到精准有效融合效果。
-
公开(公告)号:CN114218381B
公开(公告)日:2022-08-30
申请号:CN202111493451.X
申请日:2021-12-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种立场识别方法、装置、设备及介质。其中,立场识别方法包括:获取待识别的目标文本;对目标文本进行语义识别处理,得到目标文本的整体语义向量;基于预先定义的话题分类模板,对目标文本进行话题识别处理,得到目标文本的话题表示向量;基于整体语义向量和话题表示向量,对目标文本进行立场分类,得到目标文本对应的目标立场类别。根据本公开实施例,能够准确地识别出目标文本所涉及的话题表示向量,从而可以结合文本语义与文本话题对目标文本进行更准确的立场识别。
-
公开(公告)号:CN114218381A
公开(公告)日:2022-03-22
申请号:CN202111493451.X
申请日:2021-12-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种立场识别方法、装置、设备及介质。其中,立场识别方法包括:获取待识别的目标文本;对目标文本进行语义识别处理,得到目标文本的整体语义向量;基于预先定义的话题分类模板,对目标文本进行话题识别处理,得到目标文本的话题表示向量;基于整体语义向量和话题表示向量,对目标文本进行立场分类,得到目标文本对应的目标立场类别。根据本公开实施例,能够准确地识别出目标文本所涉及的话题表示向量,从而可以结合文本语义与文本话题对目标文本进行更准确的立场识别。
-
公开(公告)号:CN114139547A
公开(公告)日:2022-03-04
申请号:CN202111416144.1
申请日:2021-11-25
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30 , G06F40/295
Abstract: 本公开涉及一种知识融合方法、装置、设备、系统及介质。其中,知识融合法包括:基于第一实体数据中的第一实体名,获取第一实体数据对应的实体的至少一个实体别称,得到实体名称集;基于实体名称集,检测第一实体名和第二实体数据中的第二实体名是否匹配;在检测到第一实体名和第二实体名匹配时,将第一实体数据和第二实体数据进行融合,得到融合实体数据。根据本公开实施例,能够根据两条实体数据中的实体名是否匹配来判断它们是否需要融合,以减少计算量,提高融合效率,并且在两条实体数据中的实体名不匹配时,能够根据该两条实体数据的多维度相似度进行融合判别,以提高判别精度,进而实现多来源知识的融合,达到精准有效融合效果。
-
公开(公告)号:CN114139541B
公开(公告)日:2022-08-02
申请号:CN202111389485.4
申请日:2021-11-22
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295 , G06F16/35
Abstract: 本公开涉及一种命名实体识别方法、装置、设备及介质。其中,命名实体识别方法包括:获取待识别的目标文本;对目标文本进行语义特征编码,得到具有上下文信息的第一编码向量,以及对目标文本进行实体特征编码,得到具有上下文信息的第二编码向量;基于第一编码向量,提取实体片段对应的边界信息;基于第一编码向量、第二编码向量和边界信息,对目标文本进行实体分类,得到目标文本对应的目标实体类别。根据本公开实施例,能够快速地从非结构化文本中提取出实体类别信息,并且提高对非结构化文本进行实体类别分类的准确性。
-
公开(公告)号:CN114155530A
公开(公告)日:2022-03-08
申请号:CN202111328925.5
申请日:2021-11-10
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V30/148 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种文本识别及问答方法、装置、设备及介质。其中,文本识别方法包括:获取待识别图像;对待识别图像进行文本识别,得到文本识别结果,文本识别结果包括多个连续文本片段;计算待拼接文本片段对的语义关联得分;在待拼接文本片段对的语义关联得分满足预设语义关联条件的情况下,对待拼接文本片段对进行文本拼接,得到待识别图像的文本内容。根据本公开实施例,能够提高图文识别精度。
-
公开(公告)号:CN114139541A
公开(公告)日:2022-03-04
申请号:CN202111389485.4
申请日:2021-11-22
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295 , G06F16/35
Abstract: 本公开涉及一种命名实体识别方法、装置、设备及介质。其中,命名实体识别方法包括:获取待识别的目标文本;对目标文本进行语义特征编码,得到具有上下文信息的第一编码向量,以及对目标文本进行实体特征编码,得到具有上下文信息的第二编码向量;基于第一编码向量,提取实体片段对应的边界信息;基于第一编码向量、第二编码向量和边界信息,对目标文本进行实体分类,得到目标文本对应的目标实体类别。根据本公开实施例,能够快速地从非结构化文本中提取出实体类别信息,并且提高对非结构化文本进行实体类别分类的准确性。
-
公开(公告)号:CN115952261A
公开(公告)日:2023-04-11
申请号:CN202211583589.3
申请日:2022-12-09
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本发明提供了一种基于多任务学习的生成式阅读理解方法,所述方法包括如下步骤:获取目标问题和目标段落,获取目标问题和目标段落的对应的特征向量,将特征向量输入到目标阅读理解模型,获取目标答案;从而提高目标答案的准确性和可靠性。
-
-
-
-
-
-
-