-
公开(公告)号:CN110929498B
公开(公告)日:2023-05-09
申请号:CN201811117561.4
申请日:2018-09-20
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F40/194 , G06F40/216 , G06F40/289
Abstract: 本发明公开了一种短文本相似度的计算方法,该方法包括:获取待匹配文本和参考文本,并计算所述待匹配文本和所述参考文本之间的文本相似度;获取关联文档,并基于所述关联文档、所述待匹配文本和所述参考文本,计算得到所述待匹配文本和参考文本之间的逻辑关联度;其中,所述关联文档用于表征所述待匹配文本和参考文本之间的逻辑关系;基于所述待匹配文本和所述参考文本之间的文本相似度和逻辑关联度,确定所述待匹配文本对应的语义和所述参考文本对应的语义;基于所述待匹配文本对应的语义和所述参考文本对应的语义,计算得到所述待匹配文本和所述参考文本的相似度。本发明的实施例同时公开了一种短文本相似度计算装置和计算机存储介质。
-
公开(公告)号:CN110020181B
公开(公告)日:2021-05-25
申请号:CN201810000845.9
申请日:2018-01-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/9535
Abstract: 本发明公开了一种推荐信息的处理方法、装置及计算机可读存储介质。其中,所述方法包括:利用查询请求,确定第一业务知识点;确定所述第一业务知识点的向量;利用所述第一业务知识点的向量及数据库中其它各业务知识点的向量,确定所述第一业务知识点与其它各业务知识点的相似度;所述业务知识点的向量是基于业务知识点在问题序列中的位置确定的;所述问题序列是利用日志数据生成的;所述问题序列具有时序性;利用确定的各相似度,从所述数据库中选择相应的第二业务知识点,作为所述查询请求对应的推荐信息。
-
公开(公告)号:CN111191465A
公开(公告)日:2020-05-22
申请号:CN201811250432.2
申请日:2018-10-25
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F40/35 , G06F16/332
Abstract: 本申请实施例公开了一种问答匹配方法、装置、设备及存储介质,其中,所述方法包括:确定待解答问题的句子横向向量为第一横向量;确定所述待解答问题的每一候选答案的句子横向向量为第二横向量;根据所述第一横向量和每一候选答案的第二横向量,确定所述待解答问题与对应的候选答案之间的相关度值;将满足预设条件的所述相关度值所对应的候选答案,确定为所述待解答问题的解答结果。
-
公开(公告)号:CN111046149A
公开(公告)日:2020-04-21
申请号:CN201811191554.9
申请日:2018-10-12
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F40/211 , G06F40/289
Abstract: 本发明实施例公开了一种内容推荐方法及装置、电子设备及存储介质。所述内容推荐方法,包括:基于上下文信息,获取上下文语境信息;结合所述上下文语境信息及当前对话内容,确定用户意图;基于所述用户意图,确定待推荐的内容。
-
公开(公告)号:CN114638227B
公开(公告)日:2025-01-10
申请号:CN202011477961.3
申请日:2020-12-15
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 北京理工大学
IPC: G06F40/295 , G06F16/35 , G06F18/2415
Abstract: 本发明公开了一种命名实体识别方法、装置及存储介质,包括:以token分别使用字和分词后的词两种方式使用BERT模型进行预训练;预训练完成后,分别利用输出部分Transformer最后一层,被隐层的token在最后一个隐藏层拼接token补充信息;在Transformer最后一层位置上面串接一个softmax分类层;分别获取基于字和基于词的每个token的分类概率之后,将基于词的每个token的分类概率转化为基于字的标签概率;根据基于字和基于词的分类概率,每个token取最高值作为该token的标签值。采用本发明,能够提高模型性能;捕捉到的是真正意义上的双向上下文信息;对实体槽位进行补充进行编码,合理利用。
-
公开(公告)号:CN116932741A
公开(公告)日:2023-10-24
申请号:CN202210351256.1
申请日:2022-04-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/34 , G06F16/335
Abstract: 本申请公开了一种摘要生成方法及装置,涉及文本摘要技术领域。该摘要生成方法,包括:获取目标向量表示,目标向量表示是目标文本的向量表示;按照静态领域知识库中的描述向量表示与目标向量表示的匹配度从高到低的顺序,从静态领域知识库的描述向量表示中确定K个第一向量表示;从静态领域知识库中获取K个第一领域知识;根据所述K个第一领域知识以及每个所述第一领域知识与所述目标文本的匹配度,生成所述目标文本对应的摘要。上述方案,通过在静态领域知识库中检索匹配K个领域知识的第一向量表示,进而基于该向量表示进行摘要内容的生成,能够提高为目标文本匹配的领域知识的准确度,进而改善为目标文本生成的摘要的质量。
-
公开(公告)号:CN111191465B
公开(公告)日:2023-05-09
申请号:CN201811250432.2
申请日:2018-10-25
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F40/35 , G06F16/332
Abstract: 本申请实施例公开了一种问答匹配方法、装置、设备及存储介质,其中,所述方法包括:确定待解答问题的句子横向向量为第一横向量;确定所述待解答问题的每一候选答案的句子横向向量为第二横向量;根据所述第一横向量和每一候选答案的第二横向量,确定所述待解答问题与对应的候选答案之间的相关度值;将满足预设条件的所述相关度值所对应的候选答案,确定为所述待解答问题的解答结果。
-
公开(公告)号:CN113011160A
公开(公告)日:2021-06-22
申请号:CN201911319728.X
申请日:2019-12-19
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 北京理工大学
IPC: G06F40/211 , G06F40/216 , G06F40/279 , G06K9/62
Abstract: 本发明公开了一种文本摘要生成方法、装置、设备及存储介质。其中,该方法包括:获取需要生成文本摘要的目标文档;基于混合式文本摘要识别模型对所述目标文档进行识别,得到所述目标文档的文本摘要;其中,所述混合式文本摘要识别模型为通过强化学习的方法连接第一识别模型和第二识别模型生成的,所述第一识别模型用于输出抽取式文本摘要,所述第二识别模型用于输出生成式文本摘要。可以充分利用第一识别模型和第二识别模型的优点,支持处理较长文档,并生成概括性较高的新颖句子,且识别的速度和生成的文本摘要的质量均优于单独使用第一识别模型和第二识别模型。
-
公开(公告)号:CN110020181A
公开(公告)日:2019-07-16
申请号:CN201810000845.9
申请日:2018-01-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/9535
Abstract: 本发明公开了一种推荐信息的处理方法、装置及计算机可读存储介质。其中,所述方法包括:利用查询请求,确定第一业务知识点;确定所述第一业务知识点的向量;利用所述第一业务知识点的向量及数据库中其它各业务知识点的向量,确定所述第一业务知识点与其它各业务知识点的相似度;所述业务知识点的向量是基于业务知识点在问题序列中的位置确定的;所述问题序列是利用日志数据生成的;所述问题序列具有时序性;利用确定的各相似度,从所述数据库中选择相应的第二业务知识点,作为所述查询请求对应的推荐信息。
-
公开(公告)号:CN116562369A
公开(公告)日:2023-08-08
申请号:CN202210093575.7
申请日:2022-01-26
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06N5/02 , G06F40/247 , G06F18/22 , G06N20/20
Abstract: 本申请提供一种问答知识库扩充方法、问答方法及相关设备,所述问答知识库扩充方法包括:使用第一模型对第一问题进行相似问题预测,以得到第一问题的相似问题;基于所述相似问题,扩充问答知识库,所述问答知识库包括第一问题。本申请可以提高问答知识库扩充的效率。
-
-
-
-
-
-
-
-
-