-
公开(公告)号:CN108959327A
公开(公告)日:2018-12-07
申请号:CN201710391804.2
申请日:2017-05-27
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种业务处理方法,包括:获取用户问题;将所述用户问题通过动作分类器,形成动作分类概率向量;并将所述用户问题通过业务分类器,形成业务分类概率向量;利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签;在信息维度表中查找所述用户问题的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;所述信息维度表为由动作、业务所形成的二维表;根据确定的业务逻辑,完成对所述用户问题的应答处理。本发明同时还公开了一种业务处理装置及计算机可读存储介质。
-
公开(公告)号:CN107958004A
公开(公告)日:2018-04-24
申请号:CN201610902538.0
申请日:2016-10-17
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团公司
IPC: G06F17/30
CPC classification number: G06F17/30289 , G06F17/30595
Abstract: 本发明的实施例提供一种知识库的构建方法和装置,方法包括:获取知识点;将知识点按照该知识点所属的业务划分为多个知识块;按照预设存储结构将所述多个知识块形成的知识块集存储在知识库中。本发明的方案通过对知识点进行分解,以知识块集合的形式进行细粒度存储,降低了知识在融合和共享方面的复杂性,在知识搜索方面也可以实现精确的知识反馈,满足用户对不同颗粒度的知识快速获取。
-
公开(公告)号:CN108959327B
公开(公告)日:2021-03-05
申请号:CN201710391804.2
申请日:2017-05-27
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/35
Abstract: 本发明公开了一种业务处理方法,包括:获取用户问题;将所述用户问题通过动作分类器,形成动作分类概率向量;并将所述用户问题通过业务分类器,形成业务分类概率向量;利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签;在信息维度表中查找所述用户问题的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;所述信息维度表为由动作、业务所形成的二维表;根据确定的业务逻辑,完成对所述用户问题的应答处理。本发明同时还公开了一种业务处理装置及计算机可读存储介质。
-
公开(公告)号:CN116263781A
公开(公告)日:2023-06-16
申请号:CN202111528843.5
申请日:2021-12-14
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本申请提供一种数据预测方法、装置及电子设备,所述方法包括:获取输入数据,所述输入数据包括目标问题和多方对话数据;使用第一模型对所述目标问题和所述多方对话数据进行特征提取,以得到第一特征向量;基于所述多方对话数据构建所述多方对话数据的图网络;使用第二模型对所述第一特征向量和所述图网络进行特征提取,以得到第二特征向量;使用第三模型对所述第一特征向量和所述第二特征向量进行预测,以得到所述目标问题的答案。本申请可以提高答案预测的效率。
-
公开(公告)号:CN112949255B
公开(公告)日:2025-02-18
申请号:CN201911267701.0
申请日:2019-12-11
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 清华大学
IPC: G06F40/126 , G06F40/284 , G06F40/30 , G06F40/247
Abstract: 本发明提供一种词向量训练方法及装置,该方法包括:对单词的初始化词向量的进行预训练,得到预训练词向量;使用语义融合的释义自编码器对所述预训练词向量进行训练,得到目标词向量;其中,所述语义融合的释义自编码器融合所述单词的语义关系和所述单词的词典释义;本发明实施例在语义融合的释义自编码器中融合语义关系和词典释义,显著提高词向量对语义相似性的建模能力;使用该语义融合的释义自编码器训练得到的目标词向量具有很强的普适性,且该词向量训练方法还具有训练时间短、资源消耗少等优势。
-
公开(公告)号:CN116362253A
公开(公告)日:2023-06-30
申请号:CN202111612866.4
申请日:2021-12-27
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本发明提供一种语义理解方法、装置和电子设备,涉及自然语言处理技术领域。所述语义理解方法包括:将第一事项文本集输入文本生成模型,获取第一事项向量集;获取与所述第一事项文本集的语义相似度大于或等于第一预设值的第二事项文本集以及与所述第一事项文本集的语义相似度小于所述第一预设值的第三事项文本集;根据所述第一事项向量集、所述第二事项文本集和所述第三事项文本集,训练语义理解模型;在所述语义理解模型达到训练目标时,将所述第一事项文本集输入所述语义理解模型中,获得语义信息向量集。本发明的方案,解决了模型训练需要人工获取数据的问题,提高了语义信息的识别准确率和效率。
-
公开(公告)号:CN114638227A
公开(公告)日:2022-06-17
申请号:CN202011477961.3
申请日:2020-12-15
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 北京理工大学
IPC: G06F40/295 , G06F16/35 , G06K9/62
Abstract: 本发明公开了一种命名实体识别方法、装置及存储介质,包括:以token分别使用字和分词后的词两种方式使用BERT模型进行预训练;预训练完成后,分别利用输出部分Transformer最后一层,被隐层的token在最后一个隐藏层拼接token补充信息;在Transformer最后一层位置上面串接一个softmax分类层;分别获取基于字和基于词的每个token的分类概率之后,将基于词的每个token的分类概率转化为基于字的标签概率;根据基于字和基于词的分类概率,每个token取最高值作为该token的标签值。采用本发明,能够提高模型性能;捕捉到的是真正意义上的双向上下文信息;对实体槽位进行补充进行编码,合理利用。
-
公开(公告)号:CN110929498A
公开(公告)日:2020-03-27
申请号:CN201811117561.4
申请日:2018-09-20
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F40/194 , G06F40/216 , G06F40/289
Abstract: 本发明公开了一种短文本相似度的计算方法,该方法包括:获取待匹配文本和参考文本,并计算所述待匹配文本和所述参考文本之间的文本相似度;获取关联文档,并基于所述关联文档、所述待匹配文本和所述参考文本,计算得到所述待匹配文本和参考文本之间的逻辑关联度;其中,所述关联文档用于表征所述待匹配文本和参考文本之间的逻辑关系;基于所述待匹配文本和所述参考文本之间的文本相似度和逻辑关联度,确定所述待匹配文本对应的语义和所述参考文本对应的语义;基于所述待匹配文本对应的语义和所述参考文本对应的语义,计算得到所述待匹配文本和所述参考文本的相似度。本发明的实施例同时公开了一种短文本相似度计算装置和计算机存储介质。
-
公开(公告)号:CN110019738A
公开(公告)日:2019-07-16
申请号:CN201810000847.8
申请日:2018-01-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/332
Abstract: 本发明公开了一种搜索词的处理方法、装置及计算机可读存储介质。其中,方法包括:获取输入的搜索串;所述搜索串包含至少两个关键词;确定所述搜索串中每个关键词的词性;利用确定的每个关键词的词性,从所述至少两个关键词中确定焦点关键词;获取所述焦点关键词的扩展关键词;并确定所述焦点关键词及扩展关键词的权重;所述焦点关键词的权重高于所述搜索串中的其它关键词的权重,且高于所述扩展关键词的权重;利用确定的各关键词的权重、所述搜索串的各关键词以及扩展关键词,生成检索串;所述检索串用于对数据库进行检索,获取在数据库进行检索后的检索结果。
-
公开(公告)号:CN111401064B
公开(公告)日:2024-04-19
申请号:CN201910000943.7
申请日:2019-01-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F40/295
Abstract: 本发明提供一种命名实体识别方法、装置及终端设备,该命名实体识别方法包括:获取待识别数据;对所述待识别数据进行预处理,获得待识别数据的字符向量;将所述字符向量输入至预先训练的基于字的命名实体识别模型中,输出表示待识别数据的命名实体信息的识别结果;根据识别结果,确定所述待识别数据的命名实体;所述命名实体识别模型的训练特征向量包括训练数据的实体边界特征向量,用于提取训练数据的特征时,将同一命名实体的多个字符特征归一为相应命名实体的特征,以基于归一后的命名实体的特征进行模型参数训练。本发明的实施例,可以解决现有基于字的命名实体识别模型存在的实体边界问题,从而提高模型性能,提高命名实体识别时的准确率。
-
-
-
-
-
-
-
-
-