-
公开(公告)号:CN116304036A
公开(公告)日:2023-06-23
申请号:CN202310183515.9
申请日:2023-02-20
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F18/211 , G06F18/214
Abstract: 本申请实施例提供一种特征确定方法、装置、设备、介质及产品,包括:获取当前时刻的输入特征以及与输入特征对应的决策特征,输入特征是基于第一文本样本中的至少一个维度数据确定的;基于输入特征、决策特征、预设文本样本集和预设特征集中的至少三个数据,确定特征关联信息,特征关联信息用于反映特征间的相关性、冗余性和交互性,预设文本样本集包括多个第二文本样本,第二文本样本包括第一文本样本,预设特征集包括多个第一特征;在特征关联信息满足第一预设条件的情况下,确定输入特征为目标特征。本申请实施例,提高了现有技术中特征确定的准确性。
-
公开(公告)号:CN118734834A
公开(公告)日:2024-10-01
申请号:CN202410671540.6
申请日:2024-05-27
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/232 , G06F40/284 , G06F40/30 , G06N3/0455 , G06N3/042 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种文本纠错方法、装置、设备、存储介质及产品,涉及自然语言处理技术领域,所述文本纠错方法包括:获取待纠错的文本数据;对所述文本数据进行图形构建处理,得到特征矩阵图,所述特征矩阵图用于表征所述文本数据中各个文本片段之间的关联关系;基于预设文本纠错模型,对所述特征矩阵图进行纠错处理,得到文本纠错结果,其中,所述预设文本纠错模型是基于BERT模型以及图注意力网络进行联合训练得到的。本申请提高了对文本数据纠错的准确率。
-
公开(公告)号:CN116383371A
公开(公告)日:2023-07-04
申请号:CN202310171921.3
申请日:2023-02-20
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/34 , G06F16/332 , G06N3/045
Abstract: 本申请公开了一种摘要生成模型的训练方法和摘要生成方法、装置及设备。该方法包括:获取多个第一训练样本、多个第二训练样本和第三训练样本;基于多个第一训练样本训练预设的摘要生成模型中的连贯性检测网络,基于多个第二训练样本训练预设的摘要生成模型中的子摘要生成网络,基于多个第三训练样本训练预设的摘要生成模型中的摘要生成网络,直至连贯性检测网络、子摘要生成网络和摘要生成网络均收敛,得到训练后的摘要生成模型。这样,可以使训练后的摘要生成模型更贴合对话文本的特点,从而使该摘要生成模型能够更准确地获取到对话文本的摘要。
-
公开(公告)号:CN116431787A
公开(公告)日:2023-07-14
申请号:CN202310364255.5
申请日:2023-03-31
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F18/241 , G06F18/214 , G06F18/22
Abstract: 本申请公开了一种回复信息的确定方法、装置、设备及计算机存储介质。该方法包括:获取问题信息;将所述问题信息输入至预先训练好的生成模型,通过所述预先训练好的生成模型确定所述问题信息的回复信息;将所述回复信息输入至二分类判别器,在所述二分类判别器输出的判定结果为第一指示信息的情况下,在语料库中检索与所述问题信息有预设相似度的目标问题信息;计算所述回复信息与所述目标问题信息对应的目标回复信息的相似度;在所述相似度大于目标值的情况下,输出所述相似度最高的回复信息。如此改善了回复的不可控性,提高了回复的可靠性。
-
公开(公告)号:CN116431774A
公开(公告)日:2023-07-14
申请号:CN202210001634.3
申请日:2022-01-04
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F16/28 , G06F16/33 , G06F16/338
Abstract: 本申请提供一种问答方法及装置,涉及数据业务技术领域。所述方法包括:根据目标问题,确定各实体和各限定词;根据第一实体、第一限定词以及所述第一实体的关系子图,确定第二实体;在所述第一限定词为终止关键词的情况下,将所述第二实体作为所述目标问题的答案。本申请实施例提供的问答方法及装置,通过确定问题中的实体以及限定词,结合图谱知识判定实体和实体关系列表,通过图检索对实体关系进行路径追踪,判断限定词是否为终止关键词来确定问题的答案,提升了多跳问答解析的准确率。
-
公开(公告)号:CN116775890A
公开(公告)日:2023-09-19
申请号:CN202210215869.2
申请日:2022-03-07
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/36 , G06F40/289 , G06F40/211
Abstract: 本申请提供一种词义消歧的方法及装置,其中该方法,包括:基于RPA知识图谱,确定待消歧文本中存在的待消歧实体,以及对应的候选实体列表;基于候选实体列表中每个候选实体,和待消歧实体,通过RPA特征提取,确定候选实体对应的嵌入特征,和待消歧实体对应的嵌入特征;基于词义消歧模型,每个候选实体对应的嵌入特征,以及待消歧实体对应的嵌入特征,确定待消歧实体是否和候选实体为同一个实体。本申请通过综合实体嵌入特征、实体上下文嵌入特征和词语嵌入特征,实现对待消歧文本和候选文本嵌入特征的比对,确定待消歧实体是否和候选实体为同一个实体,获取的文本信息更丰富和全面,有利于准确分析文本词义,提升词义消歧准确率。
-
-
-
-
-