-
公开(公告)号:CN116910191A
公开(公告)日:2023-10-20
申请号:CN202310273772.1
申请日:2023-03-17
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/332 , G06F16/35 , G06F16/36 , G06F40/30
Abstract: 本申请公开了一种多轮对话的预训练方法、装置、设备及存储介质,涉及通信技术领域,以解决现有技术无法全面、准确地获取多轮对话中的特征信息的问题。轮对话的预训练方法,包括:对多轮对话文本进行基于对话语义的预训练,获取第一预训练结果;对所述多轮对话文本进行基于对话结构的预训练,获取第二预训练结果,所述第二预训练结果为图形结构。
-
公开(公告)号:CN116910054A
公开(公告)日:2023-10-20
申请号:CN202310559630.1
申请日:2023-05-18
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/22 , G06F40/289 , G06F16/28
Abstract: 本申请公开了一种数据处理方法、装置、电子设备及计算机可读存储介质,涉及互联网技术领域,以解决现有数据匹配方法匹配准确率较低的问题。该方法包括:获取用户输入的描述语句;从预先建立的场景数据库中,确定所述描述语句所属的目标场景类型对应的目标子库;从目标子库中查找与描述语句匹配的M条第一场景数据;针对每条所述第一场景数据,计算所述第一场景数据与描述语句的文本相似度;显示所述M条第一场景数据中与所述描述语句的文本相似度最大的前N条第一场景数据。本申请实施例通过场景数据类型锁定匹配的子库,并采用双重检索机制确定匹配的场景数据,能够提升匹配精确度。
-
公开(公告)号:CN118796858A
公开(公告)日:2024-10-18
申请号:CN202410200026.4
申请日:2024-02-22
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/242 , G06F18/214 , G06F40/30
Abstract: 本申请公开了一种数据库语句生成方法,所述方法包括:确定用户的输入文本和与输入文本相关联的数据库中全部数据表的表信息;将输入文本与数据库中全部数据表的表信息输入至预训练好的大语言模型中,得到大语言模型输出的表数据集;表数据集包括一个或多个数据表名和对应的字段名,数据表名和对应的字段名与输入文本相关联;将得到的表数据集和输入文本输入至大语言模型中,得到大语言模型输出的输入文本对应的数据库语句。
-
公开(公告)号:CN116915894A
公开(公告)日:2023-10-20
申请号:CN202310188641.3
申请日:2023-03-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Abstract: 本公开提供一种来电身份识别方法、装置、电子设备和可读存储介质,涉及人工智能技术领域,其中,所述方法包括:获取来电方的目标对话文本信息;将所述目标对话文本信息与预设的来电文本库中的至少一个对话文本信息进行文本匹配和/或语义匹配,得到匹配结果;根据所述匹配结果,确定所述来电方是机器人或自然人。通过获取来电方的目标对话文本信息,并根据预设的来电文本库中的至少一个对话文本信息,对所述目标对话文本信息进行文本匹配和/或语义匹配,得到用于指示来电方身份的匹配结果,进而根据匹配结果,确定来电方是机器人或自然人,以完成对来电方的自然人身份或机器人身份的识别。
-
公开(公告)号:CN116361452A
公开(公告)日:2023-06-30
申请号:CN202111618503.1
申请日:2021-12-27
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Inventor: 钞芳宁
IPC: G06F16/35 , G06N3/0442 , G06F40/284 , G06F40/30
Abstract: 本申请公开了一种文本分类方法、装置、电子设备及存储介质。其中,方法包括:获取第一文本;对所述第一文本进行预处理,得到所述第一文本中包括的字向量和所述字向量对应的至少一个词向量;基于词格循环神经网络(Lattice‑LSTM)模型对所述字向量和所述至少一个词向量中的每个词向量加权融合处理,得到所述每个词向量对应的每个位置的词格向量;基于胶囊网络模型对所述词格向量进行语义聚合,得到所述每个位置的第一语义向量;确定所述每个位置的第一语义向量对应的类别标签,将所述类别标签作为所述第一文本的分类。
-
-
-
-