-
公开(公告)号:CN118606356A
公开(公告)日:2024-09-06
申请号:CN202410851447.3
申请日:2024-06-27
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/2453 , G06F16/2458 , G06F16/22
Abstract: 本申请公开了一种集合操作符查询优化方法、装置、设备、存储介质及产品,属于数据管理技术领域。本申请通过在触发数据查询指令时,确定所述数据查询指令对应的执行树,其中,所述执行树包含反映集合操作符的数据并集运算流程的树状结构;对所述树状结构中的复数层的算子进行结构压缩优化,其中,所述算子为所述数据并集运算流程所使用的算子;根据结构压缩优化后的执行树,响应所述数据查询指令,即通过对执行树中集合操作符的数据并集运算流程的树状结构进行结构压缩优化,从而降低执行树中的数据处理结构的复杂程度,从而提高相应数据查询的效率。
-
公开(公告)号:CN117992452A
公开(公告)日:2024-05-07
申请号:CN202410118887.8
申请日:2024-01-29
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/22 , G06F16/2458 , G06F16/242
Abstract: 本申请公开了一种数据分析方法、装置、设备、介质及产品,包括:创建和/或初始化第一布隆过滤器和第二布隆过滤器;获取待处理数据,每个键值关联至少一条数据记录;在第一布隆过滤器不包含待处理数据的键值的情况下,在第一布隆过滤器中记录待处理数据的键值,并将待处理数据的行号索引写入第一索引分组;在第一布隆过滤器包含待处理数据的键值的情况下,在第二布隆过滤器中记录待处理数据的键值;针对第一索引分组中的每一行待处理数据,基于第二布隆过滤器是否包含待处理数据的键值的遍历结果,从待处理数据关联的所有键值中筛选出目标键值,目标键值为仅关联一条数据记录的键值;从待处理数据中,直接输出由目标键值组成的目标待处理数据。
-
公开(公告)号:CN119537595A
公开(公告)日:2025-02-28
申请号:CN202411600229.9
申请日:2024-11-11
Applicant: 中国移动通信集团天津有限公司 , 中国移动通信集团有限公司
IPC: G06F16/353 , G06F18/214 , G06F18/21 , G06F18/241 , G06F18/20 , G06N3/045 , G06N3/096 , G06N20/20
Abstract: 本公开提供一种基于LLMs的情感分类方法、装置、电子设备及介质,涉及人工智能技术领域。该基于LLM的情感分类方法包括:使用目标LLM集合构建自适应增强算法的基础学习器,并初始化训练样本的初始权重分布;根据训练样本和初始权重分布,微调基础学习器得到第一弱分类器,并根据第一弱分类器的错误率和权重系数,将基础学习器训练为第二弱分类器;基于第二弱分类器的错误率和权重系数,持续迭代训练样本的权重分布,将弱分类器集成为强分类器;基于待分类文本,通过强分类器得到文本情感类别。通过本公开提供的技术方案,解决了大模型在识别文本的情感类别时准确率低的问题,提高了文本情感类别的识别准确度。
-
公开(公告)号:CN118798204A
公开(公告)日:2024-10-18
申请号:CN202410040429.7
申请日:2024-01-10
Applicant: 中国移动通信集团天津有限公司 , 中国移动通信集团有限公司
IPC: G06F40/30 , G06F40/137 , G06N3/0455 , G06N3/044
Abstract: 本公开提供一种长文档处理方法、装置、电子设备及介质,涉及长文档处理技术领域,该方法包括:通过对长文档中的多个文本段进行编码,并结合多个文本段在长文档的预设间隔的位置信息,获取多个文本段中每个文本段的序列向量;依次分别将多个文本段中每个文本段的序列向量输入至循环处理单元,以获取每个文本段的深度语义特征;基于每个文本段的深度语义特征,预测长文档的深度语义特征。实现在循环处理单元利用带有位置信息的序列向量对每个文本段进行文本处理时可以更准确、完整地提取文本段的深度语义特征,提高了对长文档的处理能力,从而实现了对长文档的全面理解和分析。
-
公开(公告)号:CN117669595A
公开(公告)日:2024-03-08
申请号:CN202210950422.X
申请日:2022-08-09
Applicant: 中国移动通信集团天津有限公司 , 中国移动通信集团有限公司
IPC: G06F40/35 , G06N3/045 , G06N3/0442 , G06N10/60 , G10L15/26
Abstract: 本发明提供了一种客户服务结果预测模型建立方法、装置和设备,涉及人工智能技术领域,所述方法包括:根据历史客户服务语音数据,得到训练文本数据集合;对训练文本数据集合中的目标语句文本训练数据进行量子测量处理,得到目标语句的语义特征;利用双向长短时记忆BiLSTM模型以及自注意力机制,根据目标语句的语义特征,得到目标对话的语义特征;根据目标对话的语义特征和目标对话对应的历史客户服务结果,得到客户服务结果预测模型。本发明方案,根据目标对话中上下文之间的语义特征得到的客户服务结果预测模型充分建模了目标语句的语义特征和目标对话上下文之间的语义特征,增加该客户服务结果预测模型预测客户服务结果的准确性。
-
公开(公告)号:CN117235251A
公开(公告)日:2023-12-15
申请号:CN202210620671.2
申请日:2022-06-02
Applicant: 中国移动通信集团天津有限公司 , 中国移动通信集团有限公司
Inventor: 赵东明
IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06N3/006
Abstract: 本申请实施例提供了一种文本情感分类方法、装置及电子设备,该方法包括:获取待识别的文本;将待识别的文本输入到文本特征提取模型中进行特征提取处理,得到文本特征提取模型输出的文本特征向量,特征提取处理用于根据待识别的文本的上下文语义生成与待识别的文本的上下文语义相对应的文本特征向量;将文本特征向量输入到文本情感分类模型中进行文本情感分类处理,得到文本情感分类模型输出的情感分类结果。
-
公开(公告)号:CN117202244A
公开(公告)日:2023-12-08
申请号:CN202210600755.X
申请日:2022-05-30
Applicant: 中国移动通信集团天津有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种归属区域的识别方法、装置、电子设备及存储介质,属于通信技术领域,用以在边界漫游状态下提高用户行程判定的准确率。所述方法包括:确定第一基站对应的两相邻目标区域的信号覆盖比率;根据所述信号覆盖比率,确定所述第一基站的信号覆盖范围内目标用户归属的所述两相邻目标区域中的一者。
-
公开(公告)号:CN118797397A
公开(公告)日:2024-10-18
申请号:CN202311444816.9
申请日:2023-11-01
Applicant: 中国移动通信集团天津有限公司 , 中国移动通信集团有限公司
IPC: G06F18/24 , G06F18/213 , G06F16/35 , G06N3/0442 , G06N3/084
Abstract: 本申请公开了一种语义情感分析方法、装置及电子设备,涉及对话情感分类技术领域。方法包括:获取经预处理的语料集;通过情感特征提取模型,对带有预设标记的语料集进行特征提取,得到每个语句的情感特征;利用提示编码器对情感特征进行处理,得到任务提示编码;将任务提示编码作为多任务提示学习交互框架的输入,得到情感提示结果;将情感提示结果输入掩码语言模型,得到语义情感分析结果。本申请利用任务提示编码来表征语句的情感特征,并通过多任务提示学习交互框架建立了不同情感特征间的交互性和相关性,有效提高了语义情感分析结果的准确率,改善目前语义情感分析中缺少对文本前后关联性和情绪的分析,导致语义识别结果的准确率较低的问题。
-
公开(公告)号:CN118132744A
公开(公告)日:2024-06-04
申请号:CN202211492112.4
申请日:2022-11-25
Applicant: 中国移动通信集团天津有限公司 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F16/33 , G06F40/35 , G06N3/045 , G06N3/0464
Abstract: 本发明提供一种情感识别方法、装置、网络设备及可读存储介质,涉及人工智能技术领域。该方法包括:基于蒸馏DistilBert模型,对待识别文本进行特征提取,获取所述待识别文本的特征向量;将所述特征向量输入TextRcnn模型,获取所述待识别文本的情感状态;其中,所述TextRcnn模型基于有监督学习的方式确定本发明的方案,解决了现有的识别模型对语句的情感识别效果不理想的问题。
-
公开(公告)号:CN116935897A
公开(公告)日:2023-10-24
申请号:CN202210378453.2
申请日:2022-04-06
Applicant: 中国移动通信集团天津有限公司 , 中国移动通信集团有限公司
Abstract: 本发明公开了一种语音情感识别方法和装置,用以解决语音情感识别不准确的问题。本方案包括:获取待识别的语音音频和基于语音音频识别得到的语音文本;对语音音频和语音文本分别执行特征提取,以获取音频特征序列和文本特征序列;根据双向长短期记忆网络模型对音频特征序列和文本特征序列分别执行特征编码,以获取音频特征编码结果和文本特征编码结果;对音频特征编码结果和文本特征编码结果基于隐藏状态执行特征对齐,以获取特征对齐后的融合特征序列;基于支持向量机对融合特征序列执行分类,以确定语音音频的情感识别结果。本方案采用支持向量机执行情感分类,实现网络结构优化,能高效识别两极情绪,提升情感识别准确性。
-
-
-
-
-
-
-
-
-