-
公开(公告)号:CN118041917A
公开(公告)日:2024-05-14
申请号:CN202410232824.5
申请日:2024-02-29
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: H04L67/10 , H04L67/1097 , G06F9/54 , G06F16/27
Abstract: 本申请公开了一种跨区域数据交互方法及其相关设备,涉及大数据处理技术领域,该方法包括:从第一API组件中获取任务;其中,任务由第二API组件发起,第二API组件将任务发送给第三API组件,第三API组件将任务发送给第一API组件,第一API组件在第一区域,第二API组件在第二区域,第三API组件在第三区域;对所述任务进行处理,得到处理结果;将所述处理结果发送给第一Kafka集群;其中,第一Kafka集群(在第一区域)将处理结果发送给第三Kafka集群(在第三区域),第三Kafka集群将处理结果发送给第二Kafka集群(在第二区域)。在本申请中,提高了数据利用率。
-
公开(公告)号:CN118861141A
公开(公告)日:2024-10-29
申请号:CN202410874072.2
申请日:2024-07-01
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/25 , G06F16/28 , G06F16/2455 , G06F16/22
Abstract: 本申请公开了一种大数据资产管理方法、装置、设备、介质及产品,属于大数据的技术领域。在本申请中,根据大数据资产的资产信息数据中的资产流向,对包括主机、储算资源、数据分析工具和数据模型的大数据资产的资产信息数据,进行大数据资产的资产信息数据的数据流入层和数据流出层的数仓分层,得到大数据资产的数仓表;通过融合大数据资产的数据流入层和数据流出层的数仓表,得到大数据资产的宽表,并根据大数据资产的宽表进行数据资产分析。
-
公开(公告)号:CN118820018A
公开(公告)日:2024-10-22
申请号:CN202411018800.6
申请日:2024-07-26
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种日志标准化方法、装置、设备、存储介质及产品,本申请涉及日志处理技术领域,所述日志标准化方法包括:接收待处理日志;对所述待处理日志所属的分类类别进行确定,得到所述待处理日志对应的目标分类类别;基于所述目标分类类别,通过预设的对应关系,确定对所述待处理日志进行标准化处理的标准化方案,其中,所述预设的对应关系包括不同分类类别对应的不同标准方案;基于所述标准化方案,对所述待处理日志进行标准化处理。本申请通过确定不同聚类类别下的样本日志的标准化处理方式,从而解决了单一的处理方式不能普遍适用于所有数据的问题,提高了日志数据的处理准确度。
-
公开(公告)号:CN119671039A
公开(公告)日:2025-03-21
申请号:CN202411745911.7
申请日:2024-11-29
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06Q10/063
Abstract: 本申请公开了一种策略评估方法、装置、设备、存储介质及产品,涉及人工智能技术领域,所述策略评估方法包括:获取对照实验数据;为所述对照实验数据中的多个子数据集添加在同一成本下的多个第一策略,生成策略子集以及重叠子集,其中,所述第一策略包括至少一个第一干预手段,所述重叠子集为分配有相同干预手段的样本数据集合,所述策略子集为分配有所述第一干预手段的样本数据集合;基于所述重叠子集以及策略子集,计算得到各所述第一策略的期望值,并通过各所述期望值,确定各所述第一策略中的最优策略。本申请实现了准确地生成同一成本下的决策最优解。
-
公开(公告)号:CN118860991B
公开(公告)日:2025-03-14
申请号:CN202411336759.7
申请日:2024-09-24
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/172 , G06N3/042 , G06N3/0455 , G06N3/08 , G06F16/13
Abstract: 本申请公开了一种数据处理方法、装置、设备及存储介质,属于计算机技术领域。该方法包括基于N个用户访问数据对象的数据访问日志,构建包括M个第一节点和连接每两个第一节点的第一有向连接边的多用户数据访问的加权有向无自环图,第一节点为至少一个用户的第i个被访问的数据对象;从加权有向无自环图中提取P个采样子图;基于每个采样子图和其对应的标签向量,训练第一图神经网络和预取解码器模型,得到用于基于用户在第一时间段的数据访问日志生成用户在第二时间段访问P个具有关联关系的数据对象的概率值的第二图神经网络和预取解码器。如此,通过图神经网络和解码器学习访问数据的关联关系确定待访问的数据对象,以提高缓存预取的命中率。
-
公开(公告)号:CN119299523A
公开(公告)日:2025-01-10
申请号:CN202411296884.X
申请日:2024-09-14
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司 , 北京航空航天大学
IPC: H04L67/63 , H04L67/1097 , H04L67/566
Abstract: 本申请公开了一种分散集群的聚合访问方法、装置、设备、存储介质及产品,涉及数据访问技术领域,该方法包括:基于统一名字空间,对分散的多个HDFS集群进行聚合,得到聚合集群;获取HDFS客户端对聚合集群的聚合访问请求,对聚合访问请求进行解析,确定聚合访问请求的目标数据、目标节点以及请求类型;基于聚合访问请求的目标数据、目标节点以及请求类型,将聚合访问请求路由至聚合集群中对应的目标HDFS集群,对目标HDFS集群中的数据块进行访问。通过上述方式,利用统一名字空间对广域分散的HDFS集群进行聚合,使HDFS客户端能够简单统一地访问各集群中的数据,并通过智能请求分析和路由机制实现数据交互。
-
公开(公告)号:CN119248726A
公开(公告)日:2025-01-03
申请号:CN202411345865.1
申请日:2024-09-25
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种基于窗口多级扩展的文档检索方法、装置、设备、存储介质及程序产品,涉及文档检索技术领域,包括:对文档进行切分,得到多个子文档,并对多个子文档配置初始窗口;获取用户查询信息,基于多个子文档和所述用户查询信息进行初次检索,得到用户查询信息与初始窗口的初始相似度;对初始窗口进行扩展,得到扩展窗口和对应的扩展子文档,并根据用户查询信息和扩展子文档进行多次检索,得到所述用户查询信息与扩展窗口之间的参考相似度;基于初始相似度和参考相似度完成窗口扩展,得到目标扩展窗口和对应的目标子文档,完成文档检索,通过动态窗口扩展策略来优化检索过程,提高文本检索系统的准确性和相关性。
-
公开(公告)号:CN119205338A
公开(公告)日:2024-12-27
申请号:CN202411310926.0
申请日:2024-09-19
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司 , 卓望信息技术(北京)有限公司
Abstract: 本申请公开了一种合同风险识别方法、装置、设备、存储介质和程序产品,涉及计算机技术领域,公开了合同风险识别方法,包括:构建合同数据中合作业务的合同知识图谱;基于预训练的合同基座大模型,根据思维链和所述合同知识图谱,提取合同数据的关键信息;根据所述思维链和所述关键信息构建提示词;基于所述提示词向合同基座大模型提问,获取所述合同基座大模型基于提示词输出合同数据的合作业务的合规风险结果。本申请提高了合规风险结果识别的准确性。
-
公开(公告)号:CN118885475B
公开(公告)日:2024-12-13
申请号:CN202411336612.8
申请日:2024-09-24
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/215 , G06F16/21 , G06F16/2458 , G06F21/60
Abstract: 本申请公开了一种数据处理方法、装置、设备、存储介质及程序产品。该方法包括:获取待处理数据集,待处理数据集包括多个事务,每个事务包括至少一个数据项;利用关联规则挖掘算法对待处理数据集进行挖掘,得到频繁项集以及与频繁项集相关的关联规则;针对每个敏感规则,利用进化多目标优化算法和预先构建的多目标优化模型,对敏感规则对应的多个事务进行搜索,生成多个候选数据清洗策略;对目标数据清洗策略中的每个目标事务,执行以下操作,得到目标数据集,目标数据清洗策略为多个候选数据清洗策略中的任一个:删除目标事务中与敏感规则相关的至少一个数据项。根据本申请实施例,能够在隐藏敏感信息的同时,提升数据的准确性和质量。
-
公开(公告)号:CN118860749B
公开(公告)日:2024-12-13
申请号:CN202411336604.3
申请日:2024-09-24
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F11/14
Abstract: 本申请公开了一种数据备份方法、装置、设备、介质以及产品。本方法对目标数据进行编码得到第一目标码和第二目标码,将第一目标码以及第二目标码进行串联得到目标级联码,并将目标级联码进行保存,以便于在目标数据丢失的情况下,通过目标级联码对目标数据进行恢复。由于级联码采用短码串行级联的方式构造长码,级联编码的长度小于采用单一结构、单一形式的码构造长码的长度,因此具有译码复杂度低、纠错能力强以及编码效率高等优点。该技术可以用于解决不同节点掉队情况下的缓存恢复问题,能够在一定存储冗余的情况下,尽可能地提高译码的成功率,实现数据丢失后的有效恢复。
-
-
-
-
-
-
-
-
-