-
公开(公告)号:CN118964492A
公开(公告)日:2024-11-15
申请号:CN202411228573.X
申请日:2024-09-03
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明提供一种基于数据模型的跨数据库数据同步方法,包括步骤1,获取并解析同步任务以确定待同步的数据模型和同步信息,解析数据模型和与数据模型关联的若干外键模型以获取数据结构、外键结构、数据模型与外键模型之间的关联顺序;步骤2,获取数据结构、外键结构生成结构文件,获取数据模型与外键模型之间的关联顺序生成顺序文件,获取数据模型和外键模型的数据记录生成内容文件;步骤3,目标数据库接收结构文件并实例化目标数据库表,接收顺序文件和内容文件,依据反向的关联顺序获取数据模型的数据记录,并写入目标数据库表。本发明能够实现外键查找,提高数据的一致性。
-
公开(公告)号:CN119760542A
公开(公告)日:2025-04-04
申请号:CN202411840901.1
申请日:2024-12-13
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F18/2415 , G06F18/214
Abstract: 本发明涉及用户行为预测领域,且公开了一种基于时序分析的用户行为预测方法,包括将用户行为数据按时间切分成固定长度的时间窗口,根据数据的周期性特征进行特征编码,在每个时间窗口内计算统计特征;对少数类别进行过采样或对多数类别进行欠采样,使用数据增强技术生成新的样本;选择时序模型,对用户行为的时间依赖性进行建模,采用不同的时序分析方法捕捉用户行为在时间维度上的变化规律和潜在模式;使用多种评估指标评估模型的预测能力,通过网格搜索进行模型超参数调优,优化模型的性能。本发明具备提高预测准确性的优点。
-
公开(公告)号:CN120046710A
公开(公告)日:2025-05-27
申请号:CN202510141033.6
申请日:2025-02-08
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明提供一种对于复杂长文本的大模型知识库构建和检索方法,包括多粒度分块,接收并预处理文本数据,基于变粒度分块策略多粒度层级拆分文本数据,每个粒度层级对应若干粒度一致的文本块;构建知识库,获取每个文本块的文本元数据,文本块与文本元数据向量化并生成文本块向量和文本元数据向量,依据文字信息少的文本元数据向量调用文字信息多的文本块向量。本发明能够多粒度层级划分文本块,有效保留文本数据内的上下文逻辑信息,提高知识库的检索准确性。
-
-