-
公开(公告)号:CN117828053A
公开(公告)日:2024-04-05
申请号:CN202311866715.0
申请日:2023-12-29
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/332 , G06F40/279 , G06F40/30 , G06N5/04 , G06N20/00 , G06Q50/18
Abstract: 本公开提供一种非结构化文本处理方法、装置、设备及存储介质,涉及自然语言理解技术领域。在本公开的一些实施例中,获取待处理的法律文书页面和非结构化问题文本;对所述法律文书页面进行文本识别,得到法律文书文本;将所述法律文书文本输入已经训练得到的生成式特征提取模型中,得到所述法律文书文本对应的语义解答文本;将所述非结构化问题文本和语义解答文本输入生成式语言模型中,得到所述非结构化问题文本对应的问题解答文本,提高非结构化问题文本的解答文本的准确率。
-
公开(公告)号:CN116012027A
公开(公告)日:2023-04-25
申请号:CN202211614436.0
申请日:2022-12-15
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06Q30/0201 , G06F16/22 , G06F16/2457
Abstract: 本申请涉及数据处理技术领域,尤其涉及一种数据全生命周期打标方法及系统,方法包括:确定打标对象;基于多种维度,生成打标对象的全生命周期中的各个数据服务阶段各自对应的标签;建立标签与打标对象的关联关系。本申请中的技术方案,对作为打标对象的数据进行从数据汇聚接入、存储、稽核、清洗、融合、服务到销毁整个全生命周期各个阶段的打标,将数据从产生到销毁的每个阶段从多种维度进行数据标签化,展示数据的“一生画像”,确保对数据进行使用时可以全程跟踪数据的处理过程,并快速精准溯源到原始数据。
-
公开(公告)号:CN115712855A
公开(公告)日:2023-02-24
申请号:CN202211482745.7
申请日:2022-11-24
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F18/24 , G06F18/214 , G06F18/213 , G06N3/04 , G06N3/08
Abstract: 本申请关于一种基于自学习的标签规则产生方法及装置。具体方案为:通过响应于接收到目标数据,对目标数据进行特征提取,以得到特征数据;确定特征数据的所属类型;将特征数据和特征数据的所属类型输入至预训练的预测器中;获取预测器输出的标签规则;基于标签规则对特征数据进行打标签。本申请提升了数据标签化的工作效率和精准度。
-
公开(公告)号:CN117708658A
公开(公告)日:2024-03-15
申请号:CN202410161414.6
申请日:2024-02-05
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
Abstract: 本公开提出一种数据实体间关系传递性质的确定方法、装置和设备,该方法包括:获取训练数据集合,构建目标关联关系的实体关联度评分模型,根据实体关联度评分模型构建惩罚函数,根据训练数据集合对惩罚函数进行模型训练以得到目标单位向量,根据实体关联度评分模型或目标单位向量确定第一数据实体与多个候选数据实体之间的识别结果,其中,识别结果用于指示第一数据实体与候选数据实体之间是否存在目标关联关系。由此,能够更准确、更全面、更深入地识别数据实体间关联关系,充分挖掘城市级大数据聚合价值。
-
公开(公告)号:CN115952150A
公开(公告)日:2023-04-11
申请号:CN202211610209.0
申请日:2022-12-14
Applicant: 北京市大数据中心 , 太极计算机股份有限公司
IPC: G06F16/21 , G06F16/22 , G06F16/2458
Abstract: 本申请涉及一种多源异构的数据融合方法及装置,涉及数据处理技术领域,方法包括:获取待融合数据,对待融合数据中各字段赋予不同的权重算子,根据预先设定的数据关联规则和待融合数据中各字段的权重算子对待融合数据进行关联融合,得到待处理数据,最后对待处理数据进行标准化处理。本申请中综合考虑多种因素,对待融合数据中各字段赋予不同的权重算子,如对预期准确度高的字段赋予相对较高的权重算子,对预期准确度低的字段赋予相对较低的权重算子,在进行关联融合时使融合数据对数据的紧密依赖程度更高,从而得到的融合数据更加准确、可靠。
-
公开(公告)号:CN113987077B
公开(公告)日:2022-03-29
申请号:CN202111585694.6
申请日:2021-12-23
Applicant: 太极计算机股份有限公司 , 贾晓丰 , 高嵩
Abstract: 本公开提出一种基于链码机制的数据感知与跨链调度方法及装置,该方法包括:为第一部门的数据资源申请进行授权,接收第二部门发送的资源申请请求,其中,资源申请请求用于申请第一部门的数据资源,第一部门和第二部门不相同,数据资源存储于第一部门对应的数据库中,根据资源申请请求,触发汇聚接入装置基于数据资源进行资源汇聚,并获取汇聚接入装置反馈的数据编码汇聚状态,以及根据数据编码汇聚状态,对数据资源进行跨链调度处理,能够实现不同部门数据的跨链调度,简化数据跨链调度逻辑,提高数据跨链调度的效率,有效降低数据跨链调度的成本。
-
公开(公告)号:CN113961571A
公开(公告)日:2022-01-21
申请号:CN202111582572.1
申请日:2021-12-22
Applicant: 太极计算机股份有限公司 , 贾晓丰 , 高嵩
IPC: G06F16/22 , G06F16/25 , G06F16/907 , G06F21/62
Abstract: 本公开提出一种基于数据探针的多模态数据感知方法、装置及计算机设备,该方法包括:确定感知场景满足设定条件,并获取场景特征,基于数据探针获取场景中的多种初始模态数据,根据场景特征对多种初始模态数据分别进行数据转换,以得到多种待匹配模态数据,根据预设规则对多种待匹配模态数据分别进行匹配处理,以得到多种目标模态数据,根据多种目标模态数据,生成数据编码信息。通过本公开,实现基于数据探针对场景中的多种模态数据进行感知,实现对多种感知到的初始模态数据进行灵活的数据转换、匹配以及数据编码生成处理,有效提升对多种模态数据的数据探针和识别处理效率。
-
公开(公告)号:CN113946857A
公开(公告)日:2022-01-18
申请号:CN202111561004.3
申请日:2021-12-20
Applicant: 太极计算机股份有限公司 , 贾晓丰 , 高嵩
Abstract: 本公开提出了一种基于数据路由的分布式跨链调度方法和装置。具体方案为:获取事件请求,事件请求包括:数据资源信息,并基于事件请求,生成调度指令,其中,调度指令用于对数据资源信息所属数据的多种操作指令进行调度处理,再根据数据路由合约,将调度指令寻址映射至所属数据对应的多源异构数据源,以及根据调度指令调度多种操作指令,以对多源异构数据源中的数据进行自动抽取和封装处理,通过本公开,能够实现城市级复杂场景下多源异构数据的自动寻址映射和抽取控制,还能够有效地降低分布式网络中的时延,进而能够高效地进行跨链的数据调度,有效地提升数据跨链调度的性能。
-
公开(公告)号:CN113961571B
公开(公告)日:2022-03-22
申请号:CN202111582572.1
申请日:2021-12-22
Applicant: 太极计算机股份有限公司 , 贾晓丰 , 高嵩
IPC: G06F16/22 , G06F16/25 , G06F16/907 , G06F21/62
Abstract: 本公开提出一种基于数据探针的多模态数据感知方法、装置及计算机设备,该方法包括:确定感知场景满足设定条件,并获取场景特征,基于数据探针获取场景中的多种初始模态数据,根据场景特征对多种初始模态数据分别进行数据转换,以得到多种待匹配模态数据,根据预设规则对多种待匹配模态数据分别进行匹配处理,以得到多种目标模态数据,根据多种目标模态数据,生成数据编码信息。通过本公开,实现基于数据探针对场景中的多种模态数据进行感知,实现对多种感知到的初始模态数据进行灵活的数据转换、匹配以及数据编码生成处理,有效提升对多种模态数据的数据探针和识别处理效率。
-
公开(公告)号:CN113987077A
公开(公告)日:2022-01-28
申请号:CN202111585694.6
申请日:2021-12-23
Applicant: 太极计算机股份有限公司 , 贾晓丰 , 高嵩
Abstract: 本公开提出一种基于链码机制的数据感知与跨链调度方法及装置,该方法包括:为第一部门的数据资源申请进行授权,接收第二部门发送的资源申请请求,其中,资源申请请求用于申请第一部门的数据资源,第一部门和第二部门不相同,数据资源存储于第一部门对应的数据库中,根据资源申请请求,触发汇聚接入装置基于数据资源进行资源汇聚,并获取汇聚接入装置反馈的数据编码汇聚状态,以及根据数据编码汇聚状态,对数据资源进行跨链调度处理,能够实现不同部门数据的跨链调度,简化数据跨链调度逻辑,提高数据跨链调度的效率,有效降低数据跨链调度的成本。
-
-
-
-
-
-
-
-
-