-
公开(公告)号:CN116467427A
公开(公告)日:2023-07-21
申请号:CN202310323580.7
申请日:2023-03-29
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: G06F16/335 , G06F16/36 , G06F16/35 , G06F40/242 , G06F18/2433 , G06F18/23213 , G06F40/247 , G16H50/70
Abstract: 本申请提供一种数据处理方法及装置,所述方法包括:得到原始医学知识数据集对应的各类簇;对所述各类簇进行离群检测处理,如果类簇中数据点的总数小于设定阈值或类簇中不包含标签为医学教材的医学数据,则将类簇中的所有医学数据放入离群点候选集中;根据离群点候选集中数据点的标签对所述离群点候选集进行剪枝处理;对剪枝后的离群点候选集中的数据点进行离群处理。本发明实施例提供的数据处理方法及装置,通过专门适用于该应用场景的改进聚类和离群算法,对原始医学知识数据中的离群数据进行筛选处理,还通过专门适用于该应用场景数据特点的剪枝算法,既保证离群处理的计算效率,也最大限度地保留了可用的医学知识数据。
-
公开(公告)号:CN115292303A
公开(公告)日:2022-11-04
申请号:CN202211221664.1
申请日:2022-10-08
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: G06F16/215 , G06K9/62
Abstract: 本发明公开了一种数据处理方法及装置,该方法包括:对数据集中的数据进行聚类,得到各类簇;对各类簇进行离群检测处理,所述离群检测处理包括:如果所述类簇中数据点的总数小于设定阈值,则将所述类簇中的所有数据点放入离群点候选集中;否则,依次计算所述类簇中各数据点到类簇中心的距离,并将所述距离大于等于半径的数据点放入离群点候选集中;对所述离群点候选集进行剪枝处理,得到剪枝后的离群点候选集;对剪枝后的离群点候选集中的数据点进行离群处理,确定数据点是否为离群点。利用本发明方案,可以有效提升大数据的数据质量。
-
公开(公告)号:CN119377792A
公开(公告)日:2025-01-28
申请号:CN202411960028.X
申请日:2024-12-30
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F18/2413 , G06F18/213 , G06F18/243
Abstract: 本申请公开了一种数据分级方法、系统及相关装置,用于对数据进行快速且准确的分级。本申请方法包括:获取数据来源信息,基于所述数据来源信息得到数据清单;根据所述数据清单,通过预设分类模型提取目标数据;获取定性要素和定量要素,基于所述定性要素和所述分类模型对所述目标数据进行分级得到初始级别;判断已得到所述初始级别后的所述目标数据是否包含敏感信息;若是,则设定要素权重,基于所述定量要素和所述要素权重对目标数据得到所述目标数据的二次定级,在得到所述目标数据的所述二次定级后,结合所述初始级别对所述二次定级进行调整,最终得到目标数据的目标级别;若否,则将所述目标数据的所述初始级别确定为所述目标级别。
-
公开(公告)号:CN119377409A
公开(公告)日:2025-01-28
申请号:CN202411943469.9
申请日:2024-12-27
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F40/242 , G06N3/08
Abstract: 本申请公开了一种基于关键词与深度学习的信息识别方法、系统及装置。本申请方法包括:获取个人数据集和公开数据集;基于个人数据集和公开数据集构建专用词典库;基于公开数据集提取关键字、特定符号以及主题;判断个人数据集与关键字或特定符号是否匹配;若否,则利用主题和专用词典库确定匹配词典;当确定匹配字典后,判断匹配词典与个人数据集是否匹配;若否,则基于个人数据集,通过语言表示模型训练得到嵌入向量;当得到嵌入向量后,将嵌入向量输入至序列神经网络模型中进行建模,得到隐状态序列;将隐状态序列的维度映射至目标维度中,并将已映射至目标维度后的隐状态序列输入至条件随机场算法中,得到个人信息识别结果。
-
公开(公告)号:CN117115756A
公开(公告)日:2023-11-24
申请号:CN202311379545.3
申请日:2023-10-24
Applicant: 中电科大数据研究院有限公司
IPC: G06V20/52 , G06V40/10 , G06V40/16 , G06V10/22 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种人员睡觉行为检测方法及系统该方法包括:获取待检测人员的视频帧;利用事物检测模型对所述视频帧进行检测,并利用目标关联决策模型对所述事物检测模型输出的检测结果进行决策,确定所述视频帧中是否有人体;在检测到有人体的情况下,利用事物检测模型确定对应所述人体的人体坐标信息,利用目标跟踪模型确定对应所述人体的唯一身份标识,并利用人脸识别模型确定对应所述人体的人脸坐标信息;根据连续多帧确定的人体坐标信息和人脸坐标信息,确定所述待检测人员的行为。利用本发明方案,可以准确识别工作人员的睡觉行为,提高人体睡觉行为的检测精度。
-
公开(公告)号:CN116996235A
公开(公告)日:2023-11-03
申请号:CN202311248994.4
申请日:2023-09-26
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明公开了一种联合建模的安全认证方法、装置及系统,该方法包括:生成并发布公开参数PK及文件散列函数H;根据公开参数PK及文件散列函数H,为参与联合建模的各节点生成私钥SK,并将私钥SK及全局模型通过安全信道发送给对应的节点;接收各节点的梯度签名,所述梯度签名是所述节点根据自己的私钥SK、所述公开参数PK及文件散列函数H对所述全局模型训练得到的梯度数据进行签名得到的;确定各节点的梯度签名是否有效;如果所有梯度签名均有效,则对梯度签名进行聚合,得到聚合签名,并将聚合签名发送给各节点。利用本发明方案,可以保证联合建模信息的安全性。
-
公开(公告)号:CN116028654B
公开(公告)日:2023-06-13
申请号:CN202310322871.4
申请日:2023-03-30
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/36
Abstract: 本发明提供知识节点的多模态融合更新方法,确定知识数据所包括的知识模态种类;根据每个知识节点的知识模态种类、相应知识模态种类的知识信息量计算,得到模态评价子系数,根据所有知识节点的模态评价子系数得到模态评价平均系数;根据模态评价子系数对第一知识节点进行升序排序得到知识节点序列;在知识节点序列中挑选前部的多个第一知识节点作为第二知识节点,根据第二知识节点在当前时刻的知识模态种类,生成相对应第二知识节点的推荐添加模态种类;根据所配置的新的知识模态种类和/或新的知识信息,对第二知识节点内的知识数据进行融合更新处理。
-
公开(公告)号:CN119513674A
公开(公告)日:2025-02-25
申请号:CN202510089450.0
申请日:2025-01-21
Applicant: 中电科大数据研究院有限公司 , 中电科新型智慧城市研究院有限公司
IPC: G06F18/24 , G06F18/213 , G06F18/22
Abstract: 本申请公开了一种基于特征向量匹配的数据识别方法、装置及存储介质。包括:获取待检测数据,分词生成特征向量;通过矩阵运算计算待匹配特征向量与预定义核心数据特征向量的欧氏距离,统计匹配数量;根据描述信息、表描述信息和字段描述信息的权重(分别为0.2、0.5、0.3),计算数据权重值;结合匹配结果和数据规模,通过加权计算得到待检测数据属于核心或重要数据的概率值;判断概率值是否超过阈值,若超过,则识别为核心或重要数据。本方法依托可信执行环境TEE实现特征向量的提取、匹配及计算,避免待检测数据和核心数据特征库暴露。确保计算过程的真实性和可信性。TEE相对其他隐私计算技术,具有额外计算少的优点,可以提升算法匹配效率。
-
公开(公告)号:CN118484584A
公开(公告)日:2024-08-13
申请号:CN202410682374.X
申请日:2024-05-29
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/953 , G06F16/2458 , G06F16/951 , G06F16/9538 , G06F18/15 , G06F18/241 , G06Q50/26
Abstract: 一种基于E‑OEM模型的政务数据精准挖掘方法,涉及计算机网络数据处理技术领域,解决现有政务数据挖掘方法存在获取相关政务数据精准度不高的问题,本方法通过政务数据采集、预处理,构建Kirkpatrick模型进行数据挖掘实施效果评价,基于E‑OEM模型的政务数据模式归一化及标准化处理,设定相应的数据挖掘算法,获得精准的政务数据以及对挖掘结果的显示及评估等步骤实现。本发明方法评价指标选取范围大,且与实验样本差异度较小,因此,本方法的指标选取结果与实验样本的相似度较高,可有效保证对实验对象评价的全面性与精准度。
-
公开(公告)号:CN117994719A
公开(公告)日:2024-05-07
申请号:CN202410026176.8
申请日:2024-01-08
Applicant: 中电科大数据研究院有限公司
Abstract: 本申请实施例公开了一种识别人群聚集的方法、装置及计算机可读存储介质,用于提高效率。本申请实施例方法包括:获取目标摄像头拍摄的视频流数据;将所述视频流数据输入预先训练完成的人头识别模型,得到标注人头框后的待检测图像序列,所述人头识别模型用于标注图像中的人头;获取所述待检测图像序列中的人头框的中心点坐标;计算所述待检测图像序列中各个人头框的面积;将所述中心点坐标和所述各个人头框的面积输入预先训练好的聚类模型,利用所述聚类模型对所述待检测图像序列逐张进行关于人头框的中心点的聚类,得到聚类结果;根据所述聚类结果确定是否发生人群聚集。
-
-
-
-
-
-
-
-
-