-
公开(公告)号:CN105893612A
公开(公告)日:2016-08-24
申请号:CN201610266857.7
申请日:2016-04-26
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F16/217 , G06F16/215 , G06F17/2785
Abstract: 本发明公开了一种多源异构大数据的一致性表示方法。本方法针对多源异构数据的特征异构性问题,利用多源异构数据间的语义互补性,基于子空间学习方法,将多源异构数据投影到一个中层冗余特征同构空间。并在这个同构空间中,将来自不同来源的相关描述耦合到一起。为了挖掘出中层空间中同构描述之间的语义一致性,利用先验知识,将特征同构描述投影到高层语义共享子空间上,进而消除冗余和噪声信息。由此,可以获得多源异构数据的语义一致模式。本发明有助于在多媒体分析、信息检索和医疗诊断等领域,获得准确且鲁棒的多源数据评估分析结果。
-
公开(公告)号:CN105893610A
公开(公告)日:2016-08-24
申请号:CN201610265744.5
申请日:2016-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F16/215 , G06F2216/03
Abstract: 本发明公开了一种多源异构大数据的缺失源补全方法。本方法针对多源异构数据的缺失源问题,利用多源异构数据间的语义互补性和分布相似性,基于子空间学习方法,通过对完整的多源异构数据的语义互补性和分布相似性的挖掘,获得一个不同来源间的特征同构的语义共享子空间,从而在这个特征同构空间中,利用学习到的语义互补性和分布相似性,补全多源异构数据的缺失来源。本方法中,假设不同的来源都服从正态分布,那么缺失源的数据矩阵可以塑造为低秩(捕捉类间差异,代表期望)加稀疏(捕捉类内差异,代表方差)两个成分的和。由此,利用异源间的语义互补性和等同分布补全多源异构数据的缺失描述。
-
公开(公告)号:CN105843896A
公开(公告)日:2016-08-10
申请号:CN201610166631.X
申请日:2016-03-22
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F16/215
Abstract: 本发明涉及一种多源异构大数据的冗余源协同缩减方法。该方法包括两个模型,一个为异构流形平滑学习(HMSL)模型,另一个为基于相关性的多源冗余缩减(CMRR)模型。其中,HMSL模型将多源异构数据线性投影到一个低维特征同构空间,并在这个空间中,使信息相关描述的流形距离更近,而语义互补样本的欧氏距离更近;CMRR模型利用基于梯度能量竞争策略的广义初等变换约束,在由HMSL模型学习得来的特征同构空间中,消除多源冗余数据的三向冗余和双层异构性。本发明能够消除多源冗余数据的三向冗余和双层异构性,进而精简多源异构数据的冗余源。
-
公开(公告)号:CN114489964B
公开(公告)日:2025-03-04
申请号:CN202111517469.9
申请日:2021-12-08
Applicant: 中国科学院信息工程研究所
IPC: G06F9/48 , G06N3/098 , G06N3/084 , G06N3/0499
Abstract: 本发明公开了一种基于联邦学习的车载网络信用优先任务卸载方法,其步骤包括:1)EC、CV分别将自己的位置信息和可用资源信息发送给CC;其中,EC为边缘云服务器,CV为车辆网中的车辆,CC为云中心;2)当CV需要进行任务卸载时,发送卸载任务信息给DC;其中,DC为车辆网中的决策中心;3)对于当前一批待处理的卸载任务,DC从CC获取发送卸载任务的各CV的信誉值;然后根据信用值设置各卸载任务的处理优先级,优先为处理优先级高的卸载任务制定任务卸载决策并发送给对应的EC和CV;其中,CC根据CV的行为信息计算对应CV的所述信誉值。本发明将信誉值用在任务卸载决策中,从而实现决策性能的提高。
-
公开(公告)号:CN112257866B
公开(公告)日:2024-09-27
申请号:CN202010940904.8
申请日:2020-09-09
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种GPU上的基于边着色与信息更新率优化的置信传播方法。本方法针对在全局都有较高收敛速度的计算需求,直接使用信息残差大的边对信息残差小的边进行一次着色操作,则信息残差大的边会对与其相连的所有边进行着色,只更新这些信息残差大的边上的信息,降低了每次迭代置信传播的计算量,提升了置信传播算法在整个计算过程中的收敛速度。以及针对在算法稳定后有较高收敛度的计算需求,提出通过逐步降低未收敛信息的更新率,使得算法在整个计算过程中都保持较高的收敛速度,并且算法稳定时有较高的收敛度。本发明提升了置信传播方法整体的运行效率。
-
公开(公告)号:CN114077838A
公开(公告)日:2022-02-22
申请号:CN202010825717.5
申请日:2020-08-17
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F40/295 , G06F40/284
Abstract: 本发明提供一种基于词表示特征的命名实体识别方法及电子装置,包括:对待检测文本进行分词,获取各词语的基础特征;将各词语组成一词语序列,并对每一词语进行编码,提取编码结果的词嵌入特征;根据词语序列的设定权重与设定主题,生成一词向量序列,提取词向量序列的词表示特征;将基础特征、词嵌入特征及词表示特征输入一实体识别模型,获取待检测文本中的命名实体。本发明采用了word2vec训练的词嵌入及LSTM训练的词表示,捕获了语句的长期依赖性,充分的利用了长距离上下文信息对命名实体进行识别,相对于传统模型有较好的改进,提高了微博命名实体的识别的准确率。
-
公开(公告)号:CN118250177A
公开(公告)日:2024-06-25
申请号:CN202410259758.0
申请日:2024-03-07
Applicant: 中国科学院信息工程研究所
IPC: H04L41/12 , H04L67/133
Abstract: 本发明公开了一种微服务远程调用关系的拓扑发现方法及系统。本系统包含代理端和服务端,通过代理端和服务端协同工作,对微服务远程调用关系实时监控和更新;代理端利用eBPF技术在不侵入应用程序的情况下,从操作系统内核层面捕获微服务应用层的信息和网络数据包,包括源微服务、源微服务版本、目的微服务、目的微服务版本、端口、调用路径、协议和请求方法等,随后将这些数据上传至服务端;服务端接收到代理端上传信息后,根据这些数据构建微服务之间的远程调用关系图。这种关系图能够实时展示微服务的调用路径、频率、延迟等关键信息,并且根据代理端持续上传的信息实时更新微服务拓扑,实现高性能、低延迟的微服务远程调用关系的拓扑发现。
-
公开(公告)号:CN113239663B
公开(公告)日:2022-07-12
申请号:CN202110309085.1
申请日:2021-03-23
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F40/126 , G06F40/216 , G06F40/242 , G06F40/284 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于知网的多义词中文实体关系识别方法,其步骤包括:1)对中文网事数据中的每一条语料样本基于知网进行字颗粒度的向量化,得到每一个字对的字颗粒度向量;然后对每一字颗粒度向量所在的位置信息进行编码,得到语料中每个字与预标注的待识别实体关系对的相对位置编码;2)根据步骤1)所得结果生成每一语料样本的字颗粒度语义向量集合;3)基于知网生成每一语料的词颗粒度语义向量集合;4)利用各语义向量及其对应位置编码训练深度自注意力神经网络,得到深度自注意力神经网络编码器;5)生成待处理语料中字和词汇的语义向量及其对应位置编码输入深度自注意力神经网络编码器,得到该待处理语料中的实体关系。
-
公开(公告)号:CN109993198A
公开(公告)日:2019-07-09
申请号:CN201811600061.6
申请日:2018-12-26
Applicant: 中国科学院信息工程研究所
IPC: G06K9/62
Abstract: 本发明提出了一种基于特征同构共享描述的多源异构离群点检测方法,通过在特征同构空间中统一地检测来自异构数据集的离群点,以避免浪费不同来源之间的互补信息,并提高多源离群点的识别率,能够解决在一个一致的特征同构空间中识别所有类型的多源异构离群点的问题。
-
公开(公告)号:CN107391555A
公开(公告)日:2017-11-24
申请号:CN201710422553.X
申请日:2017-06-07
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F16/2379 , G06F16/24552 , G06F16/27
Abstract: 本发明涉及一种面向Spark-Sql检索的元数据实时更新方法。该方法在Spark Sql进行检索时,会将使用的元数据进行缓存,将被检索的数据块文件元数据以集合的形式缓存于内存中;当获得文件元数据的增量信息时,将首先检查该增量信息所属的表的检索元数据是否存在于缓存之中,若存在,则将增量的文件元数据增加至缓存的该表文件元数据的集合之中,由此完成Spark Sql检索元数据的增量更新。本发明还提出了对Spark Sql检索元数据增加情况的处理方法,可以实时的对检索元数据的增加情况进行处理,提高检索结果的实时性。本发明可以避免对检索元数据进行经常性的全量更新,以减少更新元数据时的时间和资源开销。
-
-
-
-
-
-
-
-
-