-
公开(公告)号:CN112348200B
公开(公告)日:2022-11-15
申请号:CN202011203717.8
申请日:2020-11-02
Applicant: 中国科学院信息工程研究所
IPC: G06N20/00 , G06F16/176 , H04L67/01
Abstract: 本发明提供一种基于联邦学习的受控共享学习方法及系统,包括接收各客户端模型Vi,t的参数,并根据参数从各客户端中选取一或多个共享客户端,向共享的客户端发送共享指令,其中模型Vi,0通过各客户端的算力构建并依据相应私有数据集训练得到,且各模型Vi,0的分类模块结构一致;获取共享客户端模型Vi,t的分类模块参数St,并将计算得到的分类模块参数St+1发送至各客户端,以使各客户端依据私有数据集与分类模块参数St+1得到模型Vi,t+1。本发明仅需提供模型部分参数完成共享学习,使数据安全得到了很好的保障;且各客户端模型、是否参与共享学习等都自主可控。
-
公开(公告)号:CN114880582A
公开(公告)日:2022-08-09
申请号:CN202210373353.0
申请日:2022-04-11
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9536 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种用户项目推荐方法,其步骤包括:1)从训练数据集中选取一已观测用户/项目对(u,p)并将其输入到推荐系统模型M,得到用户u与项目p的相似性分数s(u,p);2)选取一未观测用户/项目对(u,n)并将其输入到模型M,得到用户u与项目n的相似性分数s(u,n);3)利用损失函数计算得到损失值;然后根据所得损失值采用反向传播算法对模型M进行优化;bu为用户u对应的辅助分数;4)对于一预测项目x,则其输入到训练好的模型M中,若相似性分数s(u,x)大于bu,则将项目x推荐给该用户u。
-
公开(公告)号:CN113127599B
公开(公告)日:2022-07-12
申请号:CN202110230676.X
申请日:2021-03-02
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种层级对齐结构的问答立场检测方法及装置,包括:分别将问题文本与回答文本转换为问题序列与回答序列;拼接问题序列与回答序列,得到问题回答序列;将问题序列、回答序列及问题回答序列输入层次对齐模型,得到问答立场检测结果。本发明的层次对齐模型,先使用了BERT预训练模型得到粗粒度的立场表示,然后从QA对中的问题和回答两方面进行了概念级别的目标对齐和证据级别的信息对齐,得到了由粗到精的立场表示,从而在问答立场检测任务上可以获得更高的准确率和F1值。
-
公开(公告)号:CN112507347B
公开(公告)日:2022-06-24
申请号:CN202011161521.7
申请日:2020-10-27
Applicant: 中国科学院信息工程研究所
IPC: G06F21/60
Abstract: 本发明公开了一种面向分布式密码破解框架的破解作业描述信息生成方法,其步骤包括:1)分布式密码破解框架根据待处理的密码破解需求对设定的破解作业类进行实例化,生成一破解作业对象;2)根据该破解对象对设定的破解信息类进行实例化生成相应的破解信息对象,并赋给该破解作业对象中的破解信息字段;3)根据设定的破解策略类对该破解作业对象配置的破解策略进行实例化,为每一所述破解策略生成一相应的破解策略对象并添加该破解作业对象的破解策略集字段中;然后累加各所述破解策略对象的破解空间长度,将破解空间长度总和赋给该破解作业对象的破解空间长度字段;将更新后的破解作业对象作为该密码破解需求的破解作业描述信息。
-
公开(公告)号:CN114428776A
公开(公告)日:2022-05-03
申请号:CN202111477748.7
申请日:2021-12-06
Applicant: 中国科学院信息工程研究所
IPC: G06F16/22 , G06F16/245 , G06F16/2458
Abstract: 本发明涉及一种面向时序数据的索引分区管理方法和系统。该方法包括:将一条时序数据创建索引所需的必要信息封装到一个Document对象中;根据时序数据的时间值,基于Time Detector组件判断时序数据的索引所属的索引分区;根据时序数据所属的索引分区的起止时间,从Time Partition Metadata组件中得到该索引分区的元数据信息以及与该索引分区相关的IndexWriter对象;利用对应索引分区的IndexWriter对象对Document对象中封装的数据进行索引创建操作。本发明将时序数据索引数据在时间维度进行分区管理,能够大幅提升查询效率,适合查询类型复杂且数据量大的时序数据应用场景。
-
公开(公告)号:CN114220086A
公开(公告)日:2022-03-22
申请号:CN202111295077.2
申请日:2021-11-03
Applicant: 中国科学院信息工程研究所 , 中国传媒大学
Abstract: 本发明公开一种成本高效的场景文字检测方法及系统,属于图像字体识别领域,本发明首先在预训练阶段提出一种无监督域适应方法,通过消除虚拟数据和真实数据的域差异,使虚拟数据在特征上更接近真实数据,从而获得一个较好的迁移学习初始模型;其次在微调阶段提出一个半监督主动学习方法,根据真实数据的标注信息量自适应选择数据进行标注,然后同时利用有标注和无标注的真实数据进行训练,在较小标注成本的条件下尽可能提升场景文字检测性能。
-
公开(公告)号:CN113989582A
公开(公告)日:2022-01-28
申请号:CN202110988818.9
申请日:2021-08-26
Applicant: 中国科学院信息工程研究所
IPC: G06V10/774 , G06V10/764 , G06V10/762 , G06N3/08 , G06N3/04
Abstract: 本发明公开了一种基于密集语义对比的自监督视觉模型预训练方法,其步骤包括:1)对于样本图像xi,利用数据增强方法a、b分别对样本图像xi增强后进行特征提取和映射,得到样本图像xi中每一个像素点pi的特征,即像素级特征以及实例级特征2)基于和进行对比学习,得到实例判别损失Lins;基于和进行对比学习,得到像素判别损失Lpix;3)根据像素点pi对应的正样本集计算邻居判别损失Lnei;4)对像素级特征集合va、vb分别执行聚类,分别获得K个聚类集群;然后对每个集群进行对比学习,计算聚类对比损失LKM;5)根据损失函数L=Lins+Lpix+Lsem对自监督视觉模型进行端到端的训练。
-
公开(公告)号:CN113963340A
公开(公告)日:2022-01-21
申请号:CN202111026162.9
申请日:2021-09-02
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于并行迭代模仿解码的场景文字识别系统及方法,涉及场景图像文本检测识别领域,综合了自回归和非自回归解码的优点,采用一种并行迭代的生成方式,针对不同长度的文本采用固定的迭代次数,并将“简单优先”策略引入到文字识别任务中,并引入一个额外的自回归解码器作为教师网络,使用自回归解码器FFN的输出作为额外的监督信号对并行解码器进行监督学习,并使用模仿学习来辅助并行解码器隐藏层的学习。本发明在多个公开的数据集上达到了最优的准确率,同时与自回归方法相比,速度上有明显的提升。
-
公开(公告)号:CN108399185B
公开(公告)日:2021-12-21
申请号:CN201810023335.3
申请日:2018-01-10
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种多标签图像的二值向量生成方法及图像语义相似度查询方法。本发明1利用训练数据集对卷积神经网络模型进行训练,直至该卷积神经网络模型的损失值趋于稳定;然后利用训练后的卷积神经网络模型对图像数据库中的图片进行计算,得到每张图片的二值向量并进行存储;利用训练后的卷积神经网络模型计算待查询图片的二值向量,并将其与存储的二值向量进行相似度计算,根据相似度计算结果返回与该待查询图片最相似的若干图片。本发明大大提高了图像的存储效率和查询效率;而且可以根据与查询图片的多级语义相似度对目标图片进行排序。
-
公开(公告)号:CN110503090B
公开(公告)日:2021-11-09
申请号:CN201910614874.9
申请日:2019-07-09
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于受限注意力模型的字符检测网络训练方法、字符检测方法和字符检测器。本发明设计了基于深度神经网络的字符检测器,在网络结构中加入注意力模型来对学习到的特征进行加权,充分利用了字符周围的上下文信息来辅助字符特征的学习,并设计了一个受限关系模型来对上下文信息进行编码,考虑了不同上下文信息对当前特征的影响。本发明使用受限的上下文信息来提升字符检测的结果,通过融入合适的上下文信息,可以在很大程度上提高字符检测器的性能,使其对于复杂环境(光照、遮挡、复杂纹理等)的变化产生较强的抵抗性,能够减少检测过程中的误报和漏报,同时能够提供初步的识别结果。
-
-
-
-
-
-
-
-
-