-
公开(公告)号:CN101477633B
公开(公告)日:2010-08-25
申请号:CN200910076781.1
申请日:2009-01-21
Applicant: 北京大学
CPC classification number: G06K9/00711 , G06K9/4671
Abstract: 本发明涉及一种图像和视频处理方法,特别是一种通过机器学习技术来自动估计视频内容的视觉显著程度的方法。本方法首先自动将训练样本分为若干类别,对每一类别学习得到最佳的“样本特征-显著度分布图”映射函数,并对每类训练样本的底层特征进行建模。对待估计样本,根据其底层特征判断其属于哪一类样本,再选取相应的“样本特征-显著度分布图”映射函数来计算其显著度分布图。根据本发明可以快捷有效的估计视频和图像等多种多媒体信息的视觉显著度分布图。
-
公开(公告)号:CN101621636A
公开(公告)日:2010-01-06
申请号:CN200810115955.6
申请日:2008-06-30
Applicant: 北京大学
Abstract: 一种基于视觉注意力模型的广告标识自动插入和变换方法及系统,其包括:首先,基于所构建的视觉注意力模型预测用户对视频每帧各区域的兴趣区域和对各帧的关注程度;然后,根据用户对各帧的关注程度曲线来确定插入广告的时间点,并通过基于预测出的注意力分布来评价在各区域插入广告的合适程度,进而获取可供广告插入的候选区域序列,并将广告插入到对视频内容影响不大的区域;最后,根据预测出的注意力分布将广告标志插入到合适的时间点和位置,并对其进行多种特征变换,以使其能够重复吸引用户或观众的注意力。根据本发明可以有效进行广告标识的自动插入和变换,并使所插入的广告标识在不影响正常观看的情况下能够重复吸引人的注意力。
-
公开(公告)号:CN101482926A
公开(公告)日:2009-07-15
申请号:CN200910077364.9
申请日:2009-02-19
Applicant: 北京大学
Abstract: 一种可伸缩的自适应多核分类方法,涉及人工智能领域,特别是数据挖掘技术。预处理阶段,得到多核矩阵;建模阶段,构建一个簇相关的多核分类器;参数学习阶段,在统一的框架内对分类器参数及多组多核权值参数进行优化;数据分类阶段,对待分类的样本,首先确定其属于哪一个簇,再利用学习好的分类器进行数据分类。本发明通过引入中间表达“簇”挖掘复杂数据集的类间相关性和类内多样性,建立了簇相关的自适应和可伸缩多核分类器,并通过迭代的方式在统一的学习框架下优化分类器参数和多组多核权值参数。面对类别繁多且特征表现复杂的数据分类问题,解决类间相关性和类内多样性带来的数据混叠问题,提高了分类准确率,且分类效果更为鲁棒。
-
公开(公告)号:CN100515048C
公开(公告)日:2009-07-15
申请号:CN200710176126.4
申请日:2007-10-19
Applicant: 北京大学
Abstract: 本发明涉及一种图像和视频处理方法及系统,特别是关于一种快速检测在线视频流中静态叠加文字的方法及系统。静态叠加文字检测方法利用帧间相关信息及小波域建模等方法,可以有效的去除运动文字和背景区域,并保留静态叠加文字区域。本方法可以实现对在线视频流中静态叠加文字位置的快速检测。同时,基于静态叠加文字检测方法构建了一种在线视频流检索系统。本系统中,在各个用户终端上使用不同的参数族进行快速的文字检测,并将结果通过OCR控件转化为文本流。在各用户终端将文本流传输至集中检索服务器进行整合后,可以提供对各频道的多时间粒度的检索功能,并提供对各频道的基于内容的快速浏览功能。本发明可以在不侵犯版权的情况下,实现对多路多种质量的在线视频流进行同步分析、索引、检索以及浏览的功能,并且不需要对各种视频流建立专门的服务器。
-
公开(公告)号:CN118537236A
公开(公告)日:2024-08-23
申请号:CN202410672843.X
申请日:2024-05-28
Applicant: 北京大学
IPC: G06T5/50 , G06T5/73 , G06T5/60 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种可见光脉冲信号和红外图像的融合及融合模型的训练方法,利用了可见光时空脉冲信号提取的可见光纹理不受运动模糊的影响,即使在极端光照条件下也能保持稳健的特性,以及红外图像对光照不敏感的特性,采用可见光时空脉冲信号提取纹理后的可见光图像集合对红外图像进行图像增强,使红外图像具有更多纹理细节,并将增强后的红外图像与基于可见光时空脉冲信号确定的可见光图像融合,结合两者的互补特性,实现即使在极端光照以及运动模糊的情况下,也能得到一个场景的高质量图像。
-
公开(公告)号:CN115019079B
公开(公告)日:2024-05-28
申请号:CN202110239799.X
申请日:2021-03-04
Applicant: 北京大学
IPC: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公布了一种用于图像识别的分布式概略优化加速深度学习训练的方法,设置多个计算节点用于分布式计算;在训练图像识别深度神经网络模型中的二阶矩阵计算时,采用块对角近似,并使用概略方法进行矩阵与向量乘积的分布式隐式计算;各个计算节点并行地将图片依次传入采用所述分布式概略优化加速深度学习训练的方法训练好的图像识别深度神经网络模型中,预测得到每个图片的输出向量,即图片属于各标签的概率,由此实现图像识别。本发明可以大幅度减少计算量,提高深度神经网络的训练速度,缩短训练时间,提升二阶算法相比一阶算法的效果。
-
公开(公告)号:CN116578636B
公开(公告)日:2023-12-15
申请号:CN202310538318.4
申请日:2023-05-15
Applicant: 北京大学
Abstract: 本公开涉及一种分布式多智能体合作方法、系统、介质及设备。该方法包括:对将过去对局历史中特定步骤数量的观测状态进行存储以构造观测历史寄存器;所述历史寄存器随着智能体与环境交互的进行,所述历史寄存器持续接受新的历史状态,并将超过容量限制的早期的历史状态丢弃;构造历史背景网络,其中,所述历史背景网络的输入为当前观测状态,与历史寄存器中的历史状态,通过数据挖掘与融合,所述历史背景网络的输出历史背景嵌入状态;构造隐式变分推理网络,构造策略网络和状态价值网络并通过强化学习进行训练,其中,所述策略网络和所述状态价值网络的输入为信念嵌入和当前观测状态,所述策略网络和所述状态价值网络的输出为策略分布和状态价值。
-
公开(公告)号:CN116578636A
公开(公告)日:2023-08-11
申请号:CN202310538318.4
申请日:2023-05-15
Applicant: 北京大学
Abstract: 本公开涉及一种分布式多智能体合作方法、系统、介质及设备。该方法包括:对将过去对局历史中特定步骤数量的观测状态进行存储以构造观测历史寄存器;所述历史寄存器随着智能体与环境交互的进行,所述历史寄存器持续接受新的历史状态,并将超过容量限制的早期的历史状态丢弃;构造历史背景网络,其中,所述历史背景网络的输入为当前观测状态,与历史寄存器中的历史状态,通过数据挖掘与融合,所述历史背景网络的输出历史背景嵌入状态;构造隐式变分推理网络,构造策略网络和状态价值网络并通过强化学习进行训练,其中,所述策略网络和所述状态价值网络的输入为信念嵌入和当前观测状态,所述策略网络和所述状态价值网络的输出为策略分布和状态价值。
-
公开(公告)号:CN115841142B
公开(公告)日:2023-06-06
申请号:CN202310134058.4
申请日:2023-02-20
IPC: G06N3/065 , G06N3/0464 , G06N3/08 , G06N3/049
Abstract: 本发明公开了基于深度脉冲神经网络的视觉皮层模拟方法及相关设备,所述方法包括:将与生物实验中相同的图片刺激输入到预训练的深度脉冲神经网络,得到各层的脉冲响应;采用表征相似性分析RSA或者典型相关分析CCA度量深度脉冲神经网络各层的脉冲响应和真实生物神经响应之间的相似性;选择最高的神经相似性得分作为深度脉冲神经网络的结构针对相应脑区的得分,并记录得分最高的层以与生物视觉系统进行对比。本发明利用深度脉冲神经网络对神经系统视觉皮层进行建模,可以直接与生物实验记录的时序信号进行比较,取得了相对于相似结构卷积神经网络更高的神经相似性得分,同时也在网络结构和信息处理机制方面更好地匹配了真实神经系统的性质。
-
公开(公告)号:CN111191520B
公开(公告)日:2023-02-07
申请号:CN201911260885.8
申请日:2019-12-10
Applicant: 北京大学
IPC: G06V40/20
Abstract: 本发明公开了一种用于动作识别的人体骨架压缩方法,包括:获取待识别的人体骨架数据,其中所述人体骨架数据是由时间和关节构成的矩阵;计算所述人体骨架数据中每个关节的运动得分,并按照所述运动得分从高到低的顺序对所述人体骨架数据中的每个关节进行排序,按照顺序选择预设数目的关节作为保留关节;根据所述保留关节对所述人体骨架数据进行压缩,得到压缩数据;根据所述压缩数据对人体动作进行识别。通过上述方法,可以将骨架数据流压缩到较小的带宽,同时保持动作识别的精度尽可能高。
-
-
-
-
-
-
-
-
-