-
公开(公告)号:CN108304808B
公开(公告)日:2021-08-17
申请号:CN201810118845.9
申请日:2018-02-06
Applicant: 广东顺德西安交通大学研究院 , 台州智必安科技有限责任公司
Abstract: 本发明公开了一种基于时空信息与深度网络的监控视频对象检测方法,包括收集、标注数据集,训练深度卷积神经网络;利用训练好的深度神经卷积网络提取鲁棒的多尺度深度特征;在多尺度深度特征上提取运动目标候选区域;根据视频前后帧检测结果预测下一帧目标出现的位置;针对运动目标候选区域和预测候选区域进行RoI归一化并对特征向量进行分类和回归得到初步检测结果;利用运动和预测信息,对得到的初步结果进行微调,进一步精准检测结果。本发明综合考虑了视频中所包含的丰富的时空信息,利用运动和预测大大减少了冗余的候选框,并且解决了单帧检测结果不稳定的问题,与其他基于区域的目标检测检测方法相比,在时间和检测精准度上都有了一定的提升。
-
公开(公告)号:CN111583115A
公开(公告)日:2020-08-25
申请号:CN202010364389.3
申请日:2020-04-30
Applicant: 西安交通大学
Abstract: 本发明公开一种基于深度注意力网络的单幅图像超分辨率重建方法及系统,包括:步骤1:对开源图像训练数据集DIV2K进行预处理,获得训练集;步骤2:建立能够对图像进行超分辨率重建的卷积神经网络;步骤3:将步骤1获得的训练训练集输入步骤2建立的卷积神经网络进行训练,得到超分辨率重建模型;步骤4:将待处理的低分辨率单幅图像输入步骤3获得的超分辨率重建模型,输出单幅图像超分辨率重建图像。利用多个常用测试数据集来对最终训练好的模型进行峰值信噪比和结构相似性的计算,本发明利用深度学习的方法设计的近200层卷积层的网络可以实现和400层左右的网络相当的性能,并且参数量更少,训练更容易,并且超分处理后的图像更加清晰。
-
公开(公告)号:CN105183746B
公开(公告)日:2018-04-17
申请号:CN201510397208.6
申请日:2015-07-08
Applicant: 西安交通大学
Abstract: 本发明公开了一种从多幅相关图片中挖掘显著特征实现图像检索的方法,其特征是,采用灵活二值描述符的生成以及基于二值描述符的特征匹配来完成。灵活二值描述符将原始的浮点型图像特征的每一维通过与二叉平衡树各结点相应参考值的比较而转变为二进制的形式;而特征匹配首先基于二值描述符计算特征间的相似性,然后归一化特征的相似性得分,依次选出最佳匹配的特征对,由最佳匹配特征对可以找到多幅相关图中的显著特征。显著特征数量少,但代表着图片的重要视觉内容,结合其几何信息用于检索可以得到不错的检索结果。
-
公开(公告)号:CN105183746A
公开(公告)日:2015-12-23
申请号:CN201510397208.6
申请日:2015-07-08
Applicant: 西安交通大学
CPC classification number: G06F17/30247 , G06K9/4671 , G06K9/6211
Abstract: 本发明公开了一种从多幅相关图片中挖掘显著特征实现图像检索的方法,其特征是,采用灵活二值描述符的生成以及基于二值描述符的特征匹配来完成。灵活二值描述符将原始的浮点型图像特征的每一维通过与二叉平衡树各结点相应参考值的比较而转变为二进制的形式;而特征匹配首先基于二值描述符计算特征间的相似性,然后归一化特征的相似性得分,依次选出最佳匹配的特征对,由最佳匹配特征对可以找到多幅相关图中的显著特征。显著特征数量少,但代表着图片的重要视觉内容,结合其几何信息用于检索可以得到不错的检索结果。
-
公开(公告)号:CN102136062B
公开(公告)日:2013-04-17
申请号:CN201110054986.7
申请日:2011-03-08
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于多分辨LBP的人脸检索方法,其特征是,包括如下执行步骤:首先对输入的人脸的图像10执行基于多分类器融合的人脸检测单元20;然后执行人脸图像中关键部位的检测单元30;接下来执行人脸图像形状归一化处理单元40;接下来执行关键部位局部区域采样图像单元50;接下来执行多分辨LBP特征描述单元60;接下来执行视觉词汇生成与索引建立单元70;最后执行基于TF-IDF的相似性度量单元80;最终的检索结果在单元90中进行显示。
-
公开(公告)号:CN101783951B
公开(公告)日:2012-01-04
申请号:CN201010116127.1
申请日:2010-03-02
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于人类视觉系统的视频编码帧间预测模式快速确定方法,其特征在于,包括如下执行步骤:首先对输入的参考帧图像和当前帧图像进行HVS滤波,然后对滤波后的图像划分成宏块并按照HVS滤波后图像中每个MB的均值和方差确定该MB的划分方式是SKIP,16x16,16x8,8x16,8x8五种模式中的一种,如果所确定的类型为8x8,则再计算其中8x8,4x8,8x4,4x4中的均值和方差,并最终确定8x8,4x8,8x4,4x4中的具体对应模式。在帧间预测模式确定基础上进行有针对性的运动估计与运动补偿。
-
公开(公告)号:CN102103641A
公开(公告)日:2011-06-22
申请号:CN201110054991.8
申请日:2011-03-08
Applicant: 西安交通大学
Abstract: 本发明公开了一种在用户浏览网络图像中添加图标广告的方法,包括下述步骤:首先对用户浏览的网络图像单元10执行视觉相似图像检索单元20,将用户浏览的网络图像单元10中的图像画面100进行相似图像确定;然后执行用户兴趣描述词排序单元30,按照不同时间约束信息来获取用户兴趣信息;接下来执行广告排序方法与选择单元40;接下来执行广告位置选择及链接单元50,按照广告排序的结果,对每个图标广告与当前图像的视觉相似性进行计算,确定插入图标广告的位置,并在相应的广告插入位置添加有关描述该广告更详细内容的超链接;最终的检索结果在显示插入广告效果图单元60中进行显示。
-
公开(公告)号:CN101127866A
公开(公告)日:2008-02-20
申请号:CN200710018455.6
申请日:2007-08-10
Applicant: 西安交通大学
Abstract: 本发明针对现有体育比赛视频检测精彩片段方法中不能判断片段所属的类型,提出了一种检测足球视频精彩片段的方法,包括如下步骤:首先对数据库中足球比赛的压缩视频通过解码器进行解码;接下来进行视频镜头边界检测,然后对镜头类型中的其它镜头进行特征提取,在相应特征提取的基础上进行足球视频镜头分类;然后根据镜头分类结果进行视频镜头片段边界检测,并提取每个片段中的观测矢量;再从一个片段中所提取的观测矢量来判断该片段所属的类型,接下来对确定的精彩片段进行划分,最后将划分后的精彩片段进行摘录并存储到数据库中。
-
公开(公告)号:CN119938863A
公开(公告)日:2025-05-06
申请号:CN202510105661.9
申请日:2025-01-23
Applicant: 西安交通大学
IPC: G06F16/3329 , G06F16/335 , G06F16/353 , G06F40/16 , G06F40/30 , G06N5/04
Abstract: 本发明公开了一种基于大语言模型偏好对齐的问答生成方法及系统,涉及人工智能自然语言处理技术领域,包括以下步骤:将每个原问题与指定提示进行拼接,将拼接指令输入至释义生成器,生成与该原问题对应的多个释义;将每个原问题以及对应的多个释义输入至目标大语言模型,将多个释义分为受偏释义集与非受偏释义集;将非受偏释义集作为输入,受偏释义集作为输出对预训练语言模型进行训练,得到具偏释义生成器。本发明实现问题偏好对齐所需的整个流程是一个黑箱优化过程,不需要获取与更改目标大语言模型的任何参数,可以解决传统白盒方法计算资源需求高,存在隐私泄露和安全隐患的问题。
-
公开(公告)号:CN117874204A
公开(公告)日:2024-04-12
申请号:CN202410061416.8
申请日:2024-01-16
Applicant: 西安交通大学
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/34
Abstract: 本发明公开了一种知识问答方法、系统、存储介质和计算机设备,涉及人工智能自然语言处理技术领域。本发明通过将知识数据按照行文结构进行多层次切分,从而得到原始知识数据不同粒度的表示,其中,更大粒度知识数据通常带有知识对应的场景信息,而更小粒度知识数据对应知识细节,之后在对用户提问的相似匹配过程中,从大粒度的知识数据向下进行匹配,并通过大粒度知识数据的相似度对其包含的小粒度知识数据进行相似度加权,则当大粒度知识数据的场景与用户提问不匹配时,其包含的小粒度知识数据的匹配度会被降权,避免匹配过程中陷入小粒度的局部最优匹配,提高了检索私有知识库时检索得到的目标知识数据的准确度,从而提高了回复的准确度。
-
-
-
-
-
-
-
-
-