-
公开(公告)号:CN118780985A
公开(公告)日:2024-10-15
申请号:CN202411259633.4
申请日:2024-09-10
Applicant: 中国科学院自动化研究所
IPC: G06T3/4053 , G06T3/4046 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明提供了一种图像重建方法、模型训练方法、装置、设备、介质及产品,可以应用于图像超分辨率重建领域。图像重建方法包括:对存在质量损失的退化图像进行特征提取,得到表征图像底层细节的底层图像特征和表征图像退化信息的隐式退化特征;利用隐式退化特征调节器分别对隐式退化特征进行通道级和空间级的扩展;将扩展后的隐式退化特征融入到底层图像特征中,分别得到融合了图像退化信息的通道图像特征和空间图像特征;将通道图像特征和空间图像特征进行特征融合并引入底层图像特征,以对退化图像的高频细节进行恢复;将进行细节恢复后得到的图像特征输入图像超分辨率模块中,输出重建的目标图像,其中,目标图像的分辨率高于退化图像。
-
公开(公告)号:CN109582953B
公开(公告)日:2023-04-07
申请号:CN201811302326.4
申请日:2018-11-02
Applicant: 中国科学院自动化研究所
IPC: G06F40/30 , G06F40/289 , G06F16/9535
Abstract: 本发明公开了一种资讯的言据支撑评分方法、设备和存储介质。该方法包括:对资讯库中的所有资讯分别进行深度语义向量编码;根据每个所述资讯的深度语义向量,计算所有资讯两两之间的相似度,得到语义相似度矩阵;根据所述语义相似度矩阵,构建语义网络;根据预设的随机游走模型,对所述语义网络中每个节点对应的资讯进行言据支撑评分。本发明的立足点在于评价资讯中观点的可靠性,对资讯进行深度语言向量编码,通过计算资讯两两之间的相似度,构建语义网络,进而可以计算出每个资讯的言据支撑评分,本发明准确性高,并且可以有效降低人力成本。
-
公开(公告)号:CN115311595A
公开(公告)日:2022-11-08
申请号:CN202210771422.3
申请日:2022-06-30
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种视频特征提取方法、装置及电子设备,涉及视频处理技术领域,可以应用于视频特征提取的场景。该视频特征提取方法包括:获取视频图像和视频图像对应的音频数据;将音频数据转换为声谱图,得到声谱图像;将视频图像和声谱图像输入至视频特征提取模型,得到视频特征提取模型输出的视频特征;其中,视频特征提取模型是基于样本视频数据和对偶式对比学习模型对基础神经网络模型进行预训练得到的,对偶式对比学习模型用于对样本视频数据经基础神经网络模型处理后输出的第一多模态样本特征矩阵分别进行行维度和列维度上的对比学习。本发明提供的技术方案可以提高视频特征提取的准确性和泛化性。
-
公开(公告)号:CN110717317B
公开(公告)日:2021-06-08
申请号:CN201910867119.1
申请日:2019-09-12
Applicant: 中国科学院自动化研究所
IPC: G06F40/169 , G06F40/289 , G06Q10/10
Abstract: 本发明属于文本标注领域,具体涉及一种在线人工中文文本标注系统,旨在解决现有人工中文文本标注系统无法实现多人协作标注的问题。本发明系统包括:服务器、第一、二客户端;第一、二客户端分别与服务器相连;服务器包括数据库;第一客户端包括管理模块;第二客户端包括标注、重分词、切换模块;管理模块配置为拆分标注文本,并上传数据库;数据库配置为根据分配指令将标注项目与标注用户关联;标注模块配置为对标注项目中的语句进行标注;重分词模块配置为依据输入指令对标注项目的语句进行重新分词;切换模块配置为对标注、重分词模块工作状态的切换。本发明实现了多人协作标注,并提高了文本标注的准确率和效率。
-
公开(公告)号:CN111539911A
公开(公告)日:2020-08-14
申请号:CN202010209044.0
申请日:2020-03-23
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种口呼吸面容识别方法、设备和存储介质。该方法包括:采集有效人脸图像;确定有效人脸图像中目标人脸的姿态角;如果目标人脸的姿态角在预设的姿态角范围之内,则在有效人脸图像中,提取目标人脸的结构度量特征;将目标人脸的结构度量特征输入预先训练的口呼吸面容识别模型,获取口呼吸面容识别模型输出的口呼吸面容识别结果;其中,对预设的正样本图像进行图像增广处理,利用图像增广处理后的正样本图像以及预设的负样本图像,训练口呼吸面容识别模型。本发明利用图像处理技术结合预先训练的口呼吸面容识别模型识别目标人脸是否为口呼吸面容,解决了口呼吸面容诊断过程,无论对疑似患者还是对医生而言都成本较高的问题。
-
公开(公告)号:CN111339777A
公开(公告)日:2020-06-26
申请号:CN202010111949.4
申请日:2020-02-24
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于神经网络的医学相关意图识别方法及系统,所述识别方法包括:获取历史的用户医学问题,得到问题文本;对所述问题文本进行标注,得到标注文本,所述标注文本包括原始标注文本及实体替换标注文本;根据所述问题文本及标注文本,训练初始神经网络,得到最优超参数集下的优化神经网络;基于所述优化神经网络,根据当前用户的医学问题,确定该当前用户的意图。本发明通过对用户医学问题进行标注,得到原始标注文本及实体替换标注文本,从而可提供大量的标注文本信息,并进一步基于标注文本及问题文本,对初始神经网络进行训练,得到可以确定用户意图的优化神经网络,分析速度快,准确度高。
-
公开(公告)号:CN119580333A
公开(公告)日:2025-03-07
申请号:CN202510127478.9
申请日:2025-01-27
Applicant: 中国科学院自动化研究所
Abstract: 本公开关于人脸图像鉴伪模型的训练方法、人脸图像鉴伪方法和装置,包括:提取训练样本图像中多个类型的指定特征;将多个类型的指定特征进行拼接;将指定拼接特征分别输入多个特征提取模块;利用每个特征提取模块输出的模型提取特征进行融合;将融合特征输入全连接层以预测训练样本图像的真伪;基于真实类别标签、预测结果和融合特征,计算损失;通过根据损失调整每个特征提取模块的参数。这样,通过预先从不同角度设计有针对性的指定特征,可以实现提高特征提取的全面性和丰富性。另外,还可以通过综合不同特征提取模块的优势来提高特征表示的鲁棒性和多样性,从而可以更好地应对复杂和多变的鉴伪场景。
-
公开(公告)号:CN118133241A
公开(公告)日:2024-06-04
申请号:CN202410552190.1
申请日:2024-05-07
Applicant: 中国科学院自动化研究所
IPC: G06F18/27 , G06F18/213 , G06N3/0455 , G06N3/0895 , G06N3/096
Abstract: 本发明涉及多模态技术领域,提供一种多模态预训练模型的训练方法、装置、设备和存储介质,包括:构建多模态预训练模型,包括视觉编码器、多语言编码器以及英文解码器;基于图像‑英文文本数据获取第一损失函数;基于多语言文本‑英文文本数据获取第二损失函数;基于目标文本‑图像数据应用于视觉编码器与多语言编码器进行对比学习获取第三损失函数;基于目标文本‑图像数据的相似度矩阵获取强负样本数据,基于强负样本数据与正样本数据应用于英文解码器获取第四损失函数;基于第一损失函数、第二损失函数、第三损失函数以及第四损失函数,得到训练好的多模态预训练模型。本发明既有效缓解对多语言‑图像数据的依赖,又直接有效的利用视觉特征。
-
公开(公告)号:CN115311595B
公开(公告)日:2023-11-03
申请号:CN202210771422.3
申请日:2022-06-30
Applicant: 中国科学院自动化研究所
IPC: G06V20/40 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08 , G10L25/18
Abstract: 本发明提供一种视频特征提取方法、装置及电子设备,涉及视频处理技术领域,可以应用于视频特征提取的场景。该视频特征提取方法包括:获取视频图像和视频图像对应的音频数据;将音频数据转换为声谱图,得到声谱图像;将视频图像和声谱图像输入至视频特征提取模型,得到视频特征提取模型输出的视频特征;其中,视频特征提取模型是基于样本视频数据和对偶式对比学习模型对基础神经网络模型进行预训练得到的,对偶式对比学习模型用于对样本视频数据经基础神经网络模型处理后输出的第一多模态样本特征矩阵分别进行行维度和列维度上的对比学习。本发明提供的技术方案可以提高视频特征提取的准确性和泛化性。
-
公开(公告)号:CN115909479A
公开(公告)日:2023-04-04
申请号:CN202211289157.1
申请日:2022-10-20
Applicant: 中国科学院自动化研究所
IPC: G06V40/20 , G06V10/764 , G06V10/80 , G06V10/82 , G06V20/40
Abstract: 本发明提供一种人体行为识别方法、装置、电子设备及可读存储介质,其中人体行为识别方法包括:从压缩视频数据中提取压缩域信息,压缩域信息中包括多个I帧、残差以及运动矢量;将各I帧及各目标残差所对应的深层特征进行融合处理,得到各I帧对应的局部时空特征;将相邻两个局部时空特征进行融合处理,得到压缩视频数据对应的全局时空特征;基于全局时空特征、运动矢量及残差,确定压缩视频数据对应的目标特征,并基于目标特征确定压缩视频数据对应的人体行为识别结果。通过将各I帧及各目标残差进行融合,能得到表达能力更强的局部时空特征以及全局时空特征,基于全局时空特征、运动矢量及残差进行人体行为识别,能够提高人体行为识别的准确率。
-
-
-
-
-
-
-
-
-