-
公开(公告)号:CN114343612A
公开(公告)日:2022-04-15
申请号:CN202210232829.9
申请日:2022-03-10
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于机器视觉、数据识别领域,具体涉及一种基于transfomer的非接触式呼吸率测量方法、系统、装置,旨在解决现有的呼吸率测量方法获得的模型泛化能力差,进一步导致测量的呼吸率精度较差的问题。本发明方法包括:获取设定时间段内包含人脸信息的待测视频帧序列;基于待测视频帧序列,通过人脸检测模型和人脸关键点模型获取人脸感兴趣区域图像序列;基于人脸感兴趣区域图像序列,通过训练好的端到端Transformer模型获取设定时间段内的呼吸率序列。本发明提升了呼吸率的测量精度。
-
公开(公告)号:CN113743332B
公开(公告)日:2022-03-25
申请号:CN202111050476.2
申请日:2021-09-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于机器学习和数据质量评价领域,具体涉及了一种基于通用视觉预训练模型的图像质量评价方法及系统,旨在解决现有技术在缺乏大量人工筛查的情况下,视频监控的图像和视频质量评价的效率和精度低的问题。本发明包括:获取存在设定类别异常的图像样本集,进行异常筛查和标注;通过筛查和标注后的第一训练样本集进行样本收集模型训练;设定训练好的样本收集模型的收集阈值,并在线收集带视频帧图像质量评价标注的第二训练样本集;通过第二训练样本集进行图像质量异常分类模型训练;通过训练好的图像质量异常分类模型在线进行视频帧图像和/或单帧图像的质量异常分类。本发明人工介入少,视频监控的图像和视频质量评价的效率、准确性和精度高。
-
公开(公告)号:CN113408508B
公开(公告)日:2021-11-30
申请号:CN202110960664.2
申请日:2021-08-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明机器视觉、数据识别领域,具体涉及了一种基于Transformer的非接触式心率测量方法、系统及设备,旨在解决现有的对人脸心率测试中测量结果精度低、计算成本高的问题。本发明包括:获取设定时间段内包含人脸信息的待测视频帧序列;基于所述待测视频帧序列,通过人脸关键点模型获取人脸感兴趣区域图像序列;对所述人脸感兴趣区域图像序列进行预处理,并基于预处理后的所述人脸感兴趣区域图像序列,通过训练好的端到端Transformer模型获取设定时间段内的心率序列。本发明提高现有技术中对人脸心率测试的测量结果的精度,并降低计算成本。
-
公开(公告)号:CN119474895A
公开(公告)日:2025-02-18
申请号:CN202411150245.2
申请日:2024-08-21
Applicant: 中国科学院自动化研究所
IPC: G06F18/22 , G06F18/214 , G06F8/75 , G06N3/0464 , G06N3/084
Abstract: 本发明提供一种相似性检测方法、装置、设备及介质,包括:获取用于相似性检测的第一汇编代码和第二汇编代码;将所述第一汇编代码和所述第二汇编代码进行编码,得到所述第一汇编代码对应的第一向量和所述第二汇编代码对应的第二向量;将所述第一向量和所述第二向量输入相似性检测模型中,确定所述第一向量和所述第二向量的相似度。该方法用以解决相关技术中计算数据量较为庞大,存在数据丢失的状况,致使相似性检测需要消耗大量资源的同时相似性检测精度较低,进而导致检测的成本显著上升的问题,通过使用相似性检测模型来判断汇编代码之间的相似性,大幅降低了检测的时间和计算成本,且检测的精度显著提高。
-
公开(公告)号:CN118378094B
公开(公告)日:2024-09-17
申请号:CN202410824680.2
申请日:2024-06-25
Applicant: 武汉人工智能研究院 , 中国科学院自动化研究所
IPC: G06F18/214 , G06F30/36 , G06N3/0464 , G06N3/092
Abstract: 本发明提供一种芯片布局模型训练及运用方法、装置、电子设备及存储介质,属于人工智能技术领域,训练方法包括:按顺序控制智能体序列的每个智能体执行基于所有智能体在当前时刻的状态信息确定的预测动作并获取执行信息,遍历智能体序列后,根据所有执行信息计算策略网络和价值网络的损失函数值,以对芯片布局模型中策略网络和价值网络的结构参数进行更新。本发明在芯片布局模型仅设置一个策略网络和价值网络的情况下,按顺序控制智能体执行预测动作,在所有智能体均执行一次预测动作之后,依据每次执行预测动作获取的所有执行信息更新模型结构参数,使得训练完成的芯片布局模型能够适用于器件数量各不相同的芯片布局,提高了模型泛化性能。
-
公开(公告)号:CN118378094A
公开(公告)日:2024-07-23
申请号:CN202410824680.2
申请日:2024-06-25
Applicant: 武汉人工智能研究院 , 中国科学院自动化研究所
IPC: G06F18/214 , G06F30/36 , G06N3/0464 , G06N3/092
Abstract: 本发明提供一种芯片布局模型训练及运用方法、装置、电子设备及存储介质,属于人工智能技术领域,训练方法包括:按顺序控制智能体序列的每个智能体执行基于所有智能体在当前时刻的状态信息确定的预测动作并获取执行信息,遍历智能体序列后,根据所有执行信息计算策略网络和价值网络的损失函数值,以对芯片布局模型中策略网络和价值网络的结构参数进行更新。本发明在芯片布局模型仅设置一个策略网络和价值网络的情况下,按顺序控制智能体执行预测动作,在所有智能体均执行一次预测动作之后,依据每次执行预测动作获取的所有执行信息更新模型结构参数,使得训练完成的芯片布局模型能够适用于器件数量各不相同的芯片布局,提高了模型泛化性能。
-
公开(公告)号:CN117423108A
公开(公告)日:2024-01-19
申请号:CN202311273241.9
申请日:2023-09-28
Applicant: 中国科学院自动化研究所 , 武汉人工智能研究院
IPC: G06V20/70 , G06V10/40 , G06V10/80 , G06V10/82 , G06F18/25 , G06F40/289 , G06F40/30 , G06F16/35 , G06N3/0455
Abstract: 本发明提供一种指令微调多模态大模型的图像细粒度描述方法及系统,涉及计算机技术领域,方法包括:获取目标图像对应的第一向量序列,目标图像对应的第一向量序列是通过对目标图像对应的第二向量序列进行编码后得到的,目标图像对应的第二向量序列是根据从所述目标图像中提取到的高级语义信息得到的;根据第一向量序列和第一提示模板,获取目标图像的细粒度描述文本,第一提示模板用于提供对目标图像进行细粒度描述所需的指令信息。本发明能够基于少量对图像进行细粒度描述所需的指令信息及承载图像的高级语义信息的向量序列,精准地识别和描述图像中重要目标的属性和特征,实现对图像的细粒度描述,提供更丰富及更具体的图像信息。
-
公开(公告)号:CN117422037A
公开(公告)日:2024-01-19
申请号:CN202311134048.7
申请日:2023-09-04
Applicant: 中国科学院自动化研究所 , 武汉人工智能研究院
IPC: G06F30/392 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及模拟芯片设计技术领域,提供一种模拟芯片自动化布局模型训练方法及自动化布局方法,该训练方法同步对各样本布局智能体对应的策略网络进行训练,可以实现模拟芯片自动化布局模型的中心化训练,提升强化学习收敛效率和稳定性。该训练方法可以得到配置于各目标布局智能体内的模拟芯片自动化布局模型,实现去中心化布局决策,可以提升后续模拟芯片布局效率及布局效果,能够在不需要大量的布局数据的前提下,在秒级的时间内,得到一个性能与人工布局性能相当的布局结果,从而实现自动化的布局,进而有助于后续模拟芯片布线,为模拟芯片的快速生产及批量化应用提供了便利。
-
公开(公告)号:CN113408508A
公开(公告)日:2021-09-17
申请号:CN202110960664.2
申请日:2021-08-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明机器视觉、数据识别领域,具体涉及了一种基于Transformer的非接触式心率测量方法、系统及设备,旨在解决现有的对人脸心率测试中测量结果精度低、计算成本高的问题。本发明包括:获取设定时间段内包含人脸信息的待测视频帧序列;基于所述待测视频帧序列,通过人脸关键点模型获取人脸感兴趣区域图像序列;对所述人脸感兴趣区域图像序列进行预处理,并基于预处理后的所述人脸感兴趣区域图像序列,通过训练好的端到端Transformer模型获取设定时间段内的心率序列。本发明提高现有技术中对人脸心率测试的测量结果的精度,并降低计算成本。
-
公开(公告)号:CN119761306A
公开(公告)日:2025-04-04
申请号:CN202411564900.9
申请日:2024-11-05
Applicant: 中国科学院自动化研究所
IPC: G06F40/126 , G06N3/0455
Abstract: 本发明提供一种基于大语言模型上下文压缩的长文本生成方法,方法包括:获取待压缩的上下文文本以及提示词文本,并进行基于压缩的编码处理,得到对应的压缩向量以及提示词嵌入向量;将压缩向量与提示词嵌入向量进行拼接,并对拼接得到的融合特征进行基于自回归的解码处理,得到对应的多个token标识符;根据预设的词表,将token标识符逐一地映射为文本字符串,并将文本字符串组成为压缩上下文文本。通过本申请,将大语言模型处理的上下文长文本进行压缩,解决现有技术中语义模型处理长上下文文本时需要消耗巨大的模型计算资源和数据存储资源的技术问题。
-
-
-
-
-
-
-
-
-