-
公开(公告)号:CN119168074A
公开(公告)日:2024-12-20
申请号:CN202411042039.X
申请日:2024-07-31
Applicant: 清华大学 , 杭州阿里云飞天信息技术有限公司
IPC: G06N5/043 , G06N5/04 , G06N5/022 , G06F18/214
Abstract: 本发明提供一种基于偏好学习增强大语言模型的领域特定能力的方法及系统,包括:获取无标签数据,通过预设的领域专家模型对所述无标签数据进行推理,生成相应的输出分布;将所述输出分布输入至大语言模型,通过所述大语言模型基于输出分布生成偏好增强数据;对所述偏好增强数据进行汇总,整理为新的训练数据集,通过新的训练数据集对所述大语言模型进行微调;对微调后的大语言模型进行模型评估,基于评估结果对大语言模型进行二次调整,完成大语言模型的领域特定能力增强。本发明解决了现有大语言模型在特定领域生成文本不准确的问题。
-
公开(公告)号:CN119152520A
公开(公告)日:2024-12-17
申请号:CN202411153906.7
申请日:2024-08-21
Applicant: 清华大学 , 杭州阿里云飞天信息技术有限公司
Abstract: 本发明提供一种基于图文全局信息的图文模型训练方法及系统,包括:获取原始的文本信息、多图范式和图像信息;将所述图像信息输入至预设的图文模型中的多图范式编码器生成多个图像的关联特征;将所述多图范式和图像信息输入至预设的图文模型中的图文语义转换器获取转换后的图像特征;将所述文本信息、所述多个图像的关联特征和转换后的图像特征输入至预设的图文模型中的大语言模型,对所述大语言模型进行训练,完成多图与视频图文之间的关联识别,得到训练后的多模态图文模型。本发明解决了现有图文模态之间存在数据壁垒,难以深入协同理解处理的问题。
-
公开(公告)号:CN117710192A
公开(公告)日:2024-03-15
申请号:CN202311521904.4
申请日:2023-11-15
Applicant: 清华大学 , 梅赛德斯-奔驰集团股份公司
Abstract: 本发明提供一种图像风格迁移方法和装置,包括:获取预训练的图像风格迁移模型;利用图像风格迁移模型,将目标图像从第一风格迁移到第二风格。本发明预先训练能在保持图像语义完全不变的情况下,对仿真场景图像进行风格迁移使其与现实场景图像的风格一致的图像风格迁移模型,通过应用图像风格迁移模型,可以大规模生成现实图像及其对应的高精度语义分割图像,进而可构建高精度的图像语义分割网络。
-
公开(公告)号:CN116996786B
公开(公告)日:2024-01-16
申请号:CN202311222067.5
申请日:2023-09-21
Applicant: 清华大学
IPC: H04N25/131 , H04N23/86
Abstract: 本发明涉及图像处理技术领域,提供一种RGB‑IR图像色彩恢复及校正的方法及装置,包括:获取RGB‑IR图像,提取图像中RGB三通道和IR分量像素的数值;将关键区域和非关键区域逐个像素的RGB三通道数值与设定的阈值进行比较,根据逐个像素的统计分布,动态调节关键区域权重值,生成比较结果;根据所述比较结果判断是否需要进行抗饱和处理,生成判断结果;根据所述判断结果和关键区域权重进行RGB通道中IR分量的去除或保留,自适应抗饱和处理,生成色彩恢复校正联合矩阵,完成RGB‑IR图像色彩联合恢复及校正。本发明实现了图像关键区域权重动态调节,色彩恢复中自适应抗饱和处理以及生成色彩恢复校正联合矩阵的功能。(56)对比文件张军国;程浙安;胡春鹤;陈宸;鲍伟东.野生动物监测光照自适应Retinex图像增强算法《.农业工程学报》.2018,(第15期),第183-189页.曾兆滨;郑华;蔡坚勇;廖晓东.基于多项式回归的四带图像偏色校正算法《.计算机系统应用》.2018,(第04期),第209-214页.
-
公开(公告)号:CN117318690A
公开(公告)日:2023-12-29
申请号:CN202311185766.7
申请日:2023-09-14
Applicant: 清华大学
IPC: H03K17/94
Abstract: 本发明公开了一种红外自唤醒开关和具有其的传感器唤醒系统,所述红外自唤醒开关包括:衬底,所述衬底内形成有左容纳池、右容纳池、左流道和右流道,所述衬底的上表面具有左照射口和右照射口,所述左容纳池内和所述左流道的两端填充有左绝缘液体且所述左流道的中部填充有左导电液体,所述右容纳池内和所述右流道的两端填充有右绝缘液体且所述右流道的中部填充有右导电液体;超材料红外吸收装置;电极阵列,所述电极阵列包括左连接电极、右连接电极、多个左电极、多个右电极和多个互连电极;红外透射盖板。根据本发明实施例的红外自唤醒开关能够在接收到红外线时导通,具有触发准确、可靠性强、节约电能等优点。
-
公开(公告)号:CN116647760B
公开(公告)日:2023-10-13
申请号:CN202310899704.6
申请日:2023-07-21
Applicant: 清华大学
Abstract: 本发明涉及成像及图像处理技术领域,提供一种用于目标检测的宽动态实现方法、装置、相机及存储介质,其中的方法包括:接收图像传感器转发的待检测图像;计算待检测图像的全图亮度均值和分区亮度均值,并确定后续一帧或多帧待检测图像的曝光参数;根据后续一帧或多帧待检测图像的曝光参数,获取后续一帧或多帧待检测图像;在每次获取目标图像后执行目标检测步骤,得到目标检测结果。该方法根据图像的全图亮度均值和分区亮度均值,动态调整图像曝光参数,针对类似强光源下的高亮以及阴影、逆光等环境,可以采集到更多的亮度信息,得到图像中更多的细节信息,且该过程不需要做图像融合,也不需要缓存图像,实现了图像中目标的快速、准确检测。
-
公开(公告)号:CN116167434B
公开(公告)日:2023-07-04
申请号:CN202310445450.0
申请日:2023-04-24
Applicant: 清华大学
IPC: G06N3/0895 , G06N3/098 , G06N3/04 , G06V10/774 , G06V10/74 , G06F18/22 , G06F18/214
Abstract: 本发明提供一种弱监督视觉语言预训练模型的训练方法和装置,包括:选定若干个对齐的图文对,并将每一个图文对作为一个图文锚点对;基于图片数据集/文本数据集中每一个图片/文本与每一个图片锚点/文本锚点的相似度,确定图片数据集/文本数据集中每一个图片/文本的相对表征;根据图片数据集中每一个图片的相对表征和文本数据集中每一个文本的相对表征,构建伪平行图文数据集;利用伪平行图文数据集训练视觉语言预训练模型。本发明使用相对表征来作为图片和文本的统一表示,在相对表征的基础上构建高质量的伪平行数据,并利用伪平行数据训练的弱监督视觉语言预训练模型,以使模型具有更强跨模态理解能力。
-
公开(公告)号:CN112884825B
公开(公告)日:2022-11-04
申请号:CN202110295688.0
申请日:2021-03-19
Applicant: 清华大学 , 烟台清科嘉机器人联合研究院有限公司
Abstract: 本申请公开了一种基于深度学习模型的抓取方法及装置,用于夹持器抓取目标物体,包括:建立目标物体集合的属性集合数据、2D数据集和不规则物体点云数据集;根据所述2D数据集和所述不规则物体点云数据集,分别训练2D深度学习模型和点云深度学习模型;通过所述2D深度学习模型确定待抓取的目标物体;根据所述属性集合数据、所述点云深度学习模型,计算所述目标物体的抓取点位姿数据、夹持器的开合尺寸数据和夹持器夹持所述目标物体的压力阈值;根据所述属性集合数据、所述抓取点位姿数据、所述开合尺寸数据和所述压力阈值,抓取所述目标物体放置在指定位置。通过结合目标物体属性和深度学习模型实现夹持器的精准抓取,从而提升抓取成功率。
-
公开(公告)号:CN113761829A
公开(公告)日:2021-12-07
申请号:CN202110457927.8
申请日:2021-04-26
Applicant: 清华大学 , 腾讯科技(深圳)有限公司
Abstract: 本申请提供了一种自然语言处理方法、装置、设备及计算机可读存储介质;涉及人工智能技术领域,方法包括:根据预设词向量表得到双曲词向量序列;对当前双曲词向量进行注意力编码,得到当前双曲词向量对应的注意力编码特征;通过预设洛伦兹变换函数,对注意力编码特征进行线性变换,得到注意力编码特征对应的线性编码特征;预设洛伦兹变换函数通过训练满足预设约束条件的线性变换矩阵模型得到;预设约束条件用于约束线性变换矩阵模型对双曲空间内的输入特征向量处理后得到的输出特征向量位于双曲空间;基于线性编码特征,得到待处理语句对应的目标处理结果。通过本申请,能够提高利用双曲神经网络进行自然语言处理的稳定性和效率。
-
公开(公告)号:CN113510720A
公开(公告)日:2021-10-19
申请号:CN202110665852.2
申请日:2021-06-16
Applicant: 清华大学
Abstract: 本申请提出一种实时分布式协作机器人控制系统,该控制系统与机器人本体连接,包括Linux操作系统单元、实时内核单元、数据分发服务单元、机器人控制单元、EtherCAT现场总线单元。其中,Linux操作系统单元用于为建立机器人的操作运行环境构建Ubuntu环境;实时内核单元,用于执行控制系统的实时控制;数据分发服务单元,用于对数据进行分发和订阅;与数据分发服务单元连接的机器人控制单元,包括实时控制模块和非实时控制模块;实时控制模块和非实时控制模块计算得到控制指令,并将控制指令输送至EtherCAT现场总线单元;EtherCAT现场总线单元,用于将接收到控制信号,通过EtherCAT总线传输到机器人本体的驱动器进行相应的控制。本申请实现了机器人的分布式实时控制。
-
-
-
-
-
-
-
-
-