一种基于预训练编码网络的机器翻译方法及装置

    公开(公告)号:CN115270823A

    公开(公告)日:2022-11-01

    申请号:CN202210714234.7

    申请日:2022-06-22

    Applicant: 清华大学

    Abstract: 本发明提供一种基于预训练编码网络的机器翻译方法及装置,其中的机器翻译方法包括:获取目标语言数据集以及双语平行数据集;基于机器翻译任务和降噪自编码任务,利用目标语言数据集和双语平行数据集对原始机器翻译模型进行训练,得到机器翻译模型;原始机器翻译模型包括预训练编码网络、适配网络和解码网络;将待翻译源语言数据输入至机器翻译模型,得到机器翻译结果。该方法并未使用伪平行数据,不会存在现有技术中噪声引入的问题,并且,在编码网络和解码网络的基础上引入了适配网络,通过充分有效地利用大规模单语数据,大大提升了机器翻译的翻译质量和效率。

    基于离散混淆自编码器的纵向联邦学习攻击防御方法

    公开(公告)号:CN115134114A

    公开(公告)日:2022-09-30

    申请号:CN202210567683.3

    申请日:2022-05-23

    Applicant: 清华大学

    Inventor: 刘洋 张亚勤

    Abstract: 本发明提供基于离散混淆自编码器的纵向联邦学习攻击防御方法,包括:在主动方利用自编码器对输入标签进行编码形成软标签,使软标签离散化,通过解码器将软标签解码为解码标签;利用输入标签、软标签和解码标签计算出第一损失函数,直至第一损失函数收敛;主动方与被动方进行纵向联邦学习,主动方包括第一微分模型,被动方包括第二微分模型,利用第一微分模型、第二微分模型和软标签计算出第二损失函数;第二损失函数通过反向传播方法将第一微分模型的更新梯度和第二微分模型的更新梯度进行离散化,将离散化后的更新梯度分别回传至第一微分模型和第二微分模型进行参数更新,输出结果模型,本发明解决了现有系统针对攻击防御能力不足的缺陷。

    基于隐私数据集的模型训练方法和装置

    公开(公告)号:CN114003949B

    公开(公告)日:2022-08-30

    申请号:CN202111189306.2

    申请日:2021-10-12

    Applicant: 清华大学

    Inventor: 刘洋 刘洋

    Abstract: 本发明涉及多方数据合作的技术领域,提供一种基于隐私数据集的模型训练方法和装置。其中,方法包括:基于公开数据集和与公开数据集对应的真实标签,对服务器端模型进行训练;获取各个客户端发送的第一模型输出;第一模型输出是将公开数据集输入本地学习模型得到的;本地学习模型为基于隐私数据集和对应标签训练得到的;基于各第一模型输出的对应的公开数据,对服务器端模型进行训练;将公开数据集输入服务器端模型,得到第二模型输出;将第二模型输出发送至各客户端,以供各客户端基于第二模型输出和公开数据集,进行本地学习模型的再训练。如此在避免隐私数据集泄露的前提下,基于知识蒸馏和知识融合以隐私数据集为部分训练样本进行模型训练。

    一种基于知识蒸馏的无监督机器翻译质量预估方法和装置

    公开(公告)号:CN114936567A

    公开(公告)日:2022-08-23

    申请号:CN202210588770.7

    申请日:2022-05-26

    Applicant: 清华大学

    Abstract: 本发明涉及一种基于知识蒸馏的无监督机器翻译质量预估方法和装置,包括:将大/小规模多语言机器翻译译文质量预估模型作为教师模型/学生模型,收集各预设语言对下的双语数据;其中,双语数据由相应语言对下的原文和机器翻译译文构成;利用教师模型,对每一个双语数据进行知识蒸馏,得到每一个双语数据中机器翻译译文的翻译质量;基于每一个双语数据以及每一个双语数据中机器翻译译文的翻译质量构建学生模型;借助学生模型实现对目标机器翻译译文的翻译质量预估。本发明利用教师模型对每一个双语数据进行蒸馏,以蒸馏后的数据训练学生模型,以使学生模型具备高性能且能在计算和存储资源受限的条件下部署。

    基于人脸图像的相对体重分析方法、装置及电子设备

    公开(公告)号:CN114708634A

    公开(公告)日:2022-07-05

    申请号:CN202210328076.1

    申请日:2022-03-30

    Applicant: 清华大学

    Abstract: 本发明提供一种基于人脸图像的相对体重分析方法、装置及电子设备,所述方法包括:获取若干个人脸图像;基于预先训练好的人脸检测模型对若干个所述人脸图像分别进行检测,以分别获得相应的各个人脸面部信息;基于各个所述人脸面部信息和预先训练好的相对体重计算模型,获得相对体重分析结果,该方法可以各个人脸图像对应的被监测人之间的相对体重分析结果,能够有效地实现了同一人在不同时期以及同一时期不同人之间的相对体重分析比较,且大大提升了相对体重分析结果的准确性。

    中医辅助诊疗方法、系统、设备和存储介质

    公开(公告)号:CN114420257A

    公开(公告)日:2022-04-29

    申请号:CN202111397128.2

    申请日:2021-11-23

    Applicant: 清华大学

    Abstract: 本发明提供一种中医辅助诊疗方法、系统、设备和存储介质,包括:对描述患者症状的症状信息文本进行关键词解析,得到症状词汇;若所述症状词汇存在,获取与所述症状词汇对应的症状相关联的药方;对所述药方中的药材和所述症状进行关联度分析,得到与所述症状关联的关联药材的关联度;根据所述关联药材的关联度获取所述药方的推荐度,以按照所述推荐度输出目标药方。本发明的技术方案可以提高中医辅助诊疗系统的智能化程度。

    基于隐私数据集的模型训练方法和装置

    公开(公告)号:CN114003949A

    公开(公告)日:2022-02-01

    申请号:CN202111189306.2

    申请日:2021-10-12

    Applicant: 清华大学

    Abstract: 本发明涉及多方数据合作的技术领域,提供一种基于隐私数据集的模型训练方法和装置。其中,方法包括:基于公开数据集和与公开数据集对应的真实标签,对服务器端模型进行训练;获取各个客户端发送的第一模型输出;第一模型输出是将公开数据集输入本地学习模型得到的;本地学习模型为基于隐私数据集和对应标签训练得到的;基于各第一模型输出的对应的公开数据,对服务器端模型进行训练;将公开数据集输入服务器端模型,得到第二模型输出;将第二模型输出发送至各客户端,以供各客户端基于第二模型输出和公开数据集,进行本地学习模型的再训练。如此在避免隐私数据集泄露的前提下,基于知识蒸馏和知识融合以隐私数据集为部分训练样本进行模型训练。

    一种纳米颗粒驱油剂及一种提高采收率的方法

    公开(公告)号:CN113881415A

    公开(公告)日:2022-01-04

    申请号:CN202111306068.9

    申请日:2021-11-05

    Applicant: 清华大学

    Abstract: 本申请提供了一种纳米颗粒驱油剂及一种提高采收率的方法,通过选择适合纳米颗粒发挥作用的储层环境,制备特定的驱油剂,驱替时采用注入‑泄压‑再注入的方式实现纳米颗粒注入‑促进原油释放‑驱替释放的原油,达到提高采收率的目的。并且通过驱油剂中的纳米颗粒吸附在液‑液表面以降低界面张力,吸附在粗糙固体表面形成二级粗糙度实现水膜的延伸和生长,利用驱替过程中的表面能差异将原油释放出来。

    一种防御方法、装置、电子设备及存储介质

    公开(公告)号:CN113726823A

    公开(公告)日:2021-11-30

    申请号:CN202111291143.9

    申请日:2021-11-03

    Applicant: 清华大学

    Abstract: 本发明提供一种防御方法、装置及电子设备,涉及攻击防御技术领域,在防御标签恢复攻击和梯度替换后门攻击的基础上,保证主任务的精度不受影响。所述防御方法包括:基于自编码器对输入标签进行自编码,形成软标签。基于解码器对软标签进行解码,形成解码标签。基于输入标签、软标签和解码标签计算第一损失函数。若第一损失函数不收敛,则基于第一损失函数对自编码器和解码器进行训训,获得训练后的自编码器和解码器,并转至上述步骤,进行迭代循环。所述防御装置应用于上述防御方法。所述防御方法应用于电子设备中。

    一种桌面油藏及其制备方法

    公开(公告)号:CN113268791A

    公开(公告)日:2021-08-17

    申请号:CN202110635992.5

    申请日:2021-06-08

    Applicant: 清华大学

    Abstract: 本申请涉及一种桌面油藏及其制备方法,所述桌面油藏,包括芯片层、模拟油藏层和底板层,所述芯片层和所述模拟油藏层设置为可拆分结构。对空间三个层级:芯片层、模型油藏层、底板层分别进行设计、制作以及完成层级间联接。本申请能够在保证可视化效果的前提下,控制多种驱替流体的混合状态、注入位置并实现与模型油藏的无缝连接,能够灵活调整模型油藏结构,同时各部分均可独立拆分并重复使用,为研究强化采油提供了一种经济易操作的解决方案。

Patent Agency Ranking