蛋白质突变效应的处理方法、装置及电子设备

    公开(公告)号:CN119446262A

    公开(公告)日:2025-02-14

    申请号:CN202411341776.X

    申请日:2024-09-25

    Abstract: 本发明涉及人工智能和生物技术的交叉技术领域,提供一种蛋白质突变效应的处理方法、装置及电子设备,该蛋白质突变效应的处理方法包括:获取突变前蛋白质的氨基酸序列与突变后蛋白质的氨基酸序列;通过预先训练的蛋白质语言模型,对突变前蛋白质的氨基酸序列与突变后蛋白质的氨基酸序列进行特征提取得到突变前蛋白质的特征与突变后蛋白质的特征;基于突变前蛋白质的特征与突变后蛋白质的特征确定蛋白质突变特征;将蛋白质突变特征输入预先训练的第一自然语言模型,生成蛋白质的突变对应的文本描述。该方法通过结合蛋白质语言模型和自然语言处理技术,提高了蛋白质突变效应的可解释性。

    一种基于预训练语言模型的实体关系抽取方法及装置

    公开(公告)号:CN114661913B

    公开(公告)日:2024-09-10

    申请号:CN202210161990.1

    申请日:2022-02-22

    Applicant: 清华大学

    Inventor: 聂再清

    Abstract: 本发明提供一种基于预训练语言模型的实体关系抽取方法及装置。该方法包括:基于种子知识从待抽取知识文本库获取相应的候选模板;对所述候选模板进行排序及筛选,确定Prompt模板;基于所述Prompt模板生成的提示文本、预训练语言模型以及Prompt Tuning方式对原始输入信息进行实体知识挖掘,获得相应的实体知识;将所述实体知识作为新的种子知识,利用所述新的种子知识进行挖掘以产生新的候选模板,并基于所述新的候选模板进行循环迭代处理,获得循环迭代处理过程中输出的知识挖掘结果。本发明提供的基于预训练语言模型的实体关系抽取方法,能够降低Prompt模板的标注成本,有效提高知识挖掘的效率。

    多目标跟踪标注方法及装置

    公开(公告)号:CN117576603A

    公开(公告)日:2024-02-20

    申请号:CN202311402879.8

    申请日:2023-10-26

    Abstract: 本发明实施例提供一种多目标跟踪标注方法及装置,该方法包括:获取第一多目标跟踪算法的第一多目标跟踪轨迹结果及获取第二多目标跟踪算法的第二多目标跟踪轨迹结果,进行时间和空间匹配得到轨迹匹配结果;根据轨迹匹配结果获取匹配组;匹配组中的每个轨迹与匹配组中的其他轨迹中的至少一个具有匹配轨迹点;根据匹配轨迹对对匹配组计算匹配组置信度;若匹配组置信度大于或等于预设置信阈值,则融合匹配组中的各条轨迹为一条轨迹;否则输出匹配组中的第一多目标跟踪轨迹结果或第二多目标跟踪轨迹结果以供进行标注修正。本发明实施例提供的多目标跟踪标注方法及装置,在满足标注质量前提下大大节约了多目标跟踪标注人力成本,并提高了标注效率。

    多视角三维目标融合标注方法、装置以及计算机设备

    公开(公告)号:CN117152559A

    公开(公告)日:2023-12-01

    申请号:CN202311143420.0

    申请日:2023-09-05

    Abstract: 本申请涉及一种多视角三维目标融合标注方法、装置、计算机设备、存储介质和计算机程序产品。其中方法包括:获取多个单端标注数据、以及多个单端标注数据中的基准标注数据;根据基准标注数据对应的基准时间戳,对多个单端标注数据对应的单端时间戳进行匹配筛选,得到待融合标注数据集合;根据基准时间戳,对待融合标注数据集合中的标注数据进行时间对齐,形成时间对齐标注数据;根据时间对齐标注数据的标注框信息,构建多视角标注框;根据多视角标注框,进行多视角三维目标融合标注。方案不仅能够提升融合后标注信息的准确性,而且提升了方案迁移应用于多场景标注任务时的可靠性。

    多模态生物医药数据的表征学习方法及装置

    公开(公告)号:CN116431830A

    公开(公告)日:2023-07-14

    申请号:CN202310394248.X

    申请日:2023-04-13

    Applicant: 清华大学

    Abstract: 本发明提供一种多模态生物医药数据的表征学习方法及装置,其中的方法包括:获取多模态输入数据,多模态输入数据包括生物分子结构数据及其对应的知识图谱数据和文本数据;将多模态输入数据输入至预先训练的多模态生物医药模型,得到融合特征表示;基于融合特征表示,对多种下游预测任务进行预测,其中,多模态生物医药模型包括生物分子结构编码器、图谱编码器、文本编码器以及多模态编码器,通过根据训练样本数据集进行自监督预训练优化得到。该方法利用多模态生物医药模型学习多模态输入数据的表征,使得到的融合特征表示能够应用于多种下游预测任务,实现了多模态生物医药数据的特征融合,同时提高了下游预测任务的预测精度。

    一种防御方法、装置、电子设备及存储介质

    公开(公告)号:CN113726823A

    公开(公告)日:2021-11-30

    申请号:CN202111291143.9

    申请日:2021-11-03

    Applicant: 清华大学

    Abstract: 本发明提供一种防御方法、装置及电子设备,涉及攻击防御技术领域,在防御标签恢复攻击和梯度替换后门攻击的基础上,保证主任务的精度不受影响。所述防御方法包括:基于自编码器对输入标签进行自编码,形成软标签。基于解码器对软标签进行解码,形成解码标签。基于输入标签、软标签和解码标签计算第一损失函数。若第一损失函数不收敛,则基于第一损失函数对自编码器和解码器进行训训,获得训练后的自编码器和解码器,并转至上述步骤,进行迭代循环。所述防御装置应用于上述防御方法。所述防御方法应用于电子设备中。

    基于后融合的车路协同三维目标检测方法及系统

    公开(公告)号:CN114627442B

    公开(公告)日:2024-06-28

    申请号:CN202210114613.2

    申请日:2022-01-30

    Abstract: 本发明提供一种基于后融合的车路协同三维目标检测方法及系统,其中方法包括:分别获取路端和车端检测的各车辆的位置信息;根据路端检测的各车辆在路端时间戳下的行驶速度以及路端检测的各车辆的位置信息,预测得到路端检测的各车辆在车端时间戳下的位置信息;将路端检测的各车辆在车端时间戳下的位置信息和车端检测的各车辆的位置信息转换到同一坐标系,对各车辆的位置信息融合,得到三维目标检测结果。用以解决现有技术中默认车路传感器时间同步,所造成的车路协同误差较大的缺陷,实现根据车辆在路端时间戳下的行驶速度预测车辆在车端时间戳下的位置信息,有效克服了车路传感器时间异步,以及通信时延所带来的偏差,提高了目标检测精度。

    多模态生物医药数据的处理方法和装置

    公开(公告)号:CN118098433A

    公开(公告)日:2024-05-28

    申请号:CN202410139067.7

    申请日:2024-01-31

    Abstract: 本发明提供多模态生物医药数据的处理方法和装置,包括:获取多模态输入数据,所述多模态输入数据包括相互对应的分子结构数据、知识图谱数据以及文本数据;采用预先构建的多维度分子编码模型对所述分子结构数据进行编码处理,得到结构特征表示;采用预先构建的知识图谱编码模型对所述知识图谱数据进行编码处理,得到知识特征表示;采用预先构建的文本编码模型对所述文本数据进行编码处理,得到文本特征表示;对所述结构特征表示、所述知识特征表示和所述文本特征表示进行融合处理,得到融合特征表示;基于所述融合特征表示,对多种下游任务进行处理。本发明使用MoE混合不同的分子编码器,选择最合适的编码器以适配不同下游任务,通用性好。

    车路协同多目标跟踪轨迹融合方法及装置

    公开(公告)号:CN117576529A

    公开(公告)日:2024-02-20

    申请号:CN202311413600.6

    申请日:2023-10-27

    Abstract: 本发明实施例提供一种车路协同多目标跟踪轨迹融合方法及装置,该方法包括:获取车路协同时空同步帧对;获取车端轨迹两两之间是否为同时空关系记录在车端轨迹关系表;获取路端轨迹两两之间是否为同时空关系记录在路端轨迹关系表;根据车路协同时空同步帧对目标框的匹配结果,获取车端轨迹和路端轨迹两两之间匹配上的目标框数量,记录在第一车路轨迹协同关系表;获取协同轨迹对中产生同时空轨迹匹配的误匹配协同轨迹对,将误匹配协同轨迹对对应的目标框数量置0,得到第二车路轨迹协同关系表,对存在目标框匹配的车端轨迹和路端轨迹进行融合,得到车路协同多目标跟踪轨迹融合结果。本发明实施例提高了轨迹匹配的鲁棒性,得到高质量的车路协同轨迹。

Patent Agency Ranking