用于确定文本和视频之间的相似度的方法和装置

    公开(公告)号:CN117556276B

    公开(公告)日:2024-05-10

    申请号:CN202410044723.5

    申请日:2024-01-11

    Abstract: 本说明书的实施例提供了一种用于确定文本和视频之间的相似度的方法和装置。在该方法中,利用文本特征提取模型和视频特征提取模型分别得到文本和视频对应的初始文本特征和初始视频特征;根据文本的句法层级分析结果对初始文本特征进行处理,得到句法层级分析结果中的各个元素分别对应的文本特征;根据句法层级分析结果对应的文本特征与所得到的初始视频特征之间的匹配度,构建与句法层级分析结果对应的视频层级分析结果;进而对对应的初始视频特征进行处理得到视频层级分析结果中的各个元素分别对应的视频特征;根据对应层级中的各个元素分别对应的文本特征和视频特征之间的相似度,确定文本和所述视频之间的相似度。

    用于对会话模型进行训练的方法及装置

    公开(公告)号:CN118245579A

    公开(公告)日:2024-06-25

    申请号:CN202410231534.9

    申请日:2024-02-29

    Abstract: 本说明书实施例提供了用于对会话模型进行训练的方法及装置。在该方法中,获取历史会话数据;按照以下方式进行模型训练,直至满足训练结束条件:从历史会话数据中筛选出目标回答语句中的目标被选回答语句所属的会话序列,历史会话序列由目标回答语句以及在目标回答语句生成之前按照时间顺序生成的用于推导出目标回答语句的各个查询语句和回答语句构成,未来会话序列由在目标回答语句生成之后按照时间顺序生成的由目标被选回答语句推导出的各个查询语句和回答语句构成;将历史会话序列和会话序列分别输入给第一会话模型和第二会话模型,以针对目标回答语句进行预测;以及结合第一会话模型和第二会话模型的预测结果进行模型调整。

    一种分布感知的多阶段大模型微调方法及装置

    公开(公告)号:CN119358625A

    公开(公告)日:2025-01-24

    申请号:CN202411378997.4

    申请日:2024-09-29

    Abstract: 本说明书实施例提供了一种分布感知的多阶段大模型微调方法及装置。待微调的大模型包括预训练后的骨干网络和预测层。在微调方法中,使用数据集中的样本对大模型进行第一训练,得到第一大模型,这里的第一训练包括:更新大模型中预测层的参数,不更新大模型中骨干网络的参数。接着,使用数据集中的样本对大模型进行第二训练,得到第二大模型,这里的第二训练包括:更新大模型中骨干网络的参数和预测层中的参数。这样,即得到了两个训练后的大模型,接着可以在两个训练后的大模型中的对应参数构成的范围内进行参数取值,得到微调后的大模型。数据集中包含隐私数据,在数据处理过程中需要进行隐私保护。

    用于确定文本和视频之间的相似度的方法和装置

    公开(公告)号:CN116958868A

    公开(公告)日:2023-10-27

    申请号:CN202310906058.1

    申请日:2023-07-21

    Abstract: 本说明书的实施例提供了一种用于确定文本和视频之间的相似度的方法和装置。在该用于确定文本和视频之间的相似度的方法中,将所获取的文本视频对包括的文本和视频分别提供给文本特征提取模型和视频特征提取模型,得到对应的词符特征序列和图像特征序列;根据各个词符特征与各个图像特征之间的相似度确定相关词符特征‑图像特征对;针对各个相关词符特征‑图像特征对,对该词符特征与该图像特征之间的相似度和所确定的该图像特征对应的相近图像特征与词符特征序列之间的相似度进行聚合,生成相近图像约束相似度;以及基于所得到的相近图像约束相似度,确定文本视频对中的文本和视频之间的相似度。

    用于确定文本和视频之间的相似度的方法和装置

    公开(公告)号:CN117556276A

    公开(公告)日:2024-02-13

    申请号:CN202410044723.5

    申请日:2024-01-11

    Abstract: 本说明书的实施例提供了一种用于确定文本和视频之间的相似度的方法和装置。在该方法中,利用文本特征提取模型和视频特征提取模型分别得到文本和视频对应的初始文本特征和初始视频特征;根据文本的句法层级分析结果对初始文本特征进行处理,得到句法层级分析结果中的各个元素分别对应的文本特征;根据句法层级分析结果对应的文本特征与所得到的初始视频特征之间的匹配度,构建与句法层级分析结果对应的视频层级分析结果;进而对对应的初始视频特征进行处理得到视频层级分析结果中的各个元素分别对应的视频特征;根据对应层级中的各个元素分别对应的文本特征和视频特征之间的相似度,确定文本和所述视频之间的相似度。

Patent Agency Ranking