-
公开(公告)号:CN118885635A
公开(公告)日:2024-11-01
申请号:CN202410907960.X
申请日:2024-07-08
Applicant: 中央广播电视总台
IPC: G06F16/783 , G06F16/75 , G06N3/09 , G06F18/214 , G06F18/241 , G06F18/22
Abstract: 本申请实施例提供了一种基于预训练模型微调的相似视频检索方法,包括S10,构建微调样本,使微调样本同时满足分类监督学习目标及对比学习非监督目标的训练;S20,使用微调样本对SBERT模型进行分类监督学习目标和对比学习非监督目标的训练,得到相似度模型;S30,获取媒资库中视频所对应的文本信息特征,通过文本信息特征构建用于表达视频信息的视频文本特征;S40,通过训练得到的相似度模型进行预测,输出视频对应的高阶特征向量;S50,将需要寻找相似视频的视频作为种子视频,对种子视频对应的高阶特征向量与其他视频的高阶特征向量进行余弦相似度计算,得到相似视频;具有检索效率和准确度高的有益效果,适用于大数据处理的技术领域。
-
公开(公告)号:CN118747224A
公开(公告)日:2024-10-08
申请号:CN202410820490.3
申请日:2024-06-24
Applicant: 中央广播电视总台
IPC: G06F16/435 , G06F16/45 , G06F16/483 , G06N3/045 , G06N3/0499 , G06N3/0985 , H04N21/466
Abstract: 本申请提供一种基于多塔模型的推荐方法及系统,包括:采集用户在不同媒体类型上的历史互动数据;对收集到的用户行为数据进行处理,提取出不同媒体类型的用户特征和不同媒体类型的内容特征;构建多塔模型,包括用户塔和内容塔,所述用户塔和内容塔分别学习不同媒体类型的用户特征和内容特征,得到训练好的用户向量和内容向量;将待预测用户的历史互动数据输入训练好的多塔模型,计算用户向量和内容向量的相似度分数,所述相似度分数为用户推荐候选内容;通过多塔模型实现了用户兴趣和不同媒体类型内容的精准刻画,以及用户与内容的交互行为的准确捕捉,同时,采用选择性融合策略,提高了推荐结果的准确性和个性化程度。
-
公开(公告)号:CN118747224B
公开(公告)日:2025-03-07
申请号:CN202410820490.3
申请日:2024-06-24
Applicant: 中央广播电视总台
IPC: G06F16/435 , G06F16/45 , G06F16/483 , G06N3/045 , G06N3/0499 , G06N3/0985 , H04N21/466
Abstract: 本申请提供一种基于多塔模型的推荐方法及系统,包括:采集用户在不同媒体类型上的历史互动数据;对收集到的用户行为数据进行处理,提取出不同媒体类型的用户特征和不同媒体类型的内容特征;构建多塔模型,包括用户塔和内容塔,所述用户塔和内容塔分别学习不同媒体类型的用户特征和内容特征,得到训练好的用户向量和内容向量;将待预测用户的历史互动数据输入训练好的多塔模型,计算用户向量和内容向量的相似度分数,所述相似度分数为用户推荐候选内容;通过多塔模型实现了用户兴趣和不同媒体类型内容的精准刻画,以及用户与内容的交互行为的准确捕捉,同时,采用选择性融合策略,提高了推荐结果的准确性和个性化程度。
-
-