数据处理方法、装置、介质和计算设备

    公开(公告)号:CN109492127A

    公开(公告)日:2019-03-19

    申请号:CN201811342316.3

    申请日:2018-11-12

    Abstract: 本发明实施方式提供了一种数据处理方法,包括:获取视频数据;对所述视频数据中的帧数据进行处理,得到所述帧数据对应的特征值,其中,所述特征值能够表征对应的帧数据;获取倒排索引,所述倒排索引中包括多个索引特征值,每个索引特征值对应至少一个具有该索引特征值的其他视频数据;基于所述倒排索引,确定第一索引特征值对应的相似视频数据,其中,所述第一索引特征值为与所述特征值中的特定特征值相同的索引特征值。本发明的方法可以通过倒排索引在其他视频中确定与当前视频具有相同视频帧的相似视频,从而显著地降低了相似视频查找的计算量,实现了快速查找相似视频的效果。此外,本发明实施方式还提供了一种数据处理装置、计算设备和介质。

    点击率预估方法、介质、系统和计算设备

    公开(公告)号:CN109582862B

    公开(公告)日:2021-02-02

    申请号:CN201811292015.4

    申请日:2018-10-31

    Abstract: 本发明的实施方式提供了一种点击率预估方法。该方法包括:获取用户的多个历史点击信息各自对应的第一基础特征信息;确定多个历史点击信息的第一隐含特征信息;组合多个历史点击信息各自对应的第一基础特征信息和第一隐含特征信息,得到第一组合特征信息;以及基于第一组合特征信息训练点击率预估模型,以预估用户对待推荐的信息的点击率。通过增加隐含特征信息,本发明的方法使得训练得到点击率预估模型能够更准确地预估用户对待推荐的信息的点击情况,从而能够显著地提高向用户推荐信息的精准度,为用户带来了更好的体验,并且能够减少用户流量的消耗。此外,本发明的实施方式提供了一种点击率预估系统、一种介质和一种计算设备。

    模型训练方法、视频处理方法、装置、介质和计算设备

    公开(公告)号:CN110516749A

    公开(公告)日:2019-11-29

    申请号:CN201910811249.3

    申请日:2019-08-29

    Abstract: 本发明的实施方式提供了一种模型训练方法,包括:获取多个视频片段;分别为所述多个视频片段添加标签,其中,所述标签用于表征所述视频片段所包含的有效信息量;建立包含时间维度的神经网络模型;以及,利用带有标签的所述多个视频片段对所述神经网络模型进行训练,得到优化模型,所述优化模型用于从视频文件中提取包含最大有效信息量的目标视频片段。本发明的实施方式还提供了一种视频处理方法、模型训练装置、视频处理装置、介质和计算设备。

    封面图像选取方法、介质、装置和计算设备

    公开(公告)号:CN109815352A

    公开(公告)日:2019-05-28

    申请号:CN201910043735.5

    申请日:2019-01-17

    Abstract: 本发明的实施方式提供了一种封面图像选取方法、介质、装置和计算设备。其中方法包括:对待选取图像集合进行过滤,将过滤后的所述待选取图像集合作为候选图像集合;所述待选取图像集合包括至少两个图像;确定所述候选图像集合中的各个图像的优先级;选取所述优先级高的至少一个图像作为封面图像。通过将不合适作为封面图像的图像过滤掉,之后再在剩余的图像中选取优先级高的图像作为封面图像,本发明的方法能够应对图像类型的多样性,从而选取出合适的封面图像。

    预测方法、系统、介质和电子设备

    公开(公告)号:CN109670141A

    公开(公告)日:2019-04-23

    申请号:CN201811463866.0

    申请日:2018-11-30

    Abstract: 本发明的实施方式提供了一种预测方法,包括获得由多个用户向量构造的用户矩阵以及由多个对象向量构造的对象矩阵,其中,所述用户向量包括该用户在多个因子上的得分,所述对象向量包括该对象在所述多个因子上的得分,确定所述用户矩阵和所述对象矩阵的乘积矩阵,以及基于所述乘积矩阵中的元素,确定与各个用户对应的对象集合作为预测结果。该方法通过构造用户矩阵以及对象矩阵以及求矩阵乘积的方式,无需构造大量样本,解决了现有技术中基于矩阵分解的召回方法计算量过大导致耗时严重的问题。此外,本发明的实施方式提供了一种预测系统、一种计算机可读存储介质以及一种电子设备。

Patent Agency Ranking