视频封面确定模型的生成方法及装置、视频封面确定方法及装置

    公开(公告)号:CN111274444B

    公开(公告)日:2024-07-30

    申请号:CN202010112972.5

    申请日:2020-02-24

    Inventor: 刘畅 李岩

    Abstract: 本公开关于一种视频封面确定模型的生成方法及装置、视频封面确定方法及装置。包括:获取第一目标视频集;根据第一目标视频,获取正样本和负样本;根据正样本和负样本,对预设的初始视频封面确定模型进行训练,得到第一目标图像为封面的预测分数和用于衡量正样本与负样本参与训练权重的评价分数;将满足第二预设条件的预测分数且满足第三预设条件的评价分数,对应的初始视频封面确定模型,确定为视频封面确定模型。整个过程中,无需人工介入,更不涉及相关人员的专业程度,节省大量人力物力,并且得到的视频封面确定模型可以适用于不同的视频内容,具有较强的泛化能力。

    音频事件的检测方法、装置、电子设备及存储介质

    公开(公告)号:CN111899760B

    公开(公告)日:2024-05-07

    申请号:CN202010693055.0

    申请日:2020-07-17

    Inventor: 王俊 王晓瑞 李岩

    Abstract: 本公开关于一种音频事件的检测方法、装置、电子设备及存储介质,所述方法包括:获取待识别的音频数据对应的音频特征;根据音频特征的频域信息,对音频特征进行划分,生成多个子频带特征;对多个子频带特征分别进行特征提取,得到多个子频带目标特征;根据多个子频带目标特征,得到音频数据中每个音频事件的类别检测结果和时间检测结果。该方法通过采用深度学习网络学习具有频带级别差异的多个子频带特征,将频带级别的差异应用到基于深度学习的音频事件分类模型中,可以提升音频事件分类模型的分类性能,使得音频事件分类模型能够识别得到待识别的音频数据中所包含的多种音频事件,从而使音频事件检测更加全面且具有较高的准确度。

    媒介信息质量预测方法、装置、电子设备及存储介质

    公开(公告)号:CN113837809B

    公开(公告)日:2024-05-03

    申请号:CN202111152739.0

    申请日:2021-09-29

    Abstract: 本公开关于一种媒介信息质量预测方法、装置、电子设备及存储介质,包括:获取待预测媒介信息的历史数据信息,所述历史数据信息包括所述待预测媒介信息在预置时间范围内的第一投放数据、与所述待预测媒介信息对应同一媒介信息发布者的至少一个关联媒介信息,和/或各所述关联媒介信息在所述预置时间范围内的第二投放数据;根据所述待预测媒介信息及所述待预测媒介信息的历史数据信息进行质量预测,得到所述待预测媒介信息的预测投放数据;其中,所述投放数据包括用于表征媒介信息投放质量的数据。本公开实施例可以提高媒介信息的投放质量的预测精度。

    图像生成方法、装置、电子设备及存储介质

    公开(公告)号:CN117953091A

    公开(公告)日:2024-04-30

    申请号:CN202410033791.1

    申请日:2024-01-09

    Abstract: 本公开关于一种图像生成方法、装置、电子设备及存储介质,所述方法包括:获取对象的原始图像和针对原始图像的描述信息;将原始图像和原始图像的描述信息,输入至训练好的与对象对应的图像生成模型中,得到对象的新的图像;其中,图像生成模型包括基座网络和调整网络,调整网络用于调整基座网络的输出内容;图像生成模型通过对象的样本图像和针对样本图像的描述信息,对调整网络进行训练得到。该方法的图像生成模型在通用的基座网络的基础上增加了一个调整网络,通过调整网络调整基座网络的输出内容,可以只需要训练调整网络来学习不同对象的IP信息,无需对基座网络的全量参数进行调整,从而可以减少模型训练时消耗的计算资源。

    对话意图识别、用于识别对话意图的模型的训练方法

    公开(公告)号:CN113590798B

    公开(公告)日:2024-03-26

    申请号:CN202110909637.2

    申请日:2021-08-09

    Abstract: 本公开关于一种对话意图识别、用于识别对话意图的模型的训练方法,所述方法包括:获取与用户账户之间的历史对话语句,并提取各历史对话语句对应的话语特征;分别将各话语特征作为节点,并对各节点进行两两连接,得到话语节点全连接图;将话语节点全连接图输入至预训练的图神经网络模型,得到话语节点关系图;话语节点关系图为预训练的图神经网络模型对话语节点全连接图中的各节点对应的上下文信息和各节点间的连接关系进行调整后得到的;话语节点关系图中相连接的两个节点所对应的历史对话语句具有上下文关联关系;根据话语节点关系图,确定用户账户在本次对话中的目标对话意图。采用本公开可以准确地识别出用户账户在人机对话中的对话意图。

    一种资源处理方法、装置、电子设备及存储介质

    公开(公告)号:CN114501132B

    公开(公告)日:2024-03-12

    申请号:CN202111599274.3

    申请日:2021-12-24

    Inventor: 李岩

    Abstract: 本公开关于一种资源处理方法、装置、电子设备及存储介质,包括:对初始视频进行分段,得到多个初始视频片段以及每个初始视频片段的融合特征信息,初始视频的时长大于第一预设时长,基于每个初始视频片段的融合特征信息将多个初始视频片段进行分类,得到对象的描述片段和对象的非描述片段,对非描述片段进行裁剪,得到裁剪后的非描述片段,对对象的描述片段和裁剪后的非描述片段进行整合处理,得到目标视频,目标视频的时长小于等于第一预设时长。在尽可能保证视频质量和内容帧数的情况下,满足第一预设时长,进而减少为推广该信息资讯投入的服务资源的浪费。

    一种视频封面图像生成方法、装置、电子设备及存储介质

    公开(公告)号:CN111581435B

    公开(公告)日:2023-12-01

    申请号:CN202010449182.6

    申请日:2020-05-25

    Inventor: 刘畅 李岩

    Abstract: 本公开关于一种视频封面图像生成方法、装置、电子设备及存储介质,用以解决现有技术中以视频首帧作为视频封面的方法导致短视频点击率较低的问题,本公开实施例响应于视频搜索指令,确定目标视频;从目标视频中确定至少两帧备选图像,并根据备选图像的像素特征以及视频搜索指令对应的搜索关键词,确定备选图像对应的筛选参数;根据备选图像对应的筛选参数,从至少两帧备选图像中筛选出目标图像,并根据目标图像生成目标视频的封面。与将视频的首帧作为视频的封面相比,通过本公开实施例提供的视频封面图像生成方法确定的视频封面具有精彩程度较高并且与搜索关键词的匹配程度较高的特征,能吸引更多的用户点击视频进行观看,从而提高视频的点击率。

    一种视频查重方法、装置及电子设备

    公开(公告)号:CN112399236B

    公开(公告)日:2022-08-26

    申请号:CN202011073834.7

    申请日:2020-10-09

    Abstract: 本公开公开了一种视频查重方法、装置及电子设备,用于解决相关技术中视频查重准确性较差的技术问题。该方法包括:接收待查重的视频流;并对所述待查重的视频流进行拆帧处理,获得视频帧序列;对所述视频帧序列中各个视频帧进行视频剪裁处理,筛选所述各个视频帧中与预设形状相同的区域,以确定所述待查重的视频流中的画中画区域,所述画中画区域用于表征所述待查重的视频流中各个视频帧中完整展示视频内容的小面积区域;对所述画中画区域进行特征提取处理,获得目标查重信息,并对所述目标查重信息进行查重处理。

    一种旋律生成方法及装置
    60.
    发明公开

    公开(公告)号:CN114582305A

    公开(公告)日:2022-06-03

    申请号:CN202011380378.0

    申请日:2020-11-30

    Abstract: 本公开公开了一种旋律生成方法及装置。该方法中获取歌词文本中的至少一个分句;对各分句进行情感分析,得到相应分句的情感信息;将各分句与相应分句的情感信息进行拼接后,输入已训练的基于自注意力机制的模型,得到各分句对应的旋律向量;其中,基于自注意力机制的模型用于依照上一输入数据获得的旋律向量,对当前输入数据进行处理,得到当前输入数据对应的旋律向量;基于各分句的旋律向量,生成歌词文本的旋律。该方法在存在歌词文本的条件下,通过对歌词文本进行文字情感分析,得到该歌词文本对应的情感信息使生成的旋律在情感上与歌词保持一致,提高了生成旋律的自然程度,以及生成旋律的质量。

Patent Agency Ranking