一种音乐生成方法、装置、系统以及存储介质

    公开(公告)号:CN115910000A

    公开(公告)日:2023-04-04

    申请号:CN202211184026.7

    申请日:2022-09-27

    Abstract: 本发明提供一种音乐生成方法、装置、系统以及存储介质,属于语言处理领域,方法包括:S1:分别对各个音频文件进行预处理,得到多个处理后频谱图;S2:构建生成器和鉴别器,并导入多个随机噪声向量;S3:基于生成器,对各个随机噪声向量进行频谱图映射处理得到待鉴别频谱图;S4:基于鉴别器,分别对各个处理后频谱图以及各个待鉴别频谱图进行鉴别分析,得到第一权值以及第二权值。本发明保留了大量的特征信息,对数据特征做出了更好的泛化,能够在频域上自动生成音乐,从而得到了一种新的音乐自动生成方式。

    一种基于人脸外观的注视方向预测方法及系统

    公开(公告)号:CN115761858A

    公开(公告)日:2023-03-07

    申请号:CN202211509716.5

    申请日:2022-11-29

    Abstract: 本申请公开了一种基于人脸外观的注视方向预测方法及系统,方法包括:采集待预测对象的人脸图片,得到原始预测图像;基于所述原始预测图像,裁剪出左眼和右眼的图片,得到人眼预测图像;构建注视方向预测模型;所述人眼预测图像输入至所述注视方向预测模型中,得到人脸注视方向。通过设计自注意力静态模块去融合粗粒度人脸特征和细粒度人眼特征,提高了不同粒度特征的融合程度;通过设计差分动态模块去显式获得动态特征,增强了对原有数据集的动态特征的利用程度。

    一种基于可回溯目标识别的智能寻物方法及系统

    公开(公告)号:CN114973099A

    公开(公告)日:2022-08-30

    申请号:CN202210685950.7

    申请日:2022-06-16

    Abstract: 本发明提供了一种基于可回溯目标识别的智能寻物方法及系统,包括:对场景视频进行稀疏模型建模处理,获得稀疏模型的视频信号;对所述视频信号采用YOLO目标识别算法,并基于所述稀疏模型构造自适应目标字典,识别所述视频信号中的目标;提取所述视频信号的视频关键帧,对所述视频关键帧进行预处理,获取所述目标最后出现的位置。本发明通过基于稀疏模型的实时目标识别技术在实现目标识别的同时提高了信号处理性能以达到实时计算;通过自适应目标特征字典构造技术对多场景目标复杂的问题有良好表现。

Patent Agency Ranking