视频背景音乐生成系统
    1.
    发明公开

    公开(公告)号:CN120048231A

    公开(公告)日:2025-05-27

    申请号:CN202510119054.8

    申请日:2025-01-24

    Abstract: 一种视频背景音乐生成系统,属于跨模态音乐生成技术领域。本发明针对现有视频背景音乐的生成未与视频情感表达关联,造成音乐与视频内容匹配度低的问题。包括:视频描述生成模块,用于对输入视频进行视频内容特征提取,获得视频内容文本描述;视频情感分析模块,用于对输入视频进行情感特征提取,获得视频情感类别文本描述;文本融合模块,用于对所述视频内容文本描述、所述视频情感类别文本描述和用户输入的音乐类型文本描述进行融合,得到背景音乐文本描述;音乐生成器,用于根据背景音乐文本描述生成目标背景音乐。本发明应用在用户生产内容模式下的短视频生成背景音乐中。

    基于数据筛选优化的多视角协同跨模态3D感知模型训练方法

    公开(公告)号:CN119888410A

    公开(公告)日:2025-04-25

    申请号:CN202510069474.X

    申请日:2025-01-16

    Abstract: 一种基于数据筛选优化的多视角协同跨模态3D感知模型训练方法,属于计算机视觉中的跨模态学习领域。本发明针对现有跨模态学习方法中存在的数据质量差、域间差异大以及空间信息丢失等问题。包括:对原始点云数据进行筛选获得筛选后点云数据;获得每个筛选后点云数据的一组多视角渲染图;采用筛选后点云数据对点云编码器进行训练;采用多视角渲染图对多视角编码器训练;将编码后点云特征、编码后多视角特征和编码后文本特征对齐到共享表示空间;最小化对比损失,使相同物体的多模态特征在所述共享表示空间尽量接近,并使不同物体的多模态特征在所述共享表示空间保持分离,并进行网络参数的调整。本发明可应用于三维感知技术的优化和提升。

    基于卷积神经网络的图像真实噪声去除系统

    公开(公告)号:CN109285129A

    公开(公告)日:2019-01-29

    申请号:CN201811040207.6

    申请日:2018-09-06

    Abstract: 基于卷积神经网络的图像真实噪声去除系统,属于图像去噪领域,解决了现有基于卷积神经网络的图像去噪方法对于图像真实噪声的去除效果不理想的问题。本发明所述的基于卷积神经网络的图像真实噪声去除系统,先通过图像真实噪声水平估计子网络估计待去噪图像的真实噪声等级值,再通过图像噪声去除子网络,并根据待去噪图像的真实噪声等级估计值对待去噪图像的真实噪声进行去除。与现有基于卷积神经网络的图像去噪方法相比,本发明所述的基于卷积神经网络的图像真实噪声去除系统因引入了真实噪声等级估计环节而具有更好的图像真实噪声去除效果。

    舌下络脉诊断用多光谱舌下图像特征提取方法

    公开(公告)号:CN104537373B

    公开(公告)日:2017-08-25

    申请号:CN201510016915.6

    申请日:2015-01-13

    Abstract: 舌下络脉诊断用多光谱舌下图像特征提取方法,属于舌下图像技术领域。本发明是为了解决采用现有舌下图像信号质量差,并且包含有效信息有限,及其图像信号处理难于标准化的问题。它包括彩色舌下图像中舌腹面轮廓的提取:首先去除彩色舌下图像中阴影与牙齿区域的干扰;然后对获得的舌腹面所在区域进行粗分割;再对粗分割后的舌腹面候选区域进行二次分割;彩色舌下图像中赘生物的提取:首先对彩色舌下图像的反光区域进行过检测;然后对舌下赘生物图像效果图进行粗分割;再对舌下赘生物的粗分割图像进行非舌下赘生物区域的剔除,获得保留的赘生物区域;还包括近红外舌下图像中舌下静脉轮廓的提取。本发明用于对多光谱舌下图像进行特征提取。

    可见光与近红外光舌下图像采集系统

    公开(公告)号:CN104510447A

    公开(公告)日:2015-04-15

    申请号:CN201510016921.1

    申请日:2015-01-13

    CPC classification number: A61B5/004 A61B5/0059 A61B5/0075 A61B5/0082 A61B5/48

    Abstract: 可见光与近红外光舌下图像采集系统,属于舌下图像技术领域。本发明是为了解决采用现有设备获取的舌下图像信号质量差,并且包含有效信息有限,及其图像信号处理难于标准化的问题。它的左支撑板、右支撑板、上支撑板、下支撑板和后背板围成一长方体空腔,该长方体空腔内设置光源模块和摄像机模块,长方体空腔的开口端作为测试端,该测试端与后背板所在端面相对;左支撑板和右支撑板的内侧表面靠近下支撑板的位置对应设置一对相互平行的凹槽,内插板插接固定在凹槽内;显示器设置在上支撑板上,并靠近后背板一侧。本发明用于可见光与近红外光舌下图像的采集。

    构建个性化皮影头茬属性编辑生成器的方法

    公开(公告)号:CN116798092B

    公开(公告)日:2024-08-30

    申请号:CN202310591810.8

    申请日:2023-05-24

    Abstract: 构建个性化皮影头茬属性编辑生成器的方法,涉及计算机图像生成领域。解决了现有基于深度学习的人脸到皮影头茬的翻译方法,难以平衡生成图像保持原图中人脸可辨识特征的同时,兼顾拥有皮影头茬的结构要求的问题。本发明方法先构建皮影头茬样本集和人脸侧脸样本集,再对其样本集中样本进行预处理获得一组训练样本,通过一组训练样本对侧脸中间特征编码器EC、语义风格编码器ES和风格融合生成器G进行训练,且训练过程中通过计算总损失对上述三者进行参数更新,完成图像生成器的训练。本发明主要应用在由人脸图像到皮影头茬图像的翻译中。

    一种基于特征调制的图像去噪系统

    公开(公告)号:CN111738956B

    公开(公告)日:2021-06-01

    申请号:CN202010589835.0

    申请日:2020-06-24

    Abstract: 一种基于特征调制的图像去噪系统,涉及图像处理领域。解决了现有技术中将噪声水平图和噪声图像简单联结后对噪声图像进行去噪的方式,忽略了噪声水平图在后续层的影响,导致噪声图像去噪效果差的问题。本发明考虑用噪声水平图对原始噪声图像去噪进行多层引导,先对原始噪声图像和噪声水平图进行特征提取,获得提取完成的特征图,再对相应的特征图进行多尺度的多级调制,从而获得残差图像特征图,通过残差图像特征图用于实现对原始噪声图像的去噪,整个去噪过程挖掘了原始噪声图像和噪声水平图之间的复杂关系,并对噪声图像特征提取图不断的进行多尺度调制,使得去噪的效果更好。本发明主要用于对噪声图像进行去噪。

    基于深度摄像机的手持CAVE投影系统

    公开(公告)号:CN104657103B

    公开(公告)日:2017-06-16

    申请号:CN201510114786.4

    申请日:2015-03-16

    Abstract: 基于深度摄像机的手持CAVE投影系统,属于CAVE投影陈展技术领域。本发明是为了解决现有CAVE投影系统进行陈展演示,需要专业的设备和场地,成本高并且使用不便的问题。它的多个深度传感器用于测量获得用户所在空间墙壁的三维信息;同时,距离用户最近的一台深度传感器还用于测量手持投影仪与用户所在空间墙壁之间的距离、角度关系;计算机用于根据用户所在空间墙壁的三维信息获得欲投影画面;并实时根据相应的欲投影画面生成对应于所述照射范围的投影画面;手持投影仪用于将计算机生成的投影画面投射在用户所在空间墙壁上,随着用户在空间范围内的走动或者手臂动作的改变,实现探索式、沉浸式实景漫游。本发明用于实现陈展演示。

    基于深度感知的三维皮影戏制作方法

    公开(公告)号:CN104408775B

    公开(公告)日:2017-04-26

    申请号:CN201410798524.X

    申请日:2014-12-19

    Abstract: 基于深度感知的三维皮影戏制作方法,属于数字皮影戏制作技术领域。本发明是为了解决现有皮影戏传承方式不能真实反映皮影表演的虚实变换,并不能适应性的匹配皮影花纹的问题。它首先将待制作皮影人物整体图像作为三维模型制作模块的前视图,以作为皮影人物三维模型的参照;再制作皮影人物全部身体部件平面模型;对所述平面模型进行表面颜色的贴图;将待制作皮影人物全部身体部件平面模型按序缀接,形成皮影人物三维模型;将皮影人物三维模型与所有骨骼建立绑定;将皮影人物三维模型的所有骨骼与相应人体骨骼关节的三维坐标信息建立映射关系;再用人体骨骼运动序列控制皮影人物三维模型的骨骼运动。本发明用于三维皮影戏制作。

Patent Agency Ranking