降噪方法及装置、电子设备、存储介质

    公开(公告)号:CN111933171A

    公开(公告)日:2020-11-13

    申请号:CN202010994517.2

    申请日:2020-09-21

    Inventor: 邓峰 姜涛 李岩

    Abstract: 本公开关于音频降噪方法及装置、电子设备、存储介质,其中方法包括:对当前音频信号执行加窗分帧操作获得多个音频帧;分别对多个音频帧执行傅里叶变换操作,获得多个音频帧的原始幅度信息和原始相位信息;输入多个音频帧的原始幅度信息至预先训练好的降噪模型,获得所述降噪模型输出的降噪系数;利用降噪系数分别对多个音频帧的原始幅度信息执行降噪操作,获得多个音频帧的降噪幅度信息;分别组合多个音频帧的降噪幅度信息和原始相位信息,并执行逆傅里叶变换操作,获得多个降噪音频帧;将多个降噪音频帧进行加窗和叠接相加操作,获得并输出降噪音频信号。本公开可以使用降噪系数对原始幅度信息执行降噪操作,从而达到抑制环境噪声的目的。

    文字检测方法、装置、电子设备和存储介质

    公开(公告)号:CN111783771A

    公开(公告)日:2020-10-16

    申请号:CN202010535376.8

    申请日:2020-06-12

    Inventor: 张水发 李岩

    Abstract: 本公开关于文字检测方法、装置、电子设备和存储介质,所述方法包括:获取视频第t+1帧图像中第一位置的像素的像素值Pt+1,计算像素值Pt+1与预设模型中每个像素值的差值,以得到n个差值的绝对值,其中,预设模型为第t帧图像中第一位置的像素的n个邻像素的像素值的集合;若大于预设值的绝对值的数量大于预设数量,确定第t+1帧图像中第一位置的像素属于前景,连通属于前景的像素,构成连通区域;对连通区域进行检测,以确定第t+1帧图像中的文字。根据本公开的实施例,可以准确地确定图像中的前景区域,再对前景区域进行检测来确定图像中的文字,从而在播放每一帧图像时,只需对前景进行检测,而不必对整张图像进行检测,以便快速地检测出图像中的文字。

    图像编辑方法、装置、电子设备和存储介质

    公开(公告)号:CN111429551A

    公开(公告)日:2020-07-17

    申请号:CN202010202820.4

    申请日:2020-03-20

    Inventor: 张水发 李岩

    Abstract: 本公开关于一种图像编辑方法、装置、电子设备和存储介质,所述方法包括:对待编辑图像进行语义分析;根据接收的编辑指令确定目标像素集合,所述目标像素集合包含所述对象像素集合中的至少一部分像素;按照所述编辑指令对所述目标像素集合进行编辑处理,以生成所述待编辑图像对应的目标图像。根据本公开的实施例,可以简化编辑操作、提高对图像的编辑效率。

    图像处理方法及装置、电子设备及存储介质

    公开(公告)号:CN111385481A

    公开(公告)日:2020-07-07

    申请号:CN202010239518.6

    申请日:2020-03-30

    Inventor: 张水发 李岩

    Abstract: 本公开提供了一种图像处理方法及装置、电子设备及存储介质,涉及网络技术领域,以解决相关技术中电子设备进行图像背景虚化需要较高硬件配置的问题。该方法包括:将目标图像转换为第一图像和第二图像,第一图像的对目标对象成像的视角不同于第二图像的对目标对象成像的视角,该目标对象为目标图像的成像对象;并根据第一图像和第二图像,获取目标图像对应的深度信息;且根据深度信息,对目标图像的背景区域进行虚化处理。该方法可以应用于对图像背景虚化处理的场景中。

    人脸表情的识别方法及装置

    公开(公告)号:CN111144266A

    公开(公告)日:2020-05-12

    申请号:CN201911329050.3

    申请日:2019-12-20

    Inventor: 李岩 李宣平

    Abstract: 本公开关于一种人脸表情的识别方法及装置。其中,该方法包括:通过对输入的图片进行人脸检测,得到人脸图片;基于预设的表情分类标准,确定所述人脸图片中各表情的类别;针对不同类别的表情,采用不同的方式得到所述人脸图片中的人脸的各类别表情的表情系数;基于得到所述人脸的各个所述表情系数的取值,识别出所述人脸的表情。可以提高表情识别的准确性。

    竖排文字识别方法、装置、设备及介质

    公开(公告)号:CN110991445A

    公开(公告)日:2020-04-10

    申请号:CN201911147784.X

    申请日:2019-11-21

    Inventor: 张水发 李岩

    Abstract: 本公开关于一种竖排文字识别方法、装置、设备及介质,属于多媒体技术领域。本公开对待识别的竖排文字的竖向图像进行旋转,得到该竖排文字对应的横向图像,并基于该横向图像的图像特征,获取该竖排文字对应的横排文字的图像特征,对该横排文字的图像特征进行识别,相比于直接对竖排文字的竖向图像进行识别,得到了将该竖排文字调整成了横排文字的图像特征,易于识别,识别出文字的概率大大提高,同时也提高了识别的准确率。

    图像样本分类方法及装置、电子设备、可读存储介质

    公开(公告)号:CN110929771A

    公开(公告)日:2020-03-27

    申请号:CN201911119302.X

    申请日:2019-11-15

    Abstract: 本公开关于一种图像样本分类方法及装置、电子设备、可读存储介质。该方法包括:获取本次聚类的待分类的图像样本对应的聚类簇,得到初始分类集合;以及获取本次聚类之前的历史聚类的对照分类集合;基于所述对照分类集合调整所述初始分类集合中的各聚类簇,得到所述待分类的图像样本对应的目标分类集合;根据所述目标分类集合和所述各图像样本所在聚类簇,确定所述待分类的图像样本中各图像样本的分类标识。本实施例中利用历史聚类的对照分类集合对初始分类集合进行调整,可以使目标分类集合与对照分类集合中各聚类簇形成映射关系,从而使相同图像样本在本次聚类和历史聚类中具有相同的分类标识,避免出现分类漂移现象,有利于提升使用体验。

    视频摘要生成方法、装置、电子设备及存储介质

    公开(公告)号:CN110650379A

    公开(公告)日:2020-01-03

    申请号:CN201910917211.4

    申请日:2019-09-26

    Inventor: 张水发 李岩

    Abstract: 本公开是关于一种视频摘要生成方法、装置、电子设备及存储介质,属于互联网技术领域。方法包括:获取目标视频中的多帧图像,将该多帧图像输入至图像聚类模型中,基于图像聚类模型,将该多帧图像划分为多个类别,从每个类别中选取目标图像,将选取的多个目标图像进行拼接,得到目标视频的视频摘要。该方法基于图像聚类模型,可以快速对多帧图像进行聚类,无需对每帧图像中对象的运动轨迹进行分析,缩短了处理时间,提高了生成视频摘要的效率。并且,从每个类别中选取目标图像,该目标图像能够代表该类别中的多帧图像的内容,根据多个目标图像生成的视频摘要,能够准确概括目标视频的内容,提高了生成的视频摘要的准确率。

    视频封面生成方法、装置、计算机设备及存储介质

    公开(公告)号:CN110572711A

    公开(公告)日:2019-12-13

    申请号:CN201910923672.2

    申请日:2019-09-27

    Inventor: 张水发 李岩

    Abstract: 本公开是关于一种视频封面生成方法、装置、计算机设备及存储介质,属于互联网技术领域。方法包括:获取目标视频中的多帧图像及多帧图像的图像标识,获取目标用户标识的用户类别,将多帧图像、多帧图像的图像标识和用户类别输入至视频封面生成模型中,基于视频封面生成模型,获取与用户类别匹配的目标图像标识,根据目标图像标识对应的目标图像,生成与目标用户标识对应的视频封面。该方法根据用户类别,为用户生成对应的视频封面,则该视频封面为用户感兴趣的视频封面,不再局限于生成固定不变的视频封面,解决了视频封面单一的问题,提高了灵活性。

    生成虚拟表情的方法、装置、电子设备及存储介质

    公开(公告)号:CN110503700A

    公开(公告)日:2019-11-26

    申请号:CN201910790934.2

    申请日:2019-08-26

    Inventor: 李宣平 李岩

    Abstract: 本公开关于一种生成虚拟表情的方法、装置、电子设备及存储介质,可以获取人脸图像;从人脸图像中,获取基础人物的眼睛区域图像;从眼睛区域图像中,提取眼睛区域图像的原始特征数据;分别计算原始特征数据,与预先建立的特征数据库中的各个特征数据的相似度;获得特征数据库中与原始特征数据相似度最大的特征数据,作为目标特征数据;根据预设的特征数据库中的各个特征数据与各个虚拟眼睛的对应关系,生成目标特征数据对应的虚拟眼睛,作为虚拟表情。可见,应用本公开实施例,可以通过计算人脸图像的眼睛的原始特征数据,与特征数据库中的各个特征数据的相似度,确定出人脸图像基础人物的虚拟眼睛作为虚拟表情,简化了用户操作。

Patent Agency Ranking