基于声纹特征识别主播的方法及装置

    公开(公告)号:CN111128196B

    公开(公告)日:2022-08-09

    申请号:CN201911243498.3

    申请日:2019-12-06

    Abstract: 本发明实施例提供一种基于声纹特征识别主播的方法及装置,其中方法包括:从待识别主播的直播视频中截取若干帧音频信息,根据预先训练的神经网络模型,从所述若干帧音频信息中提取待识别主播的声纹特征;根据局部敏感哈希方法将所述声纹特征存储至预先生成的哈希桶中,将与所述声纹特征处于同一哈希桶内的至少一个特征作为待匹配的样本主播的声纹特征;计算所述样本主播的声纹特征与所述待识别主播的声纹特征间的相似度,将相似度最高的样本主播作为所述待识别主播。本发明实施例适应直播条件下识别主播的要求。

    基于图像质量分类网络的甲状腺细针穿刺WSI数据扩充方法

    公开(公告)号:CN118037571A

    公开(公告)日:2024-05-14

    申请号:CN202410169312.9

    申请日:2024-02-06

    Inventor: 张菁 孙萌 姚嘉诚

    Abstract: 本发明公开了基于图像质量分类网络的甲状腺细针穿刺WSI数据扩充方法,首先,将超高分辨率的甲状腺WSI图像按照固定尺寸的滑动窗口和步长,剪裁为补丁图像,以便于模型可以读取和加载数据;然后将加载的数据,送入提前预训练好的轻量化图像质量分类模型中,根据补丁图像的颜色和对比度特征,将图像标注为质量好的和质量不好的,其中质量好指的是染色和对比度都正常的图像;最后,按照质量分类结果,为图像自适应的选择不同的数据扩充策略,在保证图像质量和关键细节的同时为WSI下游任务提供友好的数据基础。本发明充分考虑甲状腺细针穿刺WSI图像的特点,结合WSI图像中细胞团的染色质量和图像对比度进行智能调整,实现自适应数据扩充处理。

    基于人脸特征识别主播的方法及装置

    公开(公告)号:CN111178146A

    公开(公告)日:2020-05-19

    申请号:CN201911243502.6

    申请日:2019-12-06

    Abstract: 本发明实施例提供一种基于人脸特征识别主播的方法及装置,其中方法包括:从待识别主播的直播视频中截取帧图像,将所述帧图像输入至预先训练的神经网络模型,根据所述神经网络模型的输出获得所述待识别主播的人脸特征;根据局部敏感哈希方法将所述人脸特征存储至预先生成的哈希桶中,将与所述人脸特征处于同一哈希桶内的至少一个特征作为待匹配的样本主播的人脸特征;计算所述样本主播的人脸特征与所述待识别主播的人脸特征间的相似度,将相似度最高的样本主播作为所述待识别主播。本发明实施例适应直播条件下识别主播的要求。

    基于声纹特征识别主播的方法及装置

    公开(公告)号:CN111128196A

    公开(公告)日:2020-05-08

    申请号:CN201911243498.3

    申请日:2019-12-06

    Abstract: 本发明实施例提供一种基于声纹特征识别主播的方法及装置,其中方法包括:从待识别主播的直播视频中截取若干帧音频信息,根据预先训练的神经网络模型,从所述若干帧音频信息中提取待识别主播的声纹特征;根据局部敏感哈希方法将所述声纹特征存储至预先生成的哈希桶中,将与所述声纹特征处于同一哈希桶内的至少一个特征作为待匹配的样本主播的声纹特征;计算所述样本主播的声纹特征与所述待识别主播的声纹特征间的相似度,将相似度最高的样本主播作为所述待识别主播。本发明实施例适应直播条件下识别主播的要求。

    基于人脸特征和声纹特征识别主播的方法及装置

    公开(公告)号:CN111160110A

    公开(公告)日:2020-05-15

    申请号:CN201911244819.1

    申请日:2019-12-06

    Abstract: 本发明实施例提供一种基于人脸特征和声纹特征识别主播的方法及装置,其中方法包括:根据预先训练的神经网络模型,从直播视频中提取待识别主播的身份特征,根据局部敏感哈希方法将所述身份特征存储至预先生成的哈希桶中,将与所述身份特征处于同一哈希桶内的至少一个特征作为待匹配的样本主播的身份特征;计算所述样本主播的身份特征与所述待识别主播的身份特征间的相似度,将相似度最高的样本主播作为所述待识别主播。本发明实施例适应直播条件下识别主播的要求。

Patent Agency Ranking