Patent search ap:("中国科学院声学研究所" OR "国家计算机网络与信息安全管理中心") AND inv:"周军" Page 2

11.

发明授权
一种实时图像语义分割装置及分割方法有权转让

公开(公告)号：CN111626298B

公开(公告)日：2023-08-18

申请号：CN202010306188.8

申请日：2020-04-17

Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司

Inventor： 周军 , 白兴 , 张鹏远 , 颜永红

IPC: G06V10/26 , G06V10/82 , G06N3/0464

Abstract: 本发明提供一种实时图像语义分割装置及分割方法。在一个实施例中，将原始图像输入编码器，提取出至少两个大小不同的编码图像；将所述至少两个大小不同的编码图像输入第一解码器，提取出主特征图；将所述至少两个大小不同的编码图像输入第二解码器，提取出边缘特征图；根据所述主特征图和边缘特征图计算所述原始图像的最终损失；并根据最终损失训练所述主解码器和所述边缘解码器；将待预测图像通过编码器处理以后输入到主解码器中，得到主特征图。使用了两个结构相同的解码器，一个用于训练整体，一个用于训练边缘，在训练时使用其中的一个解码器检测目标边缘处的特征，使得能够更好的对目标边缘处的像素进行分割。

12.

发明公开
一种语音检测模型训练和语音检测方法审中-实审

公开(公告)号：CN116597818A

公开(公告)日：2023-08-15

申请号：CN202310440282.6

申请日：2023-04-21

Applicant: 中国科学院声学研究所

Inventor： 王文超 , 张宇翔 , 周军 , 张鹏远 , 陈树丽

IPC: G10L15/06 , G10L17/04 , G10L15/16 , G10L25/30

Abstract: 本申请提供一种语音检测模型的训练方法，包括：采集训练语音检测模型使用的语音，分别提取语音中每一条语音的声纹特征并进行差分得到第一特征信号。将第一特征信号作为神经网络的输入，使用损失函数迭代训练神经网络的参数，直至满足结束条件，得到目标语音检测模型。神经网络用于学习第一特征信号中携带的时序信息。由此，通过建立可以深度学习语音所携带时序信息的目标语音检测模型，可以提高对语音信号的真伪进行检测的准确性和鲁棒性。

Patent Agency Ranking