基于信号协方差矩阵重构的实时声源分离方法和装置

    公开(公告)号:CN117037836B

    公开(公告)日:2023-12-29

    申请号:CN202311278673.9

    申请日:2023-10-07

    Abstract: 基于信号协方差矩阵重构的实时声源分离方法与装置,其方法包括:检测到多个声源信号时,采用指数平滑方法计算混合信号的协方差矩阵;对混合信号的协方差矩阵作特征值分解,利用特征值计算不同频率分量的噪声功率;利用主要特征值向量构成的子空间和理论导向矢量,计算声源的导向矢量;利用混合信号协方差矩阵的特征值向量和特征值,计算混合信号协方差矩阵的逆矩阵;利用混合信号协方差矩阵的逆矩阵和声源的导向矢量,计算每个声源的功率,并按照协方差矩阵的定义重构每个声源的信号协方差矩阵;利用每个声源的信号协方差矩阵和信号的理论导向矢量,计算分离系数矩阵;基于混合声信号向量与分离系数矩阵得到分离后的声源信

    基于信号协方差矩阵重构的实时声源分离方法和装置

    公开(公告)号:CN117037836A

    公开(公告)日:2023-11-10

    申请号:CN202311278673.9

    申请日:2023-10-07

    Abstract: 基于信号协方差矩阵重构的实时声源分离方法与装置,其方法包括:检测到多个声源信号时,采用指数平滑方法计算混合信号的协方差矩阵;对混合信号的协方差矩阵作特征值分解,利用特征值计算不同频率分量的噪声功率;利用主要特征值向量构成的子空间和理论导向矢量,计算声源的导向矢量;利用混合信号协方差矩阵的特征值向量和特征值,计算混合信号协方差矩阵的逆矩阵;利用混合信号协方差矩阵的逆矩阵和声源的导向矢量,计算每个声源的功率,并按照协方差矩阵的定义重构每个声源的信号协方差矩阵;利用每个声源的信号协方差矩阵和信号的理论导向矢量,计算分离系数矩阵;基于混合声信号向量与分离系数矩阵得到分离后的声源信号。

    一种基于语音和图像的说话人数目估计方法和系统

    公开(公告)号:CN117011924A

    公开(公告)日:2023-11-07

    申请号:CN202311278365.6

    申请日:2023-10-07

    Abstract: 一种基于语音和图像的说话人数目估计方法和系统,其方法包括:获取图像数据和麦克风阵列数据;检测图像中人脸数量;根据人脸数量生成one‑hot向量;使用麦克风阵列数据计算频域谱;将频域信号输入到噪声估计神经网络中估计噪声嵌入空间中的噪声向量;将噪声向量和频域信号输入到神经网络中估计人声嵌入空间的人声向量;将人脸数量的one‑hot向量和人声向量融合成一个混合向量;将混合向量通过多层全连接层;将全连接层结果输出到说话人数嵌入空间估计说话人数向量;将说话人数向量输入到softmax分类器中,估计出说话人个数。本发明提升了噪声环境下说话人数目估计的准确性和抗干扰能力。

    一种音视频多模态的关键词唤醒方法及装置

    公开(公告)号:CN116631380B

    公开(公告)日:2023-11-07

    申请号:CN202310909532.6

    申请日:2023-07-24

    Abstract: 本发明公开了一种音视频多模态的关键词唤醒方法及装置,该方法包括:获取图像序列和音频序列;对所述图像序列进行嘴唇检测处理并提取检测到的嘴唇部分图像,将提取出的嘴唇图像序列利用嘴唇特征提取神经网络进行处理,得到图像特征;对所述音频序列做音频特征提取,将提取到的音频特征利用音频特征处理神经网络进行处理,得到音频高维特征;对所述图像特征和所述音频高维特征进行特征融合;将融合得到的音视频特征利用多模特征处理神经网络进行处理,得到多模高维特征;将所述图像特征、音频高维特征和多模高维特征融合成一个混合高维特征;基于所述混合高维特征,利用关键词唤醒分类器判断是否需要唤醒。

    基于奇异值分解计算协方差矩阵的波束成形方法和系统

    公开(公告)号:CN116846440A

    公开(公告)日:2023-10-03

    申请号:CN202310852044.6

    申请日:2023-07-11

    Abstract: 基于奇异值分解计算协方差矩阵的波束成形方法和系统,其方法包括:计算观测信号的协方差矩阵;对观测信号的协方差矩阵作奇异值分解,利用奇异值计算噪声功率;利用左奇异向量矩阵、右奇异向量矩阵和奇异值,计算观测信号协方差矩阵的逆矩阵;利用观测信号协方差矩阵的逆矩阵和干扰信号的理论导向矢量,按照协方差矩阵的定义计算干扰噪声协方差矩阵;利用计算的干扰噪声协方差矩阵,加上球面扩展噪声协方差矩阵和对角加载量,重新计算干扰噪声协方差矩阵;利用重新计算的干扰噪声协方差矩阵和目标信号的理论导向矢量,采用MVDR方法,计算波束成形的滤波系数矩阵;基于传感器阵列接收到的信号向量与滤波系数矩阵得到波束增强的目标信号。

    一种物体的抓取方法、装置、存储介质及电子设备

    公开(公告)号:CN116330306B

    公开(公告)日:2023-08-15

    申请号:CN202310631265.0

    申请日:2023-05-31

    Abstract: 本说明书公开了一种物体的抓取方法、装置、存储介质及电子设备,预先建立通用模型库,获取目标物体的深度图像及普通图像,以确定该目标物体的特征,根据该目标物体的特征,在预先建立的通用模型库中确定出与该目标物体匹配的通用模型,作为目标通用模型,根据该目标物体的特征及该目标通用模型,建立该目标物体的三维点云模型,以确定该目标物体的姿态,再根据该姿态及该三维点云模型,确定该目标物体的抓取点,根据该抓取点控制抓取设备抓取该目标物体。本方法通过目标物体的不同类型的图像,确定目标物体的特征,根据该特征及目标通用模型确定目标物体的姿态,以确定抓取点,根据该抓取点抓取目标物体,提高了抓取未知物体的准确性和稳定性。

    知识图谱实体链接方法、装置、计算机设备及存储介质

    公开(公告)号:CN116561339A

    公开(公告)日:2023-08-08

    申请号:CN202310522687.4

    申请日:2023-05-10

    Abstract: 本申请涉及一种知识图谱实体链接方法、装置、计算机设备及存储介质,该方法包括:基于问题样本、实体提及样本、知识图谱实体正样本和知识图谱实体邻接子图样本,获取训练数据正样本;基于问题样本、实体提及样本、知识图谱实体负样本和对应的知识图谱实体邻接子图样本,获取训练数据负样本;基于训练数据正样本、训练数据负样本对实体链接初始模型进行训练,得到实体链接模型;将用户问题、实体提及、候选知识图谱实体和对应的知识图谱实体邻接子图输入训练完成的实体链接模型,确定与实体提及链接的目标知识图谱实体,解决了相关技术中存在的问答场景中实体一致性模型效果不佳,实体链接准确性较低的问题。

    手术机器人和手术系统
    20.
    发明授权

    公开(公告)号:CN116058974B

    公开(公告)日:2023-07-14

    申请号:CN202310196969.X

    申请日:2023-02-23

    Abstract: 本公开是关于一种手术机器人和手术系统。手术机器人包括安装座和设置于安装座上的固定组件、导向组件和捻送组件。固定组件用于将输尿管软镜固定安装于安装座。导向组件位于捻送组件和固定组件之间,并与输尿管软镜的工作通道连通。捻送组件用于夹紧并驱动钬激光光纤,以使得钬激光光纤穿过导向组件后在输尿管软镜的工作通道内往复移动。本公开中的手术机器人能够在手术过程中,通过捻送组件实现钬激光光纤在输尿管软镜中的进给,而无需额外的手术助手,并且保证了手术的精密性,提高了手术效率。

Patent Agency Ranking