一种双麦克风语音增强方法和系统

    公开(公告)号:CN115831145B

    公开(公告)日:2023-06-27

    申请号:CN202310123145.X

    申请日:2023-02-16

    Abstract: 本发明公开一种双麦克风语音增强方法和系统,该方法包括:步骤一,对两个麦克风通道的信号进行分帧,加窗,快速傅里叶变换的操作,使得信号从时域转换到频域;步骤二,利用互相关函数对两个通道在频域的信号进行语音活跃检测,若检测为无语音段,则更新噪声互功率谱;若检测为有语音段,则对语音信号进行降噪处理;步骤三,使用降噪后的语音信号来估计晚期混响功率谱,并抑制混响,即使用晚期混响功率谱对降噪后的语音信号做去混响处理;步骤四,将降噪去混响后的信号从频域转换回时域后输出。本发明进行语音活跃检测、噪声互功率谱更新和噪声抑制,同时进行去混响处理,增加了混响抑制的有效性;结合降噪抑制和混响抑制,有效的提高了语音质量。

    一种多粒度中文文本纠错方法和装置

    公开(公告)号:CN116127952A

    公开(公告)日:2023-05-16

    申请号:CN202310088091.8

    申请日:2023-01-16

    Abstract: 一种多粒度中文文本纠错方法,包括:对待纠错的中文文本进行预处理;构建名词知识库和文本纠错训练语料;使用预训练语言模型对输入待纠错的文本进行向量编码,并融合文本的语音信息,得到字符向量序列;基于神经网络检测文本中的字粒度和词粒度错误,得到错误字集合和错误词集合;对检测得到的字粒度和词粒度的错误分别进行纠正,得到字、词粒度错误的候选替换字、词;使用多任务学习的方式联合训练整个模型;将字、词粒度纠正结果进行融合,得到纠错后的文本。本发明还包括一种多粒度中文文本纠错装置。本发明可以有效地对文本中的多粒度(字粒度和词粒度)错误进行纠错,并采用多任务学习的方式训练整个模型,具有很好的纠错准确性和实用性。

    一种机器人任务自主决策执行的方法和装置

    公开(公告)号:CN116089609A

    公开(公告)日:2023-05-09

    申请号:CN202211629245.1

    申请日:2022-12-19

    Abstract: 本发明公开了一种机器人任务自主决策执行的方法,包括以下步骤:将机器人相关知识分类别构建,包括静态知识和动态知识;根据静态知识和动态知识,将不同类别的知识采用不同形式表达,构建出多层次的多模态知识图谱;采用差异化存储知识的方式对多模态知识图谱进行存储,使得不同类别知识间相互关联;机器人基于关联的多模态知识图谱,实现任务的自主决策执行,这样通过分类存储各类知识,便于机器人基于各类知识的自主决策。

    手术机器人和手术系统
    24.
    发明公开

    公开(公告)号:CN116058974A

    公开(公告)日:2023-05-05

    申请号:CN202310196969.X

    申请日:2023-02-23

    Abstract: 本公开是关于一种手术机器人和手术系统。手术机器人包括安装座和设置于安装座上的固定组件、导向组件和捻送组件。固定组件用于将输尿管软镜固定安装于安装座。导向组件位于捻送组件和固定组件之间,并与输尿管软镜的工作通道连通。捻送组件用于夹紧并驱动钬激光光纤,以使得钬激光光纤穿过导向组件后在输尿管软镜的工作通道内往复移动。本公开中的手术机器人能够在手术过程中,通过捻送组件实现钬激光光纤在输尿管软镜中的进给,而无需额外的手术助手,并且保证了手术的精密性,提高了手术效率。

    基于视觉语言预训练模型的机器人操控方法、装置及介质

    公开(公告)号:CN115933387A

    公开(公告)日:2023-04-07

    申请号:CN202211493655.8

    申请日:2022-11-25

    Abstract: 本发明涉及一种基于视觉语言预训练模型的机器人操控方法、装置及介质,所述方法包括:获取实时的视觉感知信息和自然语言指令,将该视觉感知信息和自然语言指令作为一操控策略深度学习网络模型的输入,获得对应的机器人动作指令;其中,所述操控策略深度学习网络模型的训练过程包括以下步骤:搭建机器人操控的仿真环境,在该仿真环境中生成第一训练数据集,构建包含视觉语言预训练的操控策略深度学习网络模型对操控策略深度学习网络模型进行预训练;采集真实场景数据集并处理,生成第二训练数据集,对经预训练的操控策略深度学习网络模型进行小样本迁移训练,微调模型参数,获得最终的操控策略深度学习网络模型。与现有技术相比,本发明具有可方便实现多任务作业、具有泛化能力等优点。

    一种增强BART预训练任务的句子排序方法及装置

    公开(公告)号:CN115879421A

    公开(公告)日:2023-03-31

    申请号:CN202310120728.7

    申请日:2023-02-16

    Abstract: 本发明公开了一种增强BART预训练任务的句子排序方法及装置,包括如下步骤:步骤1、从文本资源中提取有序的句子作为原始训练数据;步骤2、对原始训练数据进行预处理;步骤3、用预处理后的训练数据训练BART模型;步骤4、将待排序的句子输入到训练完成的模型中进行预测排序。设计词性标注预训练任务、句子掩盖预训练任务、句子删除预训练任务、句子填充预训练任务和句子旋转预训练任务进一步增强BART模型对句子语义和句间关系的特征提取能力。设计的预训练任务是一种多任务学习的训练方法,也是一种位置可控的句子排序方法,将排序控制信息通过句子标签序列的形式加到输入字符串中,模型会根据输入的排序控制信息进行句子排序。

    一种双麦克风语音增强方法和系统

    公开(公告)号:CN115831145A

    公开(公告)日:2023-03-21

    申请号:CN202310123145.X

    申请日:2023-02-16

    Abstract: 本发明公开一种双麦克风语音增强方法和系统,该方法包括:步骤一,对两个麦克风通道的信号进行分帧,加窗,快速傅里叶变换的操作,使得信号从时域转换到频域;步骤二,利用互相关函数对两个通道在频域的信号进行语音活跃检测,若检测为无语音段,则更新噪声互功率谱;若检测为有语音段,则对语音信号进行降噪处理;步骤三,使用降噪后的语音信号来估计晚期混响功率谱,并抑制混响,即使用晚期混响功率谱对降噪后的语音信号做去混响处理;步骤四,将降噪去混响后的信号从频域转换回时域后输出。本发明进行语音活跃检测、噪声互功率谱更新和噪声抑制,同时进行去混响处理,增加了混响抑制的有效性;结合降噪抑制和混响抑制,有效的提高了语音质量。

    一种基于Sparql语句生成的知识图谱问答方法和系统

    公开(公告)号:CN115827844A

    公开(公告)日:2023-03-21

    申请号:CN202211609811.2

    申请日:2022-12-12

    Abstract: 一种基于Sparql语句生成的知识图谱问答方法,包括:将本体层的知识图谱和实例层的知识图谱映射到向量空间,学习每个概念、实体和关系的向量表示;通过命名实体识别算法识别出自然语言查询语句中的所有实体,并通过实体链接算法将问题中的实体链接到知识图谱实例层中的实体;在训练集中检索K个与查询问题相似的问题以及相应的Sparql语句;对问题和候选Sparql语句信息集进行编码,并采用多头注意力机制融合它们的信息;获取基于问题的本体编码,检索基于问题的本体子图以及相应的编码,并融合信息;采用transformer的Decoder部分作为生成模型,使用问题的编码、相应Sparql语句的编码以及本体子图的编码生成基于问题的Sparql语句;执行生成的Sparql语句,查询并返回问题的答案。

Patent Agency Ranking