Patent search ap:("之江实验室" OR "东南大学") AND inv:"宋伟" Page 3

21.

发明授权
一种双麦克风语音增强方法和系统有权

公开(公告)号：CN115831145B

公开(公告)日：2023-06-27

申请号：CN202310123145.X

申请日：2023-02-16

Applicant: 之江实验室

Inventor： 白炳潮 , 宛敏红 , 宋伟 , 朱世强

IPC: G10L21/0232 , G10L21/0264 , G10L25/21

Abstract: 本发明公开一种双麦克风语音增强方法和系统，该方法包括：步骤一，对两个麦克风通道的信号进行分帧，加窗，快速傅里叶变换的操作，使得信号从时域转换到频域；步骤二，利用互相关函数对两个通道在频域的信号进行语音活跃检测，若检测为无语音段，则更新噪声互功率谱；若检测为有语音段，则对语音信号进行降噪处理；步骤三，使用降噪后的语音信号来估计晚期混响功率谱，并抑制混响，即使用晚期混响功率谱对降噪后的语音信号做去混响处理；步骤四，将降噪去混响后的信号从频域转换回时域后输出。本发明进行语音活跃检测、噪声互功率谱更新和噪声抑制，同时进行去混响处理，增加了混响抑制的有效性；结合降噪抑制和混响抑制，有效的提高了语音质量。

22.

发明公开
一种多粒度中文文本纠错方法和装置审中-实审

公开(公告)号：CN116127952A

公开(公告)日：2023-05-16

申请号：CN202310088091.8

申请日：2023-01-16

Applicant: 之江实验室

Inventor： 赵鑫安 , 宋伟 , 朱世强 , 谢冰 , 袭向明 , 尹越 , 王雨菡

IPC: G06F40/232 , G06F40/126 , G06F18/25 , G06F16/332 , G06F40/216 , G06F16/35 , G06F40/169 , G06F18/22

Abstract: 一种多粒度中文文本纠错方法，包括：对待纠错的中文文本进行预处理；构建名词知识库和文本纠错训练语料；使用预训练语言模型对输入待纠错的文本进行向量编码，并融合文本的语音信息，得到字符向量序列；基于神经网络检测文本中的字粒度和词粒度错误，得到错误字集合和错误词集合；对检测得到的字粒度和词粒度的错误分别进行纠正，得到字、词粒度错误的候选替换字、词；使用多任务学习的方式联合训练整个模型；将字、词粒度纠正结果进行融合，得到纠错后的文本。本发明还包括一种多粒度中文文本纠错装置。本发明可以有效地对文本中的多粒度(字粒度和词粒度)错误进行纠错，并采用多任务学习的方式训练整个模型，具有很好的纠错准确性和实用性。

23.

发明公开
一种机器人任务自主决策执行的方法和装置审中-实审

公开(公告)号：CN116089609A

公开(公告)日：2023-05-09

申请号：CN202211629245.1

申请日：2022-12-19

Applicant: 之江实验室

Inventor： 任杰 , 龙沁沁 , 朱世强 , 宋伟 , 徐泽民 , 周元海

IPC: G06F16/35 , G06F16/36

Abstract: 本发明公开了一种机器人任务自主决策执行的方法，包括以下步骤：将机器人相关知识分类别构建，包括静态知识和动态知识；根据静态知识和动态知识，将不同类别的知识采用不同形式表达，构建出多层次的多模态知识图谱；采用差异化存储知识的方式对多模态知识图谱进行存储，使得不同类别知识间相互关联；机器人基于关联的多模态知识图谱，实现任务的自主决策执行，这样通过分类存储各类知识，便于机器人基于各类知识的自主决策。

24.

发明公开
手术机器人和手术系统有权

公开(公告)号：CN116058974A

公开(公告)日：2023-05-05

申请号：CN202310196969.X

申请日：2023-02-23

Applicant: 之江实验室

Inventor： 韩建达 , 陈令凯 , 朱世强 , 宋伟 , 刘晓磊 , 成利波 , 梁大伟

IPC: A61B34/30 , A61B18/26

Abstract: 本公开是关于一种手术机器人和手术系统。手术机器人包括安装座和设置于安装座上的固定组件、导向组件和捻送组件。固定组件用于将输尿管软镜固定安装于安装座。导向组件位于捻送组件和固定组件之间，并与输尿管软镜的工作通道连通。捻送组件用于夹紧并驱动钬激光光纤，以使得钬激光光纤穿过导向组件后在输尿管软镜的工作通道内往复移动。本公开中的手术机器人能够在手术过程中，通过捻送组件实现钬激光光纤在输尿管软镜中的进给，而无需额外的手术助手，并且保证了手术的精密性，提高了手术效率。

25.

发明公开
一种基于知识图谱的问答方法和系统审中-实审

公开(公告)号：CN116010566A

公开(公告)日：2023-04-25

申请号：CN202211629271.4

申请日：2022-12-19

Applicant: 之江实验室

Inventor： 朱世强 , 任杰 , 宋伟 , 顾建军 , 龙沁沁 , 赵文宇 , 徐泽民

IPC: G06F16/332 , G06F16/36 , G06F40/30 , G06F16/338 , G06F16/33 , G06F16/35 , G06N3/0442 , G06N3/0464 , G10L15/26 , G10L13/08

Abstract: 本发明公开了一种基于知识图谱的问答方法和系统，包括：将获取的音频数据转换为问答文本；利用基于双向LSTM构建的主语判断模型对问答文本进行主语判断并确认主语；采用基于spacy框架并结合主语在问答文本中的前后语义特征，链接主语在知识图谱中的标准主语实体；利用基于CNN构建关系预测模型对问答文本进行关系判断并筛选概率值高的至少2个关系；依据标准主语实体和每个关系在知识图谱中进行检索，确定每个目标实体节点，并对所有目标实体节点排序确认最终目标实体节点作为答案，并将答案转换成语音输出。该方法和系统实现计算资源需求最小化。

26.

发明公开
基于视觉语言预训练模型的机器人操控方法、装置及介质审中-实审

公开(公告)号：CN115933387A

公开(公告)日：2023-04-07

申请号：CN202211493655.8

申请日：2022-11-25

Applicant: 之江实验室

Inventor： 廖建峰 , 宋伟 , 朱世强 , 孟启炜

IPC: G05B13/04 , G06V10/774 , G06V10/82 , G06N3/0475 , G06N3/096 , G06T7/80

Abstract: 本发明涉及一种基于视觉语言预训练模型的机器人操控方法、装置及介质，所述方法包括：获取实时的视觉感知信息和自然语言指令，将该视觉感知信息和自然语言指令作为一操控策略深度学习网络模型的输入，获得对应的机器人动作指令；其中，所述操控策略深度学习网络模型的训练过程包括以下步骤：搭建机器人操控的仿真环境，在该仿真环境中生成第一训练数据集，构建包含视觉语言预训练的操控策略深度学习网络模型对操控策略深度学习网络模型进行预训练；采集真实场景数据集并处理，生成第二训练数据集，对经预训练的操控策略深度学习网络模型进行小样本迁移训练，微调模型参数，获得最终的操控策略深度学习网络模型。与现有技术相比，本发明具有可方便实现多任务作业、具有泛化能力等优点。

27.

发明公开
一种增强BART预训练任务的句子排序方法及装置有权

公开(公告)号：CN115879421A

公开(公告)日：2023-03-31

申请号：CN202310120728.7

申请日：2023-02-16

Applicant: 之江实验室

Inventor： 谢冰 , 袭向明 , 赵鑫安 , 尹越 , 宋伟 , 朱世强

IPC: G06F40/166 , G06F40/284 , G06F40/117 , G06N3/0499 , G06N3/08

Abstract: 本发明公开了一种增强BART预训练任务的句子排序方法及装置，包括如下步骤：步骤1、从文本资源中提取有序的句子作为原始训练数据；步骤2、对原始训练数据进行预处理；步骤3、用预处理后的训练数据训练BART模型；步骤4、将待排序的句子输入到训练完成的模型中进行预测排序。设计词性标注预训练任务、句子掩盖预训练任务、句子删除预训练任务、句子填充预训练任务和句子旋转预训练任务进一步增强BART模型对句子语义和句间关系的特征提取能力。设计的预训练任务是一种多任务学习的训练方法，也是一种位置可控的句子排序方法，将排序控制信息通过句子标签序列的形式加到输入字符串中，模型会根据输入的排序控制信息进行句子排序。

28.

发明公开
基于人体姿态及其躯干运动场的行为识别方法有权

公开(公告)号：CN115862130A

公开(公告)日：2023-03-28

申请号：CN202211433342.3

申请日：2022-11-16

Applicant: 之江实验室

Inventor： 朱世强 , 郭方泰 , 宋伟 , 顾建军 , 朱佳凯 , 孟启炜 , 金天磊

IPC: G06V40/20 , G06V40/10 , G06V10/40 , G06V10/764 , G06V10/774 , G06V20/52 , G06V10/82 , G06V20/40 , G06N3/0464 , G06N3/047 , G06N3/084

Abstract: 基于人体姿态及其躯干运动场的行为识别方法，包括：获取多人人体彩色图像作为输入；采用目标检测网络从所述多人人体彩色图像中检测二维人体包围框，采用二维人体姿态估计网络从截取的图像中计算二维人体姿态；基于二维人体姿态分别计算关键点热图和躯干运动场，拼接这两种模态作为人体姿态表征；将人体姿态表征作为输入，建立姿态网络用于提取人体行为特征，输出分类器中概率最大的行为类别；采集多人人体彩色图像序列、二维人体姿态以及对应的类别标签作为训练数据集，采用随机梯度下降的优化方法对姿态网络进行预训练优化。本发明减少了复杂背景下行为动作在时间序列的歧义性，提高了低采样帧率下的行为识别的准确率。

29.

发明公开
一种双麦克风语音增强方法和系统有权

公开(公告)号：CN115831145A

公开(公告)日：2023-03-21

申请号：CN202310123145.X

申请日：2023-02-16

Applicant: 之江实验室

Inventor： 白炳潮 , 宛敏红 , 宋伟 , 朱世强

IPC: G10L21/0232 , G10L21/0264 , G10L25/21

Abstract: 本发明公开一种双麦克风语音增强方法和系统，该方法包括：步骤一，对两个麦克风通道的信号进行分帧，加窗，快速傅里叶变换的操作，使得信号从时域转换到频域；步骤二，利用互相关函数对两个通道在频域的信号进行语音活跃检测，若检测为无语音段，则更新噪声互功率谱；若检测为有语音段，则对语音信号进行降噪处理；步骤三，使用降噪后的语音信号来估计晚期混响功率谱，并抑制混响，即使用晚期混响功率谱对降噪后的语音信号做去混响处理；步骤四，将降噪去混响后的信号从频域转换回时域后输出。本发明进行语音活跃检测、噪声互功率谱更新和噪声抑制，同时进行去混响处理，增加了混响抑制的有效性；结合降噪抑制和混响抑制，有效的提高了语音质量。

30.

发明公开
一种基于Sparql语句生成的知识图谱问答方法和系统有权

公开(公告)号：CN115827844A

公开(公告)日：2023-03-21

申请号：CN202211609811.2

申请日：2022-12-12

Applicant: 之江实验室

Inventor： 赵文宇 , 宋伟 , 朱世强 , 龙沁沁 , 任杰 , 徐泽民

IPC: G06F16/332 , G06F16/36 , G06F40/295

Abstract: 一种基于Sparql语句生成的知识图谱问答方法，包括：将本体层的知识图谱和实例层的知识图谱映射到向量空间，学习每个概念、实体和关系的向量表示；通过命名实体识别算法识别出自然语言查询语句中的所有实体，并通过实体链接算法将问题中的实体链接到知识图谱实例层中的实体；在训练集中检索K个与查询问题相似的问题以及相应的Sparql语句；对问题和候选Sparql语句信息集进行编码，并采用多头注意力机制融合它们的信息；获取基于问题的本体编码，检索基于问题的本体子图以及相应的编码，并融合信息；采用transformer的Decoder部分作为生成模型，使用问题的编码、相应Sparql语句的编码以及本体子图的编码生成基于问题的Sparql语句；执行生成的Sparql语句，查询并返回问题的答案。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification