-
公开(公告)号:CN111243572A
公开(公告)日:2020-06-05
申请号:CN202010035558.9
申请日:2020-01-14
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种基于说话人博弈的多人语音转换方法,包括以下步骤:训练时,首先使用常用的音频处理工具(如Librosa等)对所有说话人的语音数据进行声学特征的抽取,然后采用以下步骤进行模型训练:(1)鉴别器主要分为编码层和判别层,使用多层CNN堆叠的鉴别器的编码层逐步下采样得到当前声学特征输入的语义信息表示,并作为鉴别器的判别层的输入。本发明还提供了一种基于说话人博弈的多人语音转换系统。本发明的有益效果是:可直接建模转换关系,在充分考虑了说话人数量较多情况下捕捉说话人音色信息的难点,以多说话人博弈建模语音转换关系,可提供更加稳定、性能更好的转换效果。
-
公开(公告)号:CN118427291A
公开(公告)日:2024-08-02
申请号:CN202410492955.7
申请日:2024-04-23
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种约束引导的大语言模型生物医学事件抽取方法、系统及存储介质,包括任务分解步骤:将事件抽取任务分解成事件触发词抽取以及事件论元抽取两个子任务;约束构建步骤:建立事件内部约束和事件外部约束;建立分类辅助任务和指令模板,在指令模板中加入生物医学事件类型的解释。本发明的有益效果是:本发明能够更好地完成生物医学事件抽取任务,在小样本场景下采用大语言模型,大模型的性能都均超过小规模的预训练语言模型,并具有较大的优势,说明了大语言模型在小样本场景下的应用潜力。
-
公开(公告)号:CN113129920A
公开(公告)日:2021-07-16
申请号:CN202110403350.2
申请日:2021-04-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G10L21/0272 , G10L21/028 , G10L21/0308
Abstract: 本发明涉及一种基于U型网络和音频指纹的音乐与人声分离方法:当输入混合音频时,首先经过已经训练好的音乐分离模型,得到分离的伴奏音频;然后采用指纹提取算法,提取出伴奏音频中的指纹;随后将这些指纹送入到音频指纹数据库中,检索出对应匹配的歌曲以及时间点offset;随后将检索出的歌曲进行音量的调整;在匹配歌曲时间点offset前后一段时间内的采样点进行匹配,得到得到一段音频波形;再将分离音频与这段波形的音量进行精确匹配;最后混合音频减去这段波形最后得到较为纯净的音频。该方法设计一种基于U型网络架构的音乐分离模型,以及在该模型后加入音频指纹检索进行再分离,使分离效果差距明显缩小,得到纯净人声。
-
公开(公告)号:CN113033210A
公开(公告)日:2021-06-25
申请号:CN202110596995.2
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/295 , G06F40/242 , G06F40/216 , G06K9/62 , G16H70/40
Abstract: 本发明公开了一种基于社交媒体数据分析的药物潜在副作用挖掘方法,所述方法包括:获取社交媒体的药物评论数据并对所述药物评论数据进行数据预处理,得到药物评论预处理数据,再基于经过训练的BERT语言模型识别所述药物评论预处理数据的药物副作用实体;基于排序的实体标准化方式将所述药物副作用实体映射到标准副作用概念词典,得到初始药物副作用概念;根据所述初始药物副作用概念和官方报告药物副作用概念,得到潜在药物副作用概念。本发明实施例通过上述方法通过对广大民众最真实的用药体验进行分析,可以得到药物更加全面的潜在副作用信息。
-
公开(公告)号:CN112989835A
公开(公告)日:2021-06-18
申请号:CN202110430144.0
申请日:2021-04-21
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/295 , G06N3/04
Abstract: 本发明提供了一种复杂医疗实体抽取方法,包括执行以下任一项步骤:抽取单层连续实体和非连续实体步骤:对原始医疗文本进行预处理,采用基于依存分析的非连续实体双向标注方法进行标注,然后建立非连续实体抽取模型并使用双仿射分类器作为解码器,最后将预测标注还原为实体;抽取单层连续实体和嵌套实体步骤:对原始医疗文本进行预处理,采用基于依存分析的嵌套实体双向标注方法进行标注,然后建立嵌套实体抽取模型并使用双仿射分类器作为解码器,最后将预测标注还原为实体;抽取单层连续实体、非连续实体和嵌套实体步骤。本发明的有益效果是:本发明具有充分挖掘文本上下文信息,提高模型泛化性,增强模型对实体的识别准确率等优点。
-
公开(公告)号:CN118569219A
公开(公告)日:2024-08-30
申请号:CN202410718578.4
申请日:2024-06-05
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/166 , G06F18/25 , G06N5/022 , G06N20/00 , G06N3/0499 , G06N3/08
Abstract: 本发明公开了一种基于大语言模型知识融合的多选式问答方法,方法包括:构造大语言模型输入问题语句,根据所述输入问题语句,所述大语言模型能生成与输入问题和选项相关的知识;构建路径感知的交叉注意力网络模型,包括文本编码器、元路径编码器、路径感知的交叉注意力模块和自学习打分模块;所述路径感知的交叉注意力模块将所述文本编码器生成的第二文本和所述元路径编码器生成的第三文本进行融合;所述自学习打分模块通过自学习打分机制选择出对问答有用的路径。本发明结合大语言模型生成的思维链知识和基于路径感知的多选式问答模型,解决了知识获取的瓶颈,为一种更加可靠和丰富知识的多选式问答方法。
-
公开(公告)号:CN111243572B
公开(公告)日:2022-09-06
申请号:CN202010035558.9
申请日:2020-01-14
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种基于说话人博弈的多人语音转换方法,包括以下步骤:训练时,首先使用常用的音频处理工具(如Librosa等)对所有说话人的语音数据进行声学特征的抽取,然后采用以下步骤进行模型训练:(1)鉴别器主要分为编码层和判别层,使用多层CNN堆叠的鉴别器的编码层逐步下采样得到当前声学特征输入的语义信息表示,并作为鉴别器的判别层的输入。本发明还提供了一种基于说话人博弈的多人语音转换系统。本发明的有益效果是:可直接建模转换关系,在充分考虑了说话人数量较多情况下捕捉说话人音色信息的难点,以多说话人博弈建模语音转换关系,可提供更加稳定、性能更好的转换效果。
-
公开(公告)号:CN113033154B
公开(公告)日:2021-08-20
申请号:CN202110597702.2
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/126 , G06F40/242 , G06F40/284 , G06F16/35 , G06K9/62 , G16H70/00
Abstract: 本发明公开了一种基于阅读理解的医学概念编码方法、装置及存储介质,通过将临床医疗文本中的医学概念的编码任务转换为阅读理解任务,将临床医疗文本当做阅读理解中的文章,将若干个标准医学术语作为阅读理解中的选项,通过比较选项与选项之间的相关性以及选项与文本之间的相关性,在所述若干个标准医学术语中确定与所述临床医疗文本最相符的目标标准医学术语,并根据所述目标标准医学术语确定所述临床医疗文本的医学编码。本发明可以实现计算机自动为临床医疗文本中的医学概念进行自动编码,解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。
-
公开(公告)号:CN118379983A
公开(公告)日:2024-07-23
申请号:CN202410298015.4
申请日:2024-03-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G10L13/02 , G10L13/06 , G10L25/24 , G10L25/63 , G10L25/27 , G06F18/10 , G06F18/24 , G06F18/213 , G06F18/214
Abstract: 本发明提供了一种跨说话人情感语音合成方法、系统及存储介质,包括步骤1,数据采集及预处理步骤;步骤2,训练声学模型及多粒度情感信息提取模块步骤;步骤3,训练细粒度情感信息预测模块步骤;步骤4,跨说话人情感语音合成步骤。本发明的有益效果是:本发明能够提高生成语音质量,并且在提高情感表现力的同时保证其稳定性。
-
公开(公告)号:CN117010392A
公开(公告)日:2023-11-07
申请号:CN202310830338.9
申请日:2023-07-07
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/295 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/047 , G06N3/0895 , G16H70/40
Abstract: 本发明提供一种基于知识感知提示学习的少样本关系抽取方法,包括:步骤1,构造带有实体感知的连续模板;步骤2,采用预训练语言模型对连续模板编码,输出掩码词位置预测关系词表的概率值,关系词表概率最大的关系为医疗实体的预测关系标签。本发明的有益效果是:1.本发明的少样本医疗实体关系抽取方法通过知识感知形成有用的约束,在n2c2和i2b2数据集上取得了不错的性能;2.不需要借助大量的基类数据,只利用到少量的标注样本,是更具有挑战性的少样本任务;3.本发明的少样本医疗实体关系抽取方法将传统的分类任务转换为基于提示学习的掩码预测任务,将预训练语言模型的下游任务设计为和上游任务一致,消除了上下游任务的差距。
-
-
-
-
-
-
-
-
-