-
公开(公告)号:CN112052318B
公开(公告)日:2024-11-08
申请号:CN202010840252.0
申请日:2020-08-18
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学
IPC: G06F16/332 , G06F40/30
Abstract: 本申请公开了一种语义识别方法、装置、计算机设备和存储介质,可基于人工智能技术实现语义识别,通过语义识别模型可提取第一用户输入信息样本的文本特征信息,从而识别该样本的预测语义信息,基于该样本的标签和预测语义信息调整语义识别模型的参数;通过调整后的语义识别模型提取第二用户输入信息样本的文本特征信息,从而识别该样本的预测语义信息;基于该样本的标签和预测语义信息再调整语义识别模型的参数,得到训练完成的语义识别模型;基于该语义识别模型对目标用户输入信息进行语义识别得到语义信息,其中,第一用户输入信息样本无需人工标注,可降低对人工标注的依赖,而采用第二用户输入信息样本对模型进行训练,可提升语义识别准确性。
-
公开(公告)号:CN118643813A
公开(公告)日:2024-09-13
申请号:CN202410836145.9
申请日:2024-06-26
Applicant: 哈尔滨工业大学
IPC: G06F40/18 , G06F16/332 , G06N5/04
Abstract: 一种基于表达式分解的数值推理方法、系统、存储介质及设备,它属于自然语言处理领域。本发明解决了现有数值推理模型难以处理表格类型的数据的问题。本发明首先构造表格预测任务数据、表格计算任务数据以及别名定位任务数据,将构造的数据作为数值推理模型的预训练数据;利用预训练数据对数值推理模型进行预训练后,获得预训练好的数值推理模型;再基于表达式分解来构造数值推理模型的训练数据;利用构造的训练数据对预训练好的数值推理模型进行训练,获得训练好的数值推理模型;将用户问题作为训练好的数值推理模型的输入,通过训练好的数值推理模型输出对输入问题的回复。本发明方法可以应用于数值推理。
-
公开(公告)号:CN115203236B
公开(公告)日:2023-05-12
申请号:CN202210836518.3
申请日:2022-07-15
Applicant: 哈尔滨工业大学
IPC: G06F16/242
Abstract: 基于模板检索的文本到SQL生成方法,涉及数据处理技术领域,针对现有技术中针对长度较长的SQL语句解码速度慢的问题,由于非自回归模型的并行性带来时间性能提升的同时,也存在一些缺陷,无法在生成阶段观察到目标序列的上下文信息,因此本申请通过模板检索和多次迭代生成,弥补了非自回归模型的不足,本申请的技术方案对于结构复杂,长度较长的SQL语句,解码速度较传统方式提升了50%以上。本申请技术方案的模板库具有可扩展性,易于迁移,且具有较快的生成速度。
-
公开(公告)号:CN115713086A
公开(公告)日:2023-02-24
申请号:CN202211222613.0
申请日:2022-10-08
Applicant: 海信视像科技股份有限公司 , 哈尔滨工业大学
Abstract: 本公开涉及一种意图槽位识别方法及装置,应用于自然语言处理领域,可以提高智能对话系统中语义理解准确率。该方法包括:获取待识别语句对应的第一文本序列;通过第一编码模型对第一文本序列进行编码处理,得到第一文本序列对应的第一字向量;对第一字向量进行平均池化处理,得到第一文本序列对应的目标句向量;通过意图识别模型对目标句向量进行意图识别,识别得到至少一个意图结果;将每个意图结果分别与第一文本序列进行拼接,得到至少一个第二文本序列;通过第二编码模型分别对每个第二文本序列进行编码处理,得到至少一个第二字向量,每个第二字向量对应一个第二文本序列;通过第一槽位识别模型对每个第二字向量进行槽位识别,得到该每个意图结果对应的至少一个槽位结果。
-
公开(公告)号:CN115391608A
公开(公告)日:2022-11-25
申请号:CN202211013667.6
申请日:2022-08-23
Applicant: 哈尔滨工业大学
Abstract: 一种图到图结构的自动标注转换方法,涉及自然语言处理技术领域,针对现有技术中通过人工进行标注规范转换准确率低的问题,本申请通过简单有效的线性变换将源解析器中的核心参数适配到目标解析器中,并继承源解析器中的所有其他参数。图到图线性变换方法能充分继承源标准规范的信息并将其迁移到目标规范,因此本申请能有效避免人工规则和大量平行语料的限制,大幅提升图结构转换的准确率以及获得高质量的图结构标注数据。在少量平行语料帮助下,本申请的方法可以取得比现有的各种基线模型更好的效果。
-
公开(公告)号:CN115186683A
公开(公告)日:2022-10-14
申请号:CN202210836512.6
申请日:2022-07-15
Applicant: 哈尔滨工业大学
Abstract: 一种基于跨模态翻译的属性级多模态情感分类方法,涉及自然语言处理技术领域,针对现有技术在属性级多模态情感分析任务上预测准确率低的问题,本申请提出了一种简单但有效的人脸敏感的跨模态翻译方法,在不需要额外训练图像情感描述生成模型的情况下,通过引入人脸信息生成人脸表情描述补全图片情感信号,实现了更精准的属性级多模态情感预测。
-
公开(公告)号:CN119356690A
公开(公告)日:2025-01-24
申请号:CN202411492406.6
申请日:2024-10-24
Applicant: 哈尔滨工业大学
Abstract: 本发明属于计算机技术领域,尤其涉及一种自构造上下文的反编译方法、设备以及存储介质。针对现有的技术生成的反编译代码的准确性不高的问题。提出了一种自构造上下文的反编译方法包括:获取待反编译的二进制文件X,将待反编译的二进制文件X进行反汇编处理,得到获得汇编代码A;使用预训练生成模型对汇编代码A进行反编译处理,得到编译代码B;使用编译器对得到的编译代码B进行编译处理,得到新的二进制文件C;对得到的二进制文件C进行反汇编处理,得到汇编代码E,将汇编代码E和编译代码B构建为一组样例Y;将得到的样例Y和汇编代码A拼接起来输入预训练生成模型中,进行反编译处理,得到新的编译代码F。
-
公开(公告)号:CN117521793A
公开(公告)日:2024-02-06
申请号:CN202311261780.0
申请日:2023-09-27
Applicant: 国网安徽省电力有限公司电力科学研究院 , 哈尔滨工业大学 , 国网安徽省电力有限公司
IPC: G06N5/022 , G06N3/0464 , G06N3/08 , G06Q50/06
Abstract: 电网故障诊断查询系统的稀疏知识图谱补全方法及系统,属于电网故障诊断和知识图谱补全技术领域。为了解决现有的基于设备信息知识图谱的问答系统因为图谱的稀疏特性导致的问答系统效率和准确率较低问题。针对电网设备知识图,本发明先训练基于文本的网络模型pπ,用于将知识图中的电网故障设备与故障原因(h,r,?)全部提取出来,然后通过pπ预测尾实体;同时训练基于结构的网络模型pθ,基于结构的网络模型pθ输出电网故障知识的图结构表示;然后采用变分EM算法和互相学习算法的联合训练方法对基于文本的网络模型pπ和基于结构的网络模型pθ进行训练,从而实现电网设备知识图进行补全。
-
公开(公告)号:CN115186683B
公开(公告)日:2023-05-23
申请号:CN202210836512.6
申请日:2022-07-15
Applicant: 哈尔滨工业大学
IPC: G06F40/58 , G06F18/2415 , G06V40/16 , G06V40/70
Abstract: 一种基于跨模态翻译的属性级多模态情感分类方法,涉及自然语言处理技术领域,针对现有技术在属性级多模态情感分析任务上预测准确率低的问题,本申请提出了一种简单但有效的人脸敏感的跨模态翻译方法,在不需要额外训练图像情感描述生成模型的情况下,通过引入人脸信息生成人脸表情描述补全图片情感信号,实现了更精准的属性级多模态情感预测。
-
公开(公告)号:CN115169331B
公开(公告)日:2023-05-12
申请号:CN202210850675.X
申请日:2022-07-19
Applicant: 哈尔滨工业大学
IPC: G06F40/232 , G06F40/211 , G06F40/289 , G06F40/30 , G06N3/0442 , G06N3/045 , G06N3/08
Abstract: 融入词语信息的中文拼写纠错方法,涉及自然语言处理技术领域,针对现有技术中由于缺少词语信息,并不能对整个词都写错的词语进行纠错的问题,本申请在模型当中有效地引入了词语信息,增强了模型的语义表示能力,大幅提升了模型对整个词都写错的情况的纠错能力,提升了模型整体文本纠错能力。本申请在模型中引入专门的神经网络结构用于表示词语信息,并将每个字所在词的词语信息融入到字的表示当中,从而有效引入了词语信息,增强了模型的语义表示能力,大幅提升了模型对整个词都写错的情况的纠错能力,提升了模型整体文本纠错能力。
-
-
-
-
-
-
-
-
-