-
公开(公告)号:CN113779245B
公开(公告)日:2024-09-10
申请号:CN202110973766.8
申请日:2021-08-24
Applicant: 北京理工大学
IPC: G06F16/35 , G06F40/216 , G06F40/30 , G06N3/0442 , G06Q30/0201 , G06Q50/00
Abstract: 本发明涉及一种评论情感原因三元组抽取方法,属于自然语言处理中的情感分析及信息抽取技术领域。本方法综合了情感原因抽取技术、情感分析技术和信息抽取技术,同时抽取出情感句、原因句以及情感类型三元组,即情感原因三元组,并将其应用于评论场景。本方法克服了情感原因抽取结果实用性较低、应用场景受限的缺点,解决了现有情感原因抽取方法存在的错误传播、使用复杂、耗时等缺点,实现了情感原因三元组端到端的抽取。本方法改进了现有评论方式分类粒度较粗、信息过多等问题,可以很好的提高用户的使用体验。
-
公开(公告)号:CN114117041B
公开(公告)日:2024-05-24
申请号:CN202111326061.3
申请日:2021-11-10
Applicant: 北京理工大学
IPC: G06F16/35 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及一种基于特定属性词上下文建模的属性级情感分析方法,属于自然语言处理技术领域。本方法综合了预训练语言模型、基于属性的情感分类技术,提出了对输入进行转换增强,并对预训练语言模型进一步微调的模型,以实现高效的特定属性上下文建模,包括特定属性的输入转换、上下文建模、属性特征归纳和微调分类四部分。本方法可以有效且准确地捕捉多属性评论句中的目标属性对应的观点词,并可以更加准确地判定目标属性的情感极性。
-
公开(公告)号:CN115048935B
公开(公告)日:2024-05-14
申请号:CN202210383512.5
申请日:2022-04-12
Applicant: 北京理工大学
IPC: G06F18/22 , G06F40/30 , G06N3/0499 , G06N3/048
Abstract: 本发明涉及一种基于密度矩阵的语义匹配方法,属于自然语言处理中的文本匹配技术领域。本方法提出了一种基于密度矩阵的状态‑概率对偶性的量子启发的自然语言处理模型,利用该模型进行语义匹配。该模型的状态‑概率对偶性自然产生了一种混合方法,结合了基于表示的语义匹配和基于交互的语义匹配两种工作方式。通过对句子对中的一个句子的密度矩阵进行奇异值分解,提取出句子的主要语义成分,这些语义成分构成了语义空间的正交基,从而作为句子对中另一个句子的测量算子进行量子测量。本方法采用的句子对非对称处理方法,显著地提高了语义匹配的性能。
-
公开(公告)号:CN114780722B
公开(公告)日:2024-05-14
申请号:CN202210342805.9
申请日:2022-03-31
Applicant: 北京理工大学
IPC: G06F16/35 , G06N3/045 , G06N3/0499 , G06N3/082 , G06N3/048
Abstract: 本发明涉及一种结合领域通用型语言模型的领域泛化方法,属于人工智能迁移学习技术领域。本方法综合了预训练语言模型和模型裁剪技术。首先对预训练语言模型微调,利用多个源域数据对预训练语言模型进行训练。基于微调后得到的模型,计算模型中参数的域不变分数,对域不变分数低的参数进行裁剪。最后对裁剪后的语言模型进行重训练,将训练得到领域通用型语言模型在不同数据上进行泛化性能测试。本方法解决了过度参数化的预训练语言模型中学习方差大的问题。基于本发明的领域通用型语言模型明显优于相应的基线模型,在自然语言处理领域泛化任务上取得了良好效果。
-
公开(公告)号:CN113946670B
公开(公告)日:2024-05-10
申请号:CN202111217510.0
申请日:2021-10-19
Applicant: 北京理工大学
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/247
Abstract: 本发明涉及一种面向对话情感识别的对比式上下文理解增强方法,属于计算机与信息科学技术领域。首先,基于已有的对话情感分析框架,提取出其中用于情感分类的隐藏状态序列。然后,基于提取的序列表示,构建包含上下文语义感知模式的对比样本。之后,利用对比学习损失函数,让模型能够从样本中学习到其包含的模式,以增强模型对于对话上下文的理解能力。最后,将对比损失和情感分类损失函数相加并进行多任务学习,完成网络模型训练。本方法具有较强地适配性,可以灵活地嵌入到已有的情感分类模型中,能够让模型在一定程度上从对话上下文内容理解的角度进行情感判别,同时能有效提升已有模型的情感分类准确率和面对扰动的鲁棒性。
-
公开(公告)号:CN117634469A
公开(公告)日:2024-03-01
申请号:CN202311568156.5
申请日:2023-11-22
Applicant: 北京理工大学
IPC: G06F40/216 , G06F40/279 , G06F18/22
Abstract: 本发明涉及文本纠正技术领域,特别涉及一种基于相似度驱动的文本纠正方法、装置、计算机设备以及存储介质,采用相似度计算方法,基于字典数据中的若干个字符,构建若干个字符之间在拼音、字形维度上的相似性分数,构建包含有混淆概率的若干个混淆字符的混淆字符集,并基于混淆字符集,通过差异化文本替换方法,对训练文本中的字符替换为拼音和字形更相似的字符以构建错误文本,将训练文本以及错误文本作为文本纠正模型的训练数据,使文本模型不仅具有预测当前位置词语的能力,更有从错误词语向正确词语的预测能力,提高文本纠正模型的泛用性以及文本纠正的准确性。
-
公开(公告)号:CN114780722A
公开(公告)日:2022-07-22
申请号:CN202210342805.9
申请日:2022-03-31
Applicant: 北京理工大学
Abstract: 本发明涉及一种结合领域通用型语言模型的领域泛化方法,属于人工智能迁移学习技术领域。本方法综合了预训练语言模型和模型裁剪技术。首先对预训练语言模型微调,利用多个源域数据对预训练语言模型进行训练。基于微调后得到的模型,计算模型中参数的域不变分数,对域不变分数低的参数进行裁剪。最后对裁剪后的语言模型进行重训练,将训练得到领域通用型语言模型在不同数据上进行泛化性能测试。本方法解决了过度参数化的预训练语言模型中学习方差大的问题。基于本发明的领域通用型语言模型明显优于相应的基线模型,在自然语言处理领域泛化任务上取得了良好效果。
-
公开(公告)号:CN114385805A
公开(公告)日:2022-04-22
申请号:CN202111534340.9
申请日:2021-12-15
Applicant: 北京理工大学
IPC: G06F16/335 , G06F40/289 , G06F40/30 , G06K9/62
Abstract: 本发明涉及一种提高深度文本匹配模型适应性的小样本学习方法,属于自然语言处理中的文本匹配技术领域。本方法综合了应用于文本匹配模型的小样本学习与跨领域适应性方法,沿最小化目标域小样本数据集损失的方向,对源域数据的权重进行梯度下降,解决了传统的跨领域文本匹配方法在小样本学习设置下表现不足的问题,增强了文本匹配模型在少样本学习环境中的适应性。本方法与基础模型无关,可应用于各种基于深度学习的文本匹配模型。
-
公开(公告)号:CN113779245A
公开(公告)日:2021-12-10
申请号:CN202110973766.8
申请日:2021-08-24
Applicant: 北京理工大学
Abstract: 本发明涉及一种评论情感原因三元组抽取方法,属于自然语言处理中的情感分析及信息抽取技术领域。本方法综合了情感原因抽取技术、情感分析技术和信息抽取技术,同时抽取出情感句、原因句以及情感类型三元组,即情感原因三元组,并将其应用于评论场景。本方法克服了情感原因抽取结果实用性较低、应用场景受限的缺点,解决了现有情感原因抽取方法存在的错误传播、使用复杂、耗时等缺点,实现了情感原因三元组端到端的抽取。本方法改进了现有评论方式分类粒度较粗、信息过多等问题,可以很好的提高用户的使用体验。
-
公开(公告)号:CN119808938A
公开(公告)日:2025-04-11
申请号:CN202411784813.4
申请日:2024-12-06
Applicant: 北京理工大学
IPC: G06N5/04 , G06N3/0455 , G06N3/0475 , G06N3/08
Abstract: 本发明涉及一种大模型加速方法,具体涉及一种基于阈值跳层的大模型加速方法。本发明综合了效率收益的同时,也兼顾了可观的效果。本发明旨在针对以往的基于跳层的大模型加速方法,这些方法虽然能够拿到很好的效率收益,但是却忽略了跳层操作往往可能会使得效果不可接受,具体表现为大模型生成的文本流畅度不高、准确率不足等。本方法提出了一种基于阈值跳层算法,相较于以前传统的跳层算法,在进一步提高了效率收益的同时,能够收获更优异的效果。具体地,基于阈值跳层算法需要对每一个模型中间某层的词元输入特征进行打分,当打分超过预设阈值时,则该词元需要参与当前层的计算,否则可以直接跳过当前层的计算。这样的设计使得跳层操作更加可拓展,因而能够进一步提高效率收益,并且使得效果也能保持在可接受的范围内。
-
-
-
-
-
-
-
-
-