-
公开(公告)号:CN116246279A
公开(公告)日:2023-06-09
申请号:CN202211691723.1
申请日:2022-12-28
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于CLIP背景知识的图文特征融合方法,属于图文融合信息处理与应用技术领域。首先利用OCR图片文本识别模型,对数据集中的每张图片进行文本提取,并将其添加至输入中。对输入分别使用不同的预训练模型得到向量表示。将各个隐向量串联,然后经过两个Transformer编码器,计算不同模态向量间的关系。之后使用CLIP模型,分别抽取图片和文本的向量,得到富有知识的多模态融合特征。将多模态融合特征串联后输入到全连接层,使用softmax函数进行归一化,由此在CLIP语境下得到了图文的融合特征,完成基于CLIP背景知识的多模态特征融合。本发明丰富了图片和文本之间的联系,使用OCR增强了图片模态在文本模态上的关系,提升了多模态融合特征的表示程度。
-
公开(公告)号:CN115294427A
公开(公告)日:2022-11-04
申请号:CN202210392972.4
申请日:2022-04-14
Applicant: 北京理工大学
IPC: G06V10/778 , G06V10/82 , G06F40/30
Abstract: 本发明涉及一种基于迁移学习的风格化图像描述生成方法,属于自然语言处理和计算机视觉图像描述生成技术领域。本方法利用分步训练的方法,使用两个映射网络,分别学习了文字的语义知识和风格知识。使用多模态预训练模型提取图像和文本信息,并通过映射网络进一步缩小图像和文本的语义距离。利用迁移学习的方法,将文本风格知识迁移到图像描述模型中,有效生成风格化图像语义。利用提示符(prompt)训练方式在大规模预训练语言模型GPT‑2上进行训练,降低训练成本。本方法针对风格化图像描述数据集缺乏的情况,利用风格化文本语料库对模型进行训练,以获得包含风格化知识的映射网络,并将其迁移到图像描述模型中。极大地降低了数据获取和模型训练的成本,在无监督的情况下同样取得了良好的效果。
-
公开(公告)号:CN110472948A
公开(公告)日:2019-11-19
申请号:CN201910859135.6
申请日:2019-09-11
Applicant: 北京理工大学
Abstract: 一种基于微信公众平台的汉蒙语料库众包构建方法,属于语料资源构建领域。具体操作步骤包含:1)获取多体裁开放域原始语料;2)通过蒙古语水平测试问卷,对参与翻译任务的用户进行筛选过滤;3)用订阅号推送的方式给关注微信公众号的用户发送众包翻译任务;4)每个微信客户端将一个或多个源句翻译成蒙古语以语音形式反馈给后台;5)通过后台管理员审核与众包质量评估相结合的方式评估所述语料质量,实现语料的质量控制;所述基于微信公众平台的汉蒙语料库众包构建方法在线上完成语料收集,交互简单、用户体验好、用户参与度高、有效解决了在真实蒙语语言环境下收集开放域自然口语语料的问题,在互联网移动平台下展现了极高的实用前景。
-
公开(公告)号:CN103838712A
公开(公告)日:2014-06-04
申请号:CN201310576097.6
申请日:2013-11-18
Applicant: 北京理工大学
Abstract: 本发明公开了一种针对词语级别的汉语情感词极性强度量化方法,属于计算机自然语言处理领域。首先获取情感词典中每个字的情感倾向值,然后根据字的情感倾向值获取所测基础情感词的极性强度度量值,最后根据基础情感词的极性强度度量值获取复合情感词的极性强度度量值。本发明对比现有技术,通过采用高斯分布函数修正统计得出的字的情感倾向值误差,大幅提高了基础情感词极性强度度量的准确率。在此基础上对复合情感词详细分类,分别设计经Sigmoid函数倒推得出的计算公式,大幅提高了复合情感词的极性强度度量准确率。另外引入Sim(A,B)函数,利用HowNet对副词自动分类,减轻了手工标注的工作量,提高了工作效率。
-
公开(公告)号:CN103761289A
公开(公告)日:2014-04-30
申请号:CN201410018115.3
申请日:2014-01-15
Applicant: 北京理工大学
IPC: G06F17/30
CPC classification number: G06F17/30675 , G06F17/3089
Abstract: 本发明涉及一种基于历史记录的知识推送方法,属于计算机应用领域。本方法通过比较两个任务之间的相似度,获取与当前任务相似的任务,并分析其在完成过程中对知识的操作记录,然后通过一个具体的值来对知识列表排序的方法实现知识推送。本方法能够依据需求者的知识背景和应用情境,为合适的任务,选择合适的知识推送给合适的人,有效的利用了已有的知识,从而促进知识增值。
-
公开(公告)号:CN103116573A
公开(公告)日:2013-05-22
申请号:CN201310046647.3
申请日:2013-02-06
Applicant: 北京理工大学
IPC: G06F17/27
Abstract: 本发明涉及到一种基于词汇注释的领域词典自动扩充方法,属于自然语言处理技术领域。其步骤为:①通过分析领域词典所属领域间的相关度,生成一棵领域分类树。②为每一个待扩充的领域词典获取一个训练集。③对训练集进行预处理,得到语料特征集。④统计每个节点对应的语料特征集中每个词汇在该语料特征集中出现的次数以及其子节点对应的语料特征集中包含某一词汇的语料特征集的个数。⑤计算各语料特征集中每个词汇的置信度。⑥将新词汇加入到待扩充的领域词典中。本发明提出的基于词汇注释的领域词典自动扩充方法不需要人工搜集领域语料库,因此避免了受领域语料库的质量和规模的局限以及领域语料库非平衡性的影响。
-
公开(公告)号:CN101751386B
公开(公告)日:2012-05-23
申请号:CN200910265839.7
申请日:2009-12-28
Applicant: 华建机器翻译有限公司 , 北京理工大学
IPC: G06F17/27
Abstract: 本发明公开了一种未登录词的识别方法,属于计算机科学中的自然语言处理技术领域。在未登录词的检测阶段,先用多重规则过滤重复串集合,然后使用统计模型作为主体统计框架,将尽可能多的特征融入到框架内,确保未登录词检测具有较高的准确率和召回率;在未登录词词性猜测阶段,基于统计模型框架,在通用特征的基础上,通过引入有效的新特征,来提高未登录词词性猜测的准确率。本方法对比现有技术,不受内存规模的限制,扩大了未登录词的检测范围,有效减少了未登录词检测过程中的漏召问题,尤其适合用于大规模语料的未登录词的识别。
-
公开(公告)号:CN114328863B
公开(公告)日:2025-05-06
申请号:CN202111512377.1
申请日:2021-12-08
Applicant: 北京理工大学
IPC: G06F16/3329 , G06F16/38 , G06F40/30
Abstract: 本发明涉及一种基于高斯核函数的长文本检索方法及系统,属于信息检索技术领域。本方法利用预训练语言模型的语义建模能力计算长文本各段落与用户检索内容的语义相似度,作为用户点击相关性的伪标签,有效缓解了缺乏段落级别标注数据的问题。通过不同的高斯核函数,将伪标签映射为不同维度的相关性得分。利用线性层聚合长文本各段落得分来输出用户检索内容对于长文本整体的相关性得分,能够让不同语义相似度等级的段落为用户点击相关与否做出贡献,增强了语义相似度与用户点击相关性的关联程度,提升了长文本检索模型的准确率。
-
公开(公告)号:CN114398467B
公开(公告)日:2025-02-14
申请号:CN202111477094.8
申请日:2021-12-06
Applicant: 北京理工大学
IPC: G06F16/3329 , G06F40/211
Abstract: 本发明涉及一种基于元擦除的证据句自动抽取方法,属于自然语言处理中的机器阅读理解技术领域。本方法无需人工标注,通过在句子级别进行擦除,根据每句话对答案的贡献程度来进行证据句的选择,实现自动选择证据句,并能够根据提升效果的幅度来评估证据句的选择,从而使多选阅读理解数据集能够根据证据句来解释模型行为。对比现有技术,本方法能够在证据句抽取与标注方面节省大量的时间和人力,并且得到很好的效果。
-
公开(公告)号:CN118569274A
公开(公告)日:2024-08-30
申请号:CN202410093791.0
申请日:2024-01-23
Applicant: 北京理工大学
IPC: G06F40/58 , G06F40/49 , G06F40/289 , G06F21/60
Abstract: 一种基于加密平行语料的藏汉神经机器翻译方法,属于自然语言处理中的机器翻译技术领域。本方法针对藏汉翻译任务,首先使用34个藏文辅音字母制作藏文字母表,根据字母表对藏汉平行语料中的藏语句子使用凯撒加密技术进行单字母替换,获得由加密藏文句子和对应汉语句子组成的加密平行语料。随后将加密平行语料输入到藏汉翻译模型,使藏汉翻译模型的损失函数中添加加密藏语和汉语句子对的负对数似然损失函数。同时,测量藏文句子和加密藏文句子的输出分布之间的对称化KL散度并将其添加到藏汉翻译模型的损失函数中,使藏汉语料与加密语料进行显式交互。本发明适用于机器翻译技术领域,保证源与目标句子的内容对齐,提高翻译性能。
-
-
-
-
-
-
-
-
-