基于BiLSTM-CNN的英缅双语平行句对抽取方法及装置

    公开(公告)号:CN110414009A

    公开(公告)日:2019-11-05

    申请号:CN201910873805.X

    申请日:2019-09-17

    Abstract: 本发明涉及基于BiLSTM-CNN的英缅双语平行句对抽取方法及装置,属于自然语言处理技术领域。本发明首先通过Muse工具预训练出双语词向量,然后利用缅甸语虚词和助词识别缅语的主谓宾的特点对句子进行功能标记,把每个词的句法结构信息拼接到词向量中,再使用BiLSTM-CNN对句子中进行编码,把输出概率作为衡量是否为平行句对的条件。并根据上述步骤功能模块化制成基于BiLSTM-CNN的英缅双语平行句对抽取装置。本发明较传统的双语平行句对识别系统更为简单,实验结果表明该方法及装置在正确率和召回率等指标表现上均优于基线系统,精确率普遍都有所提升。

    基于没有配对样本的行人重识别域泛化方法

    公开(公告)号:CN118968565A

    公开(公告)日:2024-11-15

    申请号:CN202411447862.9

    申请日:2024-10-17

    Abstract: 本发明提供基于没有配对样本的行人重识别域泛化方法,属于计算机视觉中的图像检索技术领域。本发明包括:获取数据集;学习行人身份原型;利用行人身份原型,通过对比学习的方法,学习身份相关提示,用于弥补缺失的跨相机正样本;引入一种可学习的扰动提示,将扰动提示信息注入到可学习的身份相关提示中,迫使图像编码器性能下降来更新可学习扰动提示;利用缺失跨相机正样本的数据和加入扰动提示信息的身份相关提示,通过更新图像编码器的参数,用于增强图像编码器对一致性特征的提取能力;利用累计匹配曲线CMC和平均准确度mAP两个客观评价指标评估未知域的检索结果。通过本方法,显著提升了模型在真实场景中的适用性和泛化能力。

    基于特征增强与多粒度跨域对齐的行人重识别方法

    公开(公告)号:CN117671734A

    公开(公告)日:2024-03-08

    申请号:CN202311661491.X

    申请日:2023-12-06

    Abstract: 本发明涉及基于特征增强与多粒度跨域对齐的行人重识别方法,属于图像检索技术领域。本发明包括步骤:获取用于行人重识别模型的源域和目标域训练数据集;将源域和目标域数据样本输入特征提取网络中,对特征提取网络进行训练,实现特征提取网络对行人特征提取的判别能力;对网络中的行人特征进行特征增强,实现在身份信息提取过程中屏蔽域信息的特征,以提升特征的判别性;将增强后的特征送入粗粒度行人身份信息提取模块,利用聚类为目标域数据样本分配伪标签;将特征送入细粒度行人身份信息提取模块,将跨相机的负样本进行推远。本发明利用跨相机负样本来解决跨区域行人身份的匹配,实现了远距离场景下的行人身份匹配。

    一种用于事件检测的语义感知方法

    公开(公告)号:CN115470772A

    公开(公告)日:2022-12-13

    申请号:CN202211027619.2

    申请日:2022-08-26

    Abstract: 本发明涉及用于事件检测的语义感知方法。由于高频事件触发词往往主导ED模型的预测,且ED模型不能很好地理解上下文信息,导致在某些情况下无法识别事件类型,本发明能更加关注上下文来改变事件触发器的主导地位。提出的新颖的语义表征,以深入挖掘事件触发器和上下文之间的潜在联系,使ED模型更好地理解上下文信息。只需要在验证集上进行轻量级的训练,就能搭载在在任何训练好的模型上,无需昂贵的再训练和微调。在公共ACE2005数据集上的大量实验结果表明了该方法的有效性和可移植性。本发明优于之前12个最先进的(SOTA)事件检测模型,对于F1值和F0.5值分别提升了5.1%和2.2%。

    基于生成对抗网络的越南语新闻事件共指关系识别方法

    公开(公告)号:CN114925168A

    公开(公告)日:2022-08-19

    申请号:CN202210567309.3

    申请日:2022-05-24

    Abstract: 本发明涉及基于生成对抗网络的越南语新闻事件共指关系识别方法,属自然语言处理领域。本发明的事件共指关系识别任务需要识别新闻文档中事件描述句之间是否从不同的角度对同一件真实事情展开论述。针对事件信息比实体信息复杂导致事件共指关系识别的难度远远大于实体共指消解,以及在越南语新闻文档中存在不同事件句之间具有相似上下文但不具有共指关系的情况,而容易对模型造成困惑。因此,本发明采用事件上下文作为事件句的表征,并通过生成对抗网络来缓解文本中的噪声数据,以提高面向越南语新闻的事件共指关系识别的性能。在构建的越南语事件数据集上进行实验验证,结果表明,所提方法较基线模型取得了更好的效果。

    一种快递纸箱回收柜及快递纸箱单面信息消除方法

    公开(公告)号:CN114890021A

    公开(公告)日:2022-08-12

    申请号:CN202210525531.7

    申请日:2022-05-14

    Abstract: 本发明涉及一种快递纸箱回收柜及快递纸箱单面信息消除方法,属于快递回收装置技术领域。包括主柜及位于主柜左侧、右侧且结构相同的侧柜,主柜及侧柜上方设有供电装置,侧柜上设有投入口,侧柜内部设有侧柜控制装置及与其连接的检测装置、传输装置、快递纸箱单面信息消除装置,主柜内部设有主柜控制装置、左侧压缩装置、右侧压缩装置、分拣传输装置、纸箱存储装置、储能装置,快递纸箱经过投入口后依次经过检测装置、传输装置、快递纸箱单面信息消除装置、左侧压缩装置或右侧压缩装置、分拣传输装置后被送入纸箱存储装置。本发明可以解决快递纸箱单面信息泄露的问题,有利于用户对纸箱的回收与利用。

    一种基于聚类的新闻文本最优主题数计算方法

    公开(公告)号:CN110851592B

    公开(公告)日:2022-04-05

    申请号:CN201910884160.X

    申请日:2019-09-19

    Abstract: 本发明公开了一种基于聚类的新闻文本最优主题数计算方法,步骤为:Step1、新闻文本语料获取和预处理;Step2、对经过预处理的语料库进行词嵌入处理,获得语料库中文本的词向量;Step3、将所有的词向量作为一个整体,利用一种基于快速搜索和寻找密度峰值的聚类方法对词向量进行聚类,获得词向量的聚类数目;Step4、将词向量聚类获得的数目确定为新闻文本的最优主题数。本发明利用词嵌入Word2Vec模型来表达主题语料之间的隐含语义关系,可以避探索词义相关关系,同时算法整体不存在迭代,计算简单,模型复杂度不高,因此可以避免现有方法在确定LDA最优主题数目所使用的都要迭代及每一步都需要求解目标函数的不足。

    一种融入文档词权重的跨境民族文化文本检索方法

    公开(公告)号:CN112948537A

    公开(公告)日:2021-06-11

    申请号:CN202110096623.3

    申请日:2021-01-25

    Inventor: 张亚飞 龙小龙

    Abstract: 本发明涉及一种融入文档词权重的跨境民族文化文本检索方法,属于自然语言处理技术领域。本发明包括步骤:获取查询词向量和文档词向量;将得到的查询词向量和文档词向量输入到BiLSTM方法,得到查询词隐向量和文档词隐向量;通过TF‑IDF方法计算出文档词中每个实体的权重,并融入到文档词隐向量中,再把查询词隐向量和融入实体权重后的文档词隐向量通过相似度计算构建成一个交互矩阵;利用CNN提取交互矩阵上的特征,得到基本的关联特征,再通过max‑pooling提取最强特征,并投影到多层感知器神经网络中,最终获得查询与文档的匹配得分。本发明通过融入文档词中每个实体的权重来有效提高检索的准确性。

Patent Agency Ranking