一种目标检测模型对抗训练方法、目标检测方法及系统

    公开(公告)号:CN116580265B

    公开(公告)日:2025-04-22

    申请号:CN202310604430.3

    申请日:2023-05-26

    Abstract: 本发明提供一种目标检测模型对抗训练方法,所述方法包括:S1、获取目标图像数据集和初始对抗图案,所述目标图像数据集包括多个图像样本,且每个图像样本中设置有目标边界框标注;S2、对初始对抗图案进行分形变换以获得目标对抗图案;S3、将步骤S2得到的目标对抗图案注入所述目标图像数据集中每一图像样本的目标边界框内得到对抗训练集,并采用对抗训练集训练目标检测模型至收敛。本发明引入了引入分形变换损失对对抗图案进行迭代更新,使得生成的对抗图案具有一定的自相似性,采用具有自相似性的对抗图案对目标检测模型进行对抗训练,能够提升目标检测模型的鲁棒性,使得模型具有较强的对抗能力。

    基于列存数据的流式数据处理方法及系统

    公开(公告)号:CN114185884B

    公开(公告)日:2025-04-04

    申请号:CN202111306456.7

    申请日:2021-11-05

    Abstract: 本发明提出一种基于列存数据的流式数据处理方法及系统,包括:获取待处理的流式数据及其对应的处理任务,基于时间维度将该流式数据切分为批式数据块,该批式数据块中每条数据均包含各自所属窗口的时间戳;根据该时间戳的时间类型,压缩该时间戳,根据压缩结果为该批式数据块中每条数据分配窗口序号,将该批式数据块切分为多个中间数据块,每个中间数据块仅包含窗口序号相同的数据,根据处理任务对每个中间数据块的数据进行预聚合计算,产生预聚合中间状态;根据预设的流式数据时间处理模式,从内部存储提取相应窗口序号的预聚合中间状态并执行与其对应的处理任务,输出各窗口序号的任务处理结果,作为流式数据处理结果。

    一种基于多标签序列标注的指代消解方法

    公开(公告)号:CN114997177B

    公开(公告)日:2025-01-24

    申请号:CN202210561797.7

    申请日:2022-05-23

    Abstract: 本发明提供一种基于多标签序列标注的指代消解方法,包括:S1、将待处理文本分割成预设长度且不重合的多个文本片段;S2、采用预训练模型对每个文本片段进行编码得到每个字符的语义表达;S3、基于每个字符的语义表达分别判断每个字符是否属于B I E标签;S4、基于每个字符对应的标签,在连续I标签序列中,基于预设的组合策略组合任意的BE标签对应的字符构成短语,其中,连续I标签序列表示一个连续的字符序列中的每个字符均具有I标签;S5、计算任意两个短语之间的相似性得分,为每个短语保留与其相似性得分排名靠前的预设个数的短语作为其前置候选短语;S6、采用排序模型将每个短语的前置候选短语进行排序并将得分第一的前置候选短语作为其互指对象。

    一种基于模态对比学习的跨模态实体召回方法和装置

    公开(公告)号:CN119066217A

    公开(公告)日:2024-12-03

    申请号:CN202310643813.1

    申请日:2023-06-01

    Abstract: 本发明提供了一种基于模态对比学习的跨模态实体召回方法和装置,所述方法包括以下步骤:T1、获取待查询实体,利用经训练的多模态编码神经网络和预设的归一化方式提取待查询实体的多维待查询实体向量,其中,多模态编码神经网络包括用于对文本模态的输入实体提取向量的文本编码模型以及用于对图像模态的输入实体提取向量的图像编码模型并且根据同模态的对比学习和跨模态的对比学习得到;T2、计算多维待查询实体向量与索引库中存储的各库内实体的多维库内实体向量的相似度,所述各库内实体的多维库内实体向量预先基于所述经训练的多模态编码神经网络和预设的归一化方式提取得到;T3、基于相似度,从索引库中召回多个库内实体作为候选实体。

    基于提示学习的零样本可解释性立场检测方法、装置

    公开(公告)号:CN117764077A

    公开(公告)日:2024-03-26

    申请号:CN202311613359.1

    申请日:2023-11-29

    Abstract: 本发明提出一种基于提示学习的零样本可解释性立场检测方法、装置,所述方法包括:获取相关零样本立场检测的文本数据集并进行预处理;针对文本中的任一主题构造提示语,所述提示语中包含一立场标签,所述立场标签包含支持、反对和中立其中之一;将预处理的文本数据集以及所述提示语输入到预训练语言模型中进行编码,获得上下文表示向量和token词表示向量;使用上下文表示向量和token词表示向量进行相似度交互,计算出基于上下文的第一相似度和基于立场标签的第二相似度;利用所述第一相似度、第二相似度,对文本的立场标签进行预测。该方法提高了零样本立场检测的可解释性与检测精度。

    一种图像分类模型的训练方法、图像分类方法

    公开(公告)号:CN117333738A

    公开(公告)日:2024-01-02

    申请号:CN202311308831.0

    申请日:2023-10-10

    Abstract: 本发明实施例提供了一种图像分类模型训练方法,该方法包括:S1、获取包括多个图像样本的原始图像数据集及其对应的特征矩阵;S2、对原始图像数据集对应的特征矩阵进行降维处理,并将降维处理后的特征矩阵进行高斯建模以获得特征矩阵中每个特征值的高斯分布;S3、基于步骤S2中每个特征值的高斯分布对其依次进行高斯采样,以使高斯采样所得的所有特征值构成新的特征矩阵,并基于新的特征矩阵生成新的图像数据集;S4、采用新的图像数据集和原始图像数据集构成增强图像训练集训练图像分类模型至收敛。该方法提高了图像分类模型在少样本情况下的性能。

    一种基于多标签序列标注的指代消解方法

    公开(公告)号:CN114997177A

    公开(公告)日:2022-09-02

    申请号:CN202210561797.7

    申请日:2022-05-23

    Abstract: 本发明提供一种基于多标签序列标注的指代消解方法,包括:S1、将待处理文本分割成预设长度且不重合的多个文本片段;S2、采用预训练模型对每个文本片段进行编码得到每个字符的语义表达;S3、基于每个字符的语义表达分别判断每个字符是否属于B I E标签;S4、基于每个字符对应的标签,在连续I标签序列中,基于预设的组合策略组合任意的BE标签对应的字符构成短语,其中,连续I标签序列表示一个连续的字符序列中的每个字符均具有I标签;S5、计算任意两个短语之间的相似性得分,为每个短语保留与其相似性得分排名靠前的预设个数的短语作为其前置候选短语;S6、采用排序模型将每个短语的前置候选短语进行排序并将得分第一的前置候选短语作为其互指对象。

    一种基于熵的神经机器翻译动态解码方法及系统

    公开(公告)号:CN111428519B

    公开(公告)日:2022-03-29

    申请号:CN202010151246.4

    申请日:2020-03-06

    Abstract: 本发明提出一种基于熵的神经机器翻译动态解码方法及系统,通过分析句子的熵值与BLEU值之间的关系,发现BLEU值高的句子中单词的平均熵值比BLEU值低的句子中单词的平均熵值小,且熵值低的句子的BLEU值普遍比熵值高的句子的BLEU值高。通过计算句子的熵值与BLEU值之间的Pearson系数,发现两者之间存在相关性。因此,本发明提出在训练过程解码阶段的每个时间步,不仅要以一定的概率采样选择真实单词或预测单词获取上下文信息,还要根据上一个时间步的预测结果计算熵值,然后根据熵值动态调整上下文信息的权重。解决了神经机器翻译模型在解码过程中因训练和推断之间的上下文信息差异而导致的错误累积问题。

Patent Agency Ranking