一种基于对比学习的交叉双塔结构答案选择方法

    公开(公告)号:CN117648469A

    公开(公告)日:2024-03-05

    申请号:CN202311529517.5

    申请日:2023-11-16

    Abstract: 本发明公开了一种基于对比学习的交叉双塔结构答案选择方法,属于自然语言处理领域。该方法以学习不同粒度的通用对话表征为目标,将对话表征应用于面向电商平台产品问答的答案选择任务。设计模型采用交叉双塔结构分别处理问答对话中的上下文语句,通过数据增强操作得到语句的不同编码表示,建立正样例,对比学习损失能够间接融合双塔所编码的信息,完成对句子级与对话级特征的建模。此外,加入掩码语言模型训练模式,以融入字符级特征。模型在大型对话语料库上进行训练,精准的对话表征可直接迁移应用于下游的答案排序选择任务,能够缓解面向电商平台的检索类型问答任务所面临的数据稀疏问题。

    一种基于对抗蒸馏技术的图像识别模型压缩方法

    公开(公告)号:CN114170332A

    公开(公告)日:2022-03-11

    申请号:CN202111426701.8

    申请日:2021-11-27

    Abstract: 本发明公开了一种基于对抗蒸馏技术的图像识别模型压缩方法,属于计算机视觉领域。本发明将对抗学习思想引入知识蒸馏中,采用对抗生成网络(GAN)作为框架。将生成器映射为学生模型,真实样本映射为教师模型的知识来进行循环对抗训练。具体包括:采集图像识别数据集并进行类别标注;利用GAN生成图片数据集;选取教师模型并进行训练;采用优化或浓缩小型网络版本选取学生模型;对知识类型进行选取;引入对抗蒸馏算法训练学生模型;实现图像识别任务,解决网络模型参数量大,计算效率低的问题。

    一种基于多层级文本表示及模型融合的用户画像生成方法

    公开(公告)号:CN113486143A

    公开(公告)日:2021-10-08

    申请号:CN202110569271.9

    申请日:2021-05-25

    Abstract: 本发明公开了一种基于多层级文本表示及模型融合的用户画像生成方法,利用真实用户的互联网搜索文本,通过文本预处理,分别从不同层级提取文本特征,经不同的神经网络分类,最后将各神经网络预测出的分类结果经二级分类器进行二次分类,以此实现用户特征画像。将真实用户的互联网搜索数据进行分词,分别生成单词级的向量表示,子词级向量表示和字符级向量表示,分别作为输入传入不同的深度神经网络进行分类,每个神经网络分类器的训练阶段皆使用k折交叉验证的方法,最后将每个一级分类模型得到的训练数据和测试数据的预测结果各自进行拼接,作为二级分类器的训练数据和测试数据进行再次分类,实现对互联网用户的准确画像。

Patent Agency Ranking