一种基于商品方面对齐的抽象式评论摘要生成方法

    公开(公告)号:CN111930930A

    公开(公告)日:2020-11-13

    申请号:CN202010663601.6

    申请日:2020-07-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于商品方面对齐的抽象式评论摘要生成方法,包括:(1)获取商品评论数据,对商品下的评论进行划分,筛选出低质量评论和高质量评论,并用方面对齐的方式将筛选出的评论构建成多评论摘要数据集;(2)建立一个序列模型,所述的序列模型包含基于循环神经网络的编码器、解码器和注意力机制;同时加入基于方面的注意力机制;(3)利用多评论摘要数据集对序列模型进行训练,直到模型收敛;(4)使用训练好的模型进行评论摘要生成任务,输入商品的评论后,自动生成摘要。利用本发明,能够高效地构造(评论集,摘要)对用于神经网络模型训练,大大地降低了人工标注的成本;训练出来的模型够生成高质量的多评论摘要。

    一种基于强化双通道序列学习的对话回复生成方法及系统

    公开(公告)号:CN108763504B

    公开(公告)日:2020-07-24

    申请号:CN201810539095.2

    申请日:2018-05-30

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于强化双通道序列学习的对话回复生成方法及系统,本发明方法的步骤如下:(1)对上下文进行建模,获取上下文语义向量;(2)利用编码器将当前对话和上下文语义向量结合学习,得到当前对话向量以及编码器向量;(3)将上下文语义向量和当前对话向量输入解码器,得到第一通道对话回复草稿以及解码器向量;(4)将编码器向量与解码器向量以及第一通道对话回复草稿输入润饰器进行润饰,生成第二通道经过润饰的对话回复;(5)利用强化学习算法优化目标函数;(6)模型训练完毕,生成对话回复并输出。利用本发明,可以使对话生成模型对全局信息的把握更加深入,生成更加符合对话场景的有实质性内容的回复。

    一种基于循环空间转换网络的人脸漫画生成方法

    公开(公告)号:CN110415308A

    公开(公告)日:2019-11-05

    申请号:CN201910542411.6

    申请日:2019-06-21

    Applicant: 浙江大学

    Inventor: 储文青 蔡登

    Abstract: 本发明公开了一种基于循环空间转换网络的人脸漫画生成方法,包括:(1)选择训练数据集,分析数据集中的照片和人脸漫画部分,获取人脸的关键点信息;(2)根据人脸的关键点信息,建立基于循环空间转换网络的空间转换模型;(3)对空间转换模型进行训练和测试;(4)建立照片和人脸漫画之间的纹理转换模型,并进行训练优化;(5)将待转换的照片输入训练好的空间转换模型,并将空间转换结果送入纹理转换模型,最终得到高质量的人脸漫画。利用本发明,可以使得生成的人脸漫画不仅在几何结构上具有夸张化的效果,同时在纹理色彩上也具有艺术化的风格,极大地提升了美观性和趣味性。

    一种基于卷积长短时记忆网络的渐进迁移学习方法

    公开(公告)号:CN110334743A

    公开(公告)日:2019-10-15

    申请号:CN201910496327.5

    申请日:2019-06-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于卷积长短时记忆网络的渐进迁移学习方法,包括:(1)选择经过预训练后的基础网络模型;(2)基于批相关卷积单元构建一个旁枝网络,将旁枝网络与预训练后的基础网络相结合构成渐进迁移学习网络;所述旁枝网络中的每一层批相关卷积单元对应于基础网络中的一个卷积单元;基础网络中的卷积单元的输出在输入到下一层卷积单元的同时输入到旁枝网络中的批相关卷积单元中;(3)对渐进迁移学习网络进行训练,训练过程使用随机梯度下降算法和交叉熵损失函数;(4)训练结束,对训练得到的模型进行行人重识别应用。利用本发明,可以缓解批数据数据分布与数据集整体分布差异导致的模型微调效果不佳的问题。

    一种基于双层锚点图投影优化的高维向量数据可视化方法及系统

    公开(公告)号:CN110188098A

    公开(公告)日:2019-08-30

    申请号:CN201910343325.2

    申请日:2019-04-26

    Applicant: 浙江大学

    Inventor: 付聪 张永辉 蔡登

    Abstract: 本发明公开了一种基于双层锚点图投影优化的高维向量数据可视化方法及系统,其中,具体方法包括:(1)对原始高维向量数据集D进行K-means聚类,将得到的聚类中心作为锚点集合A;(2)根据锚点集合A建立高维向量数据的倒排索引;(3)使用倒排索引建立数据集D的近似kD近邻图GD;(4)针对数据集D中的每个点d,暴力搜索距离d最近的c个锚点,并将这c个锚点作为d的邻居更新到近邻图GD;(5)在锚点集合A上用暴力检索方式构建kA近邻图GA;(6)基于GD和GA所表示成的高维空间数据结构信息,使用双层投影优化算法产生低维空间可视化投影。利用本发明,可以将高维空间中的全局宏观和局部微观结构信息一并保留,得到高质量的布局信息。

    一种基于条件随机场结构化注意力网络的对话行为识别方法及系统

    公开(公告)号:CN108829662A

    公开(公告)日:2018-11-16

    申请号:CN201810443182.8

    申请日:2018-05-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于条件随机场结构化注意力网络的对话行为识别方法及系统,其中识别方法包括以下步骤:(1)结合记忆网络,将对话语义信息按照单词层、句子层、对话层进行分层推理,语义建模;(2)应用结构化注意力网络,根据对话内容之间的相关性,对对话内容进行结构小节划分;(3)将得到的结构化信息应用于线性条件随机场算法上,根据上下文语境预测当前对话行为。通过本发明,可以深度捕捉对话交互过程中的上下文信息,并能够做到动态划分对话内容的片段,通过将结构化注意力网络与条件随机场算法相结合,可以进一步提高对话行为识别准确度。

    一种使用多层注意力网络机制解决视频问答的方法

    公开(公告)号:CN107766447A

    公开(公告)日:2018-03-06

    申请号:CN201710874931.8

    申请日:2017-09-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种利用多层注意力网络机制解决视频问答的方法。主要包括如下步骤:1)针对于一组视频,利用预训练好的卷积神经网络,获得帧级别及分段级别视频表达。2)使用问题单词级别的注意力网络机制,得到针对问题单词级别的帧级别及分段级别视频表达。3)使用问题级别的时间注意力机制,得到与问题相关的帧级别及分段级别视频表达。4)利用问题级别的融合注意力网络机制,得到问题相关的联合视频表达。5)利用所得联合视频表达,获取针对视频所问问题答案。相比于一般视频问答解决方案,本发明利用多层注意力机制,能够更准确地反映视频和问题特性,产生更加符合的答案。本发明在视频问答中所取得的效果相比于传统方法更好。

    一种基于局部感知野的单卷积神经网络局部信息与全局信息整合方法

    公开(公告)号:CN107679539A

    公开(公告)日:2018-02-09

    申请号:CN201710842145.X

    申请日:2017-09-18

    Applicant: 浙江大学

    Inventor: 文戈 蔡登 何晓飞

    Abstract: 本发明公开了一种基于局部感知野的单卷积神经网络局部信息与全局信息整合方法,包括:步骤1,给定卷积神经网络模型,计算每一层特征图对应在原图中的局部感知野大小;步骤2,依据每一层局部感知野大小,选取一个层分割,以平衡局部信息和全局信息;步骤3,综合考虑信息量与计算量,选取分割方式与分割个数,对选取层的特征图进行分割;步骤4,对分割后的特征图进行维度匹配;步骤5,将选取层后面的所有层,包括损失函数层,叠加到每一个分割后的子特征图之后,进行训练。本发明提出的卷积神经网络改造算法能使得在一个网络模型中同时学习得到局部信息与全局信息,提高网络模型表达能力,同时仅产生较少的计算量增加。

    一种基于镜头边界检测和聚类的视频关键帧提取方法

    公开(公告)号:CN105761263A

    公开(公告)日:2016-07-13

    申请号:CN201610093299.9

    申请日:2016-02-19

    Applicant: 浙江大学

    CPC classification number: G06K9/6223 G06F16/783

    Abstract: 本发明公开了一种基于镜头边界检测和聚类的视频关键帧提取方法,包括:步骤1,读取视频,提取每帧视频的图像特征;步骤2,计算每帧视频与相邻的前一帧视频的图像特征差异;步骤3,运用滑动窗口自适应的方法检测镜头边界;步骤4,对每个镜头利用聚类算法提取关键帧;步骤5,计算关键帧的权重,选取权重较高的若干个关键帧,按时间排序,作为视频关键帧。本发明通过比较各视频帧的图像特征,准确地检测出镜头边界,高效地提取出每个镜头的关键帧,将权重较高的N个关键帧按时间排序后作为视频的关键帧,能够有效的代表整个视频。

Patent Agency Ranking