一种基于卷积神经网络的属性抽取方法

    公开(公告)号:CN106570148B

    公开(公告)日:2019-07-23

    申请号:CN201610968810.5

    申请日:2016-10-27

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于卷积神经网络的属性抽取方法。包括如下步骤:(1)构建外部知识库;(2)获取文本数据;(3)使用远程监督方法获取包含属性的句子;(4)利用词向量方法获取句子进行向量化;(5)将句子输入卷积神经网络,进行训练和分类。本发明结合远程监督和卷积神经网络模型,利用外部知识库,基于人工定义的映射,在非结构化的文本数据集上提取包含属性候选句,结合卷积神经网络模型,对句子关系进行分类,完成属性抽取任务。

    一种基于知识库特征抽取的命名实体链接方法

    公开(公告)号:CN108304552A

    公开(公告)日:2018-07-20

    申请号:CN201810102597.9

    申请日:2018-02-01

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于知识库特征抽取的命名实体链接方法。该方法包括如下步骤:(1)从Freebase data dump中抽取具有指定特征的三元组条目,形成关系数据表,存入知识库;(2)设计复杂的规则,在知识库中搜寻若干个与实体提及关系紧密的Freebase Object作为候选实体;(3)采用基于统计的方法,设计并抽取实体提及与其候选实体的特征,并对上述特征进行Embedding化;(4)将抽取特征的Embedding作为一个多层的神经网络的输入,获取每个候选实体为目标实体的概率,并返回概率最高的候选实体的Freebase MID。本发明结合了基于复杂规则的候选生成技术和基于统计学习的候选排序技术,针对特定类型的命名实体,建立了一套适用于实体链接的处理框架,方便用户使用批处理的方式获取实体链接的结果。

    一种基于地理信息的层次化视觉特征提取方法

    公开(公告)号:CN104484347B

    公开(公告)日:2018-06-05

    申请号:CN201410706281.2

    申请日:2014-11-28

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于地理信息的层次化视觉特征提取方法。包括如下步骤:1)编写爬虫程序下载照片分享网站中的图像及其地理信息;2)利用图像词袋模型表达图像特征;3)结合地理信息,应用半监督主题建模方法将图像视觉单词按照视觉主题的形式组织起来;4)挖掘视觉主题的层次化特性,获取在不同尺度和侧面对特定地理位置进行描述的视觉特征;5)利用获取的层次化视觉特征,对图像进行聚类、分类和检索。本发明结合层次化主题建模和半监督学习,将图像高维视觉单词凝练成具有代表性的视觉主题,并将地理信息引入主题建模过程中,学习得到一个层次化视觉主题模型,将图像表示成多个视觉主题上的分布,据此获得了更具有语义表达能力的层次化视觉特征。

    一种基于深度神经网络的跨媒体排序方法

    公开(公告)号:CN104317834B

    公开(公告)日:2017-09-29

    申请号:CN201410531101.1

    申请日:2014-10-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于深度神经网络的跨媒体排序方法。包括如下步骤:1)将文本检索图像的排序样本或图像检索文本的排序样本构建为训练样本;2)对构建得到的训练样本进行基于深度神经网络的跨媒体排序学习,得到多媒体语义空间以及跨媒体排序模型;3)使用学习得到的跨媒体排序模型进行跨媒体检索。本发明由于使用了跨媒体排序数据驱动的深度神经网络,因此得到的检索模型的语义理解能力更强,在图像检索文本或文本检索图像中所取得性能较传统的浅层模型方法更好。

    一种层次化新闻热点及其演化的挖掘与可视化方法

    公开(公告)号:CN106951554A

    公开(公告)日:2017-07-14

    申请号:CN201710198955.6

    申请日:2017-03-29

    Applicant: 浙江大学

    Abstract: 本发明公开了一种层次化新闻热点及其演化的挖掘与可视化方法。包括如下步骤:1).利用概率主题建模技术挖掘由抽象到具体的具有层次化结构的新闻热点。2).提出全新的“Nested‑circle”可视化布局对层次化的新闻热点进行可视化。3).利用相对熵方法挖掘相邻时间片同一粒度的层次化新闻热点的关联性,即新闻热点在时序上的演化行为。4).采用动态可视化技术呈现新闻热点在时序上的演化行为。5).结合上述层次化新闻热点及其演化的挖掘与可视化技术,集成了“层次化新闻热点及其演化的分析系统”,方便读者分析层次化新闻热点及其演化。

    一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法

    公开(公告)号:CN106569998A

    公开(公告)日:2017-04-19

    申请号:CN201610959519.1

    申请日:2016-10-27

    Applicant: 浙江大学

    CPC classification number: G06F17/278 G06N3/08

    Abstract: 本发明公开了一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法。该方法包括如下步骤:(1)利用卷积神经网络对文本单词字符层面的信息进行编码转换成字符向量;(2)将字符向量与词向量进行组合并作为输入传到双向LSTM神经网络来对每个单词的上下文信息进行建模;(3)在LSTM神经网络的输出端,利用连续的条件随机场来对整个句子进行标签解码,并标注句子中的实体。本发明是一个端到端的模型,不需要未标注语料集中除预训练好的词向量之外的数据预处理,因此本发明能在不同的语言和领域的语句标注中有广泛应用。

    基于隐结构学习的图像摘要生成方法

    公开(公告)号:CN103530656B

    公开(公告)日:2017-01-11

    申请号:CN201310410623.1

    申请日:2013-09-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于隐结构学习的图像摘要生成方法。它包括如下步骤:1)对图片提取HSV颜色直方图特征、视觉单词特征以及方向直方图特征;2)对上一步提取的三种特征进行归一化的预处理并在归一化后将三种特征融合为一个特征向量;3)构造一个带有隐变量的结构支持向量机,从数据库中多次选取训练集合,并利用训练集中不同主题相关的图片集合进行权重系数学习;4)利用上一步学习得到的权重系数,从数据库中选取不同主题相关的图片集,预测出它们的隐含的特征选择偏好并生成与之对应的摘要图片集合。本发明具有更高的信息覆盖率和更低的冗余度可以隐式地学习出不同主题相关的图片集合在特征选择上的不同偏好,比传统的方法取得更好效果。

    一种基于主题建模的多粒度情感分析方法

    公开(公告)号:CN104462408A

    公开(公告)日:2015-03-25

    申请号:CN201410766559.5

    申请日:2014-12-12

    Applicant: 浙江大学

    CPC classification number: G06F16/951 G06F17/2785 G06Q50/01

    Abstract: 本发明公开了一种基于主题建模的多粒度情感分析方法,包括如下步骤:提取社交媒体文本数据库中所有数据的单词和单词特征;训练得到核心模型;根据用户的查询请求从社交媒体文本数据库中得到搜索结果;根据系统自动设定或用户指定的参数,确定主题建模中需要的主题数目和细粒度情感数目;随机地将某个主题和某个细粒度情感分配给每一个单词;计算所有单词所属主题和细粒度情感以及所查询文档表达粗粒度情感,并将结果反馈给用户。本发明具有的有益效果有:可对社交网络文本数据同时进行主题建模与多粒度情感分析;可在单词特征与单词所表达细粒度情感之间建立起关联度,为用户理解数据提供帮助。

    基于最大间隔张量学习的高维多媒体数据分类方法

    公开(公告)号:CN103473308A

    公开(公告)日:2013-12-25

    申请号:CN201310410604.9

    申请日:2013-09-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于最大间隔张量学习的高维多媒体数据分类方法。它包括如下步骤:1)建立多媒体数据的训练数据集;2)对训练数据集建模,进行分析,得到分类模型;3)根据用户查询数据集及分类模型,对查询数据集分类。本发明针对多媒体的高维性和结构性,利用张量来表达多媒体数据,并通过最大间隔分类器的方法,对高维的多媒体数据进行分类。在对多媒体数据进行分解分析的同时完成分类,不仅保留了多媒体数据中的结构信息,而且避免了传统的通过拼合的方法产生的高维数据所引发的“维数灾难”,因此比传统的多媒体数据分类方法更加准确,并易于计算。

    一种基于ContextFS上下文文件系统的文件服务方法

    公开(公告)号:CN101082927A

    公开(公告)日:2007-12-05

    申请号:CN200710069837.1

    申请日:2007-07-02

    Applicant: 浙江大学

    Abstract: 本发明涉及一种基于ContextFS上下文文件系统的文件服务方法,主要包括如下步骤:利用空间中或用户随身携带的各种可计算设备和传感器获得用户在空间中的上下文信息,并确定用户的身份;根据用户历史操作或自定义偏好的历史数据来确定该用户的偏好上下文;根据文件系统中的文件元数据和上下文信息组织构建虚拟目录与虚拟文件;当用户访问虚拟目录与虚拟文件时,用户和环境上下文信息被文件系统记录并和文件语义信息一同保存并发给上下文文件系统。本发明有益的效果是:本发明是一种以主动服务为特性,利用上下文驱动目录、文件组织的分布式文件系统,它能够根据获得的上下文,与本地文件系统中文件的元数据,来重新组织生成虚拟目录与虚拟文件。

Patent Agency Ranking