一种基于深层卷积神经网络的自然语言问答方法

    公开(公告)号:CN107832326A

    公开(公告)日:2018-03-23

    申请号:CN201710841026.2

    申请日:2017-09-18

    Applicant: 北京大学

    CPC classification number: G06F17/30654 G06F17/2785 G06N3/0454

    Abstract: 本发明公开一种基于深层卷积神经网络的自然语言问答方法。该方法包括以下步骤:1)将自然语言问题和数据库信息集中的信息表示成具有序列结构的向量,并形成向量矩阵;2)采用深层卷积神经网络对向量矩阵进行处理,提取对应的深层语义特征;3)根据深层语义特征计算自然语言问题与数据库信息集中的信息的语义相关度;4)根据计算得出的语义相关度选择数据库信息集中的信息,生成自然语言问题的回答。本发明可以更好地提取深层概括的语义特征,精准定位支持数据信息,从而可以取得更好的自然语言问答效果。

    一种面向多源网络百科的知识库构建方法

    公开(公告)号:CN107239481A

    公开(公告)日:2017-10-10

    申请号:CN201710236165.2

    申请日:2017-04-12

    Applicant: 北京大学

    Abstract: 本发明公开了一种面向多源网络百科的知识库构建方法。本方法为:1)从设定的若干网络百科抓取页面,并从抓取的每一页面中抽取页面的类别信息;2)基于类别信息构建类别树,并将类别信息和类别树对应,形成知识库的类别体系;提取每个网络百科对应页面的别名信息构建该网络百科的概念词典;3)对抓取的页面进行去重,得到知识库的概念集合;4)从页面集合中每一页面的页面信息框和正文中抽取三元组信息;5)将三元组中的客体转换成标准格式,然后根据得到的标准化三元组和类别体系建立知识库。本发明不仅可以输出实体的类别体系,还可以对三元组中的实体进行链接,得到高质量的三元组知识,适用于多个网络百科混合生成知识库的需求。

    一种基于本体结构的个性化推荐方法

    公开(公告)号:CN103150667B

    公开(公告)日:2016-06-15

    申请号:CN201310082157.9

    申请日:2013-03-14

    Applicant: 北京大学

    Abstract: 本发明涉及一种基于本体结构的个性化推荐方法,步骤包括:1)根据本体结构组成一概念词典;2)将待推荐物品按照概念词典进行分词,将分词结果中的每一个词条在所述本体结构的对应节点位置标记为该物品;3)在设定的时间内将用户浏览过的物品集合表示为用户的兴趣内容,用概念词典对用户兴趣内容进行分词,并将分词结果中的每一个词条在所述本体结构的对应节点位置标记为该用户;4)根据本体相似度计算模型,对待推荐物品和用户兴趣内容的相似度进行计算,推荐相似度最大的n个物品或相似度大于一设定阈值的物品给用户。本发明提高推荐的准确性,克服了传统推荐方法的不足。

    一种知识点关联方法及系统

    公开(公告)号:CN104794168A

    公开(公告)日:2015-07-22

    申请号:CN201510145575.7

    申请日:2015-03-30

    Abstract: 本发明公开了一种知识点关联方法及系统,属于互联网技术中的数据挖掘领域,包括:获取待加入已有知识体系结构的学科术语,根据待加入学科术语与该领域的已有知识体系结构中的学科术语之间的相似度,确定待加入学科术语在体系结构中的位置,完善已有知识体系结构;获取待提取知识点的语料中的学科术语,并计算每个学科术语的重要度;最后根据学科术语的重要度和其在已有知识体系结构中的位置,计算已有知识体系结构中节点位置的权重,将权重最大的节点位置处的学科术语确定为所述语料的知识点。该方法及系统实现了对已有知识体系结构不断完善,能够为用户匹配出最相关的知识点,以便为用户推荐与所述知识点相关的资源,提高了用户的感知。

    一种基于外存的图数据存储方法及子图查询方法

    公开(公告)号:CN102254012B

    公开(公告)日:2012-11-14

    申请号:CN201110202697.7

    申请日:2011-07-19

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于外存的图数据存储方法及子图查询方法,属于数据库技术领域。本方法为:1)对图数据格式统一为一种标准图数据格式;2)根据图数据中每条边的起点和终点的标签信息,对图中的边进行分类存储并对每类边建立B+-Tree索引;3)按照图数据中每个点上的标签信息,将图中的点划分为若干域,同一域中每一点按标识符顺序依次对应于一位;然后根据边的起点、终点标签信息,为2)中每一类边建立一位图索引;4)对每一类边建立一起点信息数据直方图和一终点信息数据直方图。关于子图查询,首先对对查询子图进行分解,然后将分解出的子模块进行查询并将查询结果进行整合。本发明具有查询效率高、可扩展性好的特点。

    一种基于外存的图数据存储方法及子图查询方法

    公开(公告)号:CN102254012A

    公开(公告)日:2011-11-23

    申请号:CN201110202697.7

    申请日:2011-07-19

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于外存的图数据存储方法及子图查询方法,属于数据库技术领域。本方法为:1)对图数据格式统一为一种标准图数据格式;2)根据图数据中每条边的起点和终点的标签信息,对图中的边进行分类存储并对每类边建立B+-Tree索引;3)按照图数据中每个点上的标签信息,将图中的点划分为若干域,同一域中每一点按标识符顺序依次对应于一位;然后根据边的起点、终点标签信息,为2)中每一类边建立一位图索引;4)对每一类边建立一起点信息数据直方图和一终点信息数据直方图。关于子图查询,首先对对查询子图进行分解,然后将分解出的子模块进行查询并将查询结果进行整合。本发明具有查询效率高、可扩展性好的特点。

    一种文档页面显示方法及系统

    公开(公告)号:CN101424998B

    公开(公告)日:2011-02-02

    申请号:CN200810226244.6

    申请日:2008-11-10

    Abstract: 本发明公开了一种文档页面显示方法及系统,包括:对文档页面划分阅读焦点区域;生成与阅读焦点区域对应的导引信息,导引信息包含阅读焦点区域所在文档页面的页号、在文档页面中的位置和显示方式信息;发送文档页面和导引信息给终端;终端根据导引信息中包含的阅读焦点区域所在文档页面的页号和在文档页面中的位置,在文档页面中确定出对应的阅读焦点区域,并采用阅读焦点区域的显示方式显示阅读焦点区域。达到在显示文档时保持原有版面和操作方便的目的,并且可以显示复杂版面文档。

    一种文档页面显示方法及系统

    公开(公告)号:CN101424998A

    公开(公告)日:2009-05-06

    申请号:CN200810226244.6

    申请日:2008-11-10

    Abstract: 本发明公开了一种文档页面显示方法及系统,包括:对文档页面划分阅读焦点区域;生成与阅读焦点区域对应的导引信息,导引信息包含阅读焦点区域所在文档页面的页号、在文档页面中的位置和显示方式信息;发送文档页面和导引信息给终端;终端根据导引信息中包含的阅读焦点区域所在文档页面的页号和在文档页面中的位置,在文档页面中确定出对应的阅读焦点区域,并采用阅读焦点区域的显示方式显示阅读焦点区域。达到在显示文档时保持原有版面和操作方便的目的,并且可以显示复杂版面文档。

    一种广告嵌入和显示方法及装置

    公开(公告)号:CN101404080A

    公开(公告)日:2009-04-08

    申请号:CN200810225628.6

    申请日:2008-10-31

    Abstract: 本发明公开了一种广告嵌入和显示方法及装置,该方法包括:确定数字内容中能够插入广告的空白位置;根据所述空白位置选择广告类型;根据所述广告类型及相应的广告内容生成广告预置信息;将所述广告预置信息嵌入所述数字内容的文档描述语言中相应位置处,得到数字内容数据。当阅读数字内容时,解析出数字内容数据中的文档描述语言中包含的广告预置信息;根据所述广告预置信息确定广告类型和对应的广告内容;根据所述广告类型确定在数字内容中显示广告的位置信息;根据确定出的所述位置信息,在数字内容中的相应位置显示所述广告内容给用户。该方法充分利用数字内容中的空白位置嵌入及显示广告,避免了影响用户正常阅读数字内容。

Patent Agency Ranking