-
公开(公告)号:CN103488724B
公开(公告)日:2016-09-28
申请号:CN201310420375.9
申请日:2013-09-16
Applicant: 复旦大学
IPC: G06F17/30
Abstract: 本发明属于中文知识库应用技术领域,具体为一种面向图书的阅读领域知识图谱构建方法。该方法分为三个部分:通用知识图谱构建、领域知识图谱构建和智能阅读推荐。即:获取互联网上的知识,集成通用知识图谱;结合通用知识图谱利用迭代的方式扩展书籍相关的概念和实体,结合实体Infobox表和传统关系抽取实体关系;按照实体由长到短标注电子书籍中的核心实体,并建立实体与书籍知识图谱的链接,以实现智能知识推荐。本发明通过建立面向书籍的阅读领域知识图谱,对书籍中的实体进行解释或知识推荐,增加了知识的深度,实现了电子阅读的便捷化、智能化和人性化,具有更好的用户体验。
-
公开(公告)号:CN103488724A
公开(公告)日:2014-01-01
申请号:CN201310420375.9
申请日:2013-09-16
Applicant: 复旦大学
IPC: G06F17/30
Abstract: 本发明属于中文知识库应用技术领域,具体为一种面向图书的阅读领域知识图谱构建方法。该方法分为三个部分:通用知识图谱构建、领域知识图谱构建和智能阅读推荐。即:获取互联网上的知识,集成通用知识图谱;结合通用知识图谱利用迭代的方式扩展书籍相关的概念和实体,结合实体Infobox表和传统关系抽取实体关系;按照实体由长到短标注电子书籍中的核心实体,并建立实体与书籍知识图谱的链接,以实现智能知识推荐。本发明通过建立面向书籍的阅读领域知识图谱,对书籍中的实体进行解释或知识推荐,增加了知识的深度,实现了电子阅读的便捷化、智能化和人性化,具有更好的用户体验。
-
公开(公告)号:CN103902649B
公开(公告)日:2017-01-18
申请号:CN201410052292.3
申请日:2014-02-17
Applicant: 复旦大学
IPC: G06F17/30
Abstract: 本发明属于开放知识抽取技术领域,具体为一种基于在线百科链接实体的知识抽取方法。其通过有效的证据融合方法移除链接实体中的不相关实体,得到高质量的相关链接实体;然后利用Gmeans聚类方法对相关的链接实体做聚类,用基于LCA的类标签生成方法为每个类产生一个描述性的类标签,这样每个类对应的实体集合和类标签构成一组知识;最后,为了提高大数据量实体的聚类效率,使用基于最大生成树的类复用机制,从而极大节约聚类时间。本发明不同于传统的知识抽取方法,其抽取基于在线百科的链接实体,而不是正文内容,极大的避免了自然语言处理方法的计算代价高、错误率高等缺点,可以高效地处理大规模数据。
-
公开(公告)号:CN103902649A
公开(公告)日:2014-07-02
申请号:CN201410052292.3
申请日:2014-02-17
Applicant: 复旦大学
IPC: G06F17/30
Abstract: 本发明属于开放知识抽取技术领域,具体为一种基于在线百科链接实体的知识抽取方法。其通过有效的证据融合方法移除链接实体中的不相关实体,得到高质量的相关链接实体;然后利用Gmeans聚类方法对相关的链接实体做聚类,用基于LCA的类标签生成方法为每个类产生一个描述性的类标签,这样每个类对应的实体集合和类标签构成一组知识;最后,为了提高大数据量实体的聚类效率,使用基于最大生成树的类复用机制,从而极大节约聚类时间。本发明不同于传统的知识抽取方法,其抽取基于在线百科的链接实体,而不是正文内容,极大的避免了自然语言处理方法的计算代价高、错误率高等缺点,可以高效地处理大规模数据。
-
-
-