一种文本序列数据中快速查找特征字符串的方法

    公开(公告)号:CN105653567A

    公开(公告)日:2016-06-08

    申请号:CN201410725893.6

    申请日:2014-12-04

    Abstract: 本发明公开了一种文本序列数据中快速查找特征字符串的方法按照如下步骤进行:(1)获取信息中的文本序列,即字符串;(2)生成后缀数组;3)在后缀数组中搜索通过二分查找进行分解,按照后缀矩阵的行数,每行进行查找,若某个字段在二分查找的结果集中出现了指定次数之后,通过计算两个字段的相似度,最接近的字段就认为是个候选字段。本发明有效的利用了序列中的原有数据的优势,避免了LSH算法仅局限于无序的数据,导致数据分析繁琐,速度慢的问题。另外,本发明进行模糊查询后直接进行删选,计算相似度直接过滤候选部分,解决了相似段搜索算法要求子序列必须完全匹配的问题。

    一种基于丰富本体的多文档挖掘灾难管理方法

    公开(公告)号:CN105573976A

    公开(公告)日:2016-05-11

    申请号:CN201410521099.X

    申请日:2014-10-08

    Abstract: 本发明涉及一种基于丰富本体的进行灾难管理的方法,该管理方法以丰富本体为基础,包括语句映射、子模型建模和语句筛选三个步骤,1)语句映射的步骤:将某一领域的文档划分成多条语句,将多条语句映射到相应本体的层次结构中,经专家为该层次结构指定关键字用于语句映射;2)子模型建模的步骤:将子模函数应用于贪心算法中,顺序地从给定语句集中选取语句;3)语句筛选的步骤:采用贪心算法来从原始文档中提取长语句。相比传统基于单个术语的挖掘效率较低,本发明提出的基于丰富本体的多文档挖掘灾难管理方法更具竞争力。

    一种数据库动态查询表单的生成方法

    公开(公告)号:CN105320700A

    公开(公告)日:2016-02-10

    申请号:CN201410379783.9

    申请日:2014-08-05

    Abstract: 本发明提出一种数据库动态查询表单的生成方法,它为庞大而复杂的数据库查询提供了一种解决方法。它提出了以一个包含数据库中极少数主要属性的基本查询表单开始,通过用户与系统的交互,系统捕捉用户的偏好,从而计算每个表单组件的得分,按得分的降序排列为用户提供一个组件的排名列表,用户可以选择相应的组件来增强和完善查询表单。此过程是迭代进行的,直到用户对查询结果感到满意。本发明可以让用户自定义查询表单,能快速的从数据库中检索到想要的查询结果。

    一种挖掘时序相关事件之间的距离的方法

    公开(公告)号:CN105279179A

    公开(公告)日:2016-01-27

    申请号:CN201410317992.0

    申请日:2014-07-07

    Abstract: 本发明公开了一种挖掘时序相关事件之间的距离的方法,其包括步骤如下:1)构造一个排序表作为基础,此排序表是包含一系列有序整数数组的有序链表;2)把一个时间间隔存储到排序表的一个结点中,其中,,i和j是1到N之间的一个整数;3)在结点上连接两个数组,两个数组分别是是i和j的集合,即A和B的指数;4)记为链表的第i个结点,在中存储时间间隔记为;5)在链表上选取子段表示时序相关事件之间的距离,任何合理的距离都可以表示为一个链表的子段。本发明提出的两种算法和可以在两个相关类型的对象中找到合理的时间间隔,可以有效地处理有着特殊属性的不同数据,且具有有效性和高效率。

    一种新闻推荐系统
    5.
    发明公开

    公开(公告)号:CN105447013A

    公开(公告)日:2016-03-30

    申请号:CN201410403378.6

    申请日:2014-08-18

    Abstract: 本发明公开了一种基于超图(Hypergraph)技术的新闻推荐系统,包括用户历史数据的挖掘,数据相关性的分析,以及对特征数据的排名,所述的数据相关性分析通过挖掘短语之间的内在关系,构建一个新的个性化的新闻推荐超图模型,在超图模型中,节点表示短语,边表示短语与短语之间的某种内在联系,边的权值用来表示这种关联的贡献度。本发明使用超图模型来表示读者、文章、主题和命名实体之间的内在关联;通过分割超图模型,建立一种细粒度的新闻选择框架;在特定的子超图模型中利用直推式方法解决了冷启动问题。

    基于多视角图中最小权重连通决定集的Web信息提取方法

    公开(公告)号:CN105447026A

    公开(公告)日:2016-03-30

    申请号:CN201410426746.9

    申请日:2014-08-27

    Abstract: 本发明公开了一种基于多视角图中最小权重连通决定集的Web信息提取方法,集成了文本,图像和时间信息,通过将问题转化为基于图的优化问题并通过对该问题的求解生成以故事轴为基础的摘要以反映给定主题的事件演变过程。其优势在于:(1)本发明提出的方法结合了图像和文本处理,以改善语义分析,并向读者提供生动的图示摘要。(2)我们将问题转化为基于图的优化问题并利用高效的启发式方法解决该问题。(3)生成的故事轴同时实现了时间上的连续性和内容上的连贯性,提高了检索的速度,向读者提供了更丰富的信息和更好的结果。

    一种基于双向选择的推荐框架

    公开(公告)号:CN105279180A

    公开(公告)日:2016-01-27

    申请号:CN201410317999.2

    申请日:2014-07-07

    Abstract: 本发明公开了一种基于双向选择的推荐框架。该框架由三部分组成,分别是:框架的建立及更新、二分图的分区和推荐推理。本发明提出了将用户的相关属性用一个二分图来表示,分为自身属性和全局属性。自身属性记录的是用户的共同爱好,而全局属性管理的是整个交互网络的质量。通过两个真实数据集(网上约会和在线招聘)的实证评价,很好的证明了与现有的算法相比,我们提出的框架的有效性。

Patent Agency Ranking