一种基于高分散哈希算法的数据采集策略方法及装置

    公开(公告)号:CN105208075B

    公开(公告)日:2018-07-31

    申请号:CN201510492674.2

    申请日:2015-08-12

    Abstract: 种基于高分散哈希算法的数据采集策略方法及装置,该装置包括用户行为采集模块、时间种子生成器、哈希回传时间生成器、时间校正器、定时服务模块、数据传输模块、文件缓存模块、后台接收服务模块;该装置将高分散性哈希算法引入,计算合理的回传时间;数据传输模块及数据加密器等用于将数据进行加密后传输;文件缓存、传输计数器、启动计数器等用于测算数据传输成功率。本发明利用高分散性哈希算法的天然特质,在对实时性要求不高的移动互联网数据采集系统中,有效的将大量的设备发送请求进行了分散疏导,合理的利用服务器的资源情况,将其服务能力平均化,同时也可以将数据回传的延时降到最低,实现系统的均衡、稳定的目标。

    基于模板自动生成新闻的系统和方法

    公开(公告)号:CN106021389A

    公开(公告)日:2016-10-12

    申请号:CN201610312962.X

    申请日:2016-05-12

    Abstract: 基于模板自动生成新闻的系统和方法,新闻事件日志库、新闻文章模板库、规则库组成该系统的数据库,新闻事件日志库通过选定事件日志与统计数据生成器连接,统计数据生成器分别与模板选择器、自然语言生成进行交互,自然语言生成与年报生成模块进行交互,统计数据生成器与模板选择器相交互,新闻文章模板库、模板选择器与年报生成模块相连接,年报生成模块与数据库进行连接。其实现方法的具体步骤阐述如下,建立年报日志库:建立模板库:建立规则库、选择模板、建立统计数据库、自然语言生成、年报生成;与现有技术相比,在新闻写作行业减轻了双手的劳动量,同时也提高了新闻报道的效率,为新闻发展提供了里程碑性的改革。

    一种结合聚类和双key值的高维向量检索方法

    公开(公告)号:CN103500165B

    公开(公告)日:2016-08-31

    申请号:CN201310365592.2

    申请日:2013-08-21

    Abstract: 本发明是一种结合聚类和双key值的高维向量检索方法。在本发明中,提出了一种结合聚类的双key值索引结构CDKB?tree,它首先采用聚类算法对高维向量集进行簇划分,然后为各簇数据构建双key值扩展B+?tree,形成CDKB?tree。进行检索时,只需对与查询范围相交的簇数据进行搜索,通过聚类实现第一次过滤,并通过主key和辅key(双key值),实现两次key值过滤,只需对主key和辅key均在搜索范围内的那些高维向量与查询向量间进行相似度匹配计算。本发明提出的索引结构通过聚类及简单的双key值大小比较,大大地减少了相似度匹配的运算量,极大地加快了检索速度。

    一种结合聚类和双key值的高维向量检索方法

    公开(公告)号:CN103500165A

    公开(公告)日:2014-01-08

    申请号:CN201310365592.2

    申请日:2013-08-21

    CPC classification number: G06F16/43 G06F16/41

    Abstract: 本发明是一种结合聚类和双key值的高维向量检索方法。在本发明中,提出了一种结合聚类的双key值索引结构CDKB-tree,它首先采用聚类算法对高维向量集进行簇划分,然后为各簇数据构建双key值扩展B+-tree,形成CDKB-tree。进行检索时,只需对与查询范围相交的簇数据进行搜索,通过聚类实现第一次过滤,并通过主key和辅key(双key值),实现两次key值过滤,只需对主key和辅key均在搜索范围内的那些高维向量与查询向量间进行相似度匹配计算。本发明提出的索引结构通过聚类及简单的双key值大小比较,大大地减少了相似度匹配的运算量,极大地加快了检索速度。

    一种基于高分散哈希算法的数据采集策略方法及装置

    公开(公告)号:CN105208075A

    公开(公告)日:2015-12-30

    申请号:CN201510492674.2

    申请日:2015-08-12

    CPC classification number: H04L67/2842 H04L9/0643

    Abstract: 一种基于高分散哈希算法的数据采集策略方法及装置,该装置包括用户行为采集模块、时间种子生成器、哈希回传时间生成器、时间校正器、定时服务模块、数据传输模块、文件缓存模块、后台接收服务模块;该装置将高分散性哈希算法引入,计算合理的回传时间;数据传输模块及数据加密器等用于将数据进行加密后传输;文件缓存、传输计数器、启动计数器等用于测算数据传输成功率。本发明利用高分散性哈希算法的天然特质,在对实时性要求不高的移动互联网数据采集系统中,有效的将大量的设备发送请求进行了分散疏导,合理的利用服务器的资源情况,将其服务能力平均化,同时也可以将数据回传的延时降到最低,实现系统的均衡、稳定的目标。

    基于语义标签库的多维度内容标注方法

    公开(公告)号:CN102982076B

    公开(公告)日:2015-08-19

    申请号:CN201210424525.9

    申请日:2012-10-30

    Abstract: 本发明公开了一种基于语义标签库的多维度内容标注方法,包括:建立语义标签库;配置可扩展的资源种类;建立多级、可配置的内容标注维度;将资源按照内容特征划分维度,建立多层次的内容维度;建立可配置、可修改的资源种类与内容标注维度的对应关系;进行基于语义标签库的资源内容标注;临时标签处理;基于语义标签库的资源检索;用户输入检索词,系统自动在扩展标签库中进行匹配:如果匹配成功,系统根据对应的标签标注码来检索对应图片;如果匹配不成功,系统可将检索词与资源描述信息进行匹配,同时系统将该检索词存入临时标签库。有效的提高了资源标注的精确度和效率,为资源检索和数据分析奠定了良好的基础。

    结合聚类和街区距离的高维向量搜索方法

    公开(公告)号:CN103514264A

    公开(公告)日:2014-01-15

    申请号:CN201310365384.2

    申请日:2013-08-21

    CPC classification number: G06F17/3002 G06F17/30029

    Abstract: 本发明是结合聚类和街区距离的高维向量搜索方法。在本发明中,提出了一种结合聚类和街区距离的索引结构CBlockB-tree,它首先采用聚类算法对高维向量集进行簇划分,然后为各簇数据构建BlockB-tree,形成CBlockB-tree。该索引结构进行检索时,通过聚类能过滤一部分与查询区域不相交的簇数据,通过高维到一维转换后的key值比较,能进一步减少最终向量相似度匹配的运算量,加快高维向量的搜索速度。同时,该索引结构能够有效支持简单高效的街区距离进行匹配搜索。

    基于语义标签库的多维度内容标注方法

    公开(公告)号:CN102982076A

    公开(公告)日:2013-03-20

    申请号:CN201210424525.9

    申请日:2012-10-30

    Abstract: 本发明公开了一种基于语义标签库的多维度内容标注方法,包括:建立语义标签库;配置可扩展的资源种类;建立多级、可配置的内容标注维度;将资源按照内容特征划分维度,建立多层次的内容维度;建立可配置、可修改的资源种类与内容标注维度的对应关系;进行基于语义标签库的资源内容标注;临时标签处理;基于语义标签库的资源检索;用户输入检索词,系统自动在扩展标签库中进行匹配:如果匹配成功,系统根据对应的标签标注码来检索对应图片;如果匹配不成功,系统可将检索词与资源描述信息进行匹配,同时系统将该检索词存入临时标签库。有效的提高了资源标注的精确度和效率,为资源检索和数据分析奠定了良好的基础。

Patent Agency Ranking