一种基于多情境嵌入的个性化场所语义识别方法

    公开(公告)号:CN109117476B

    公开(公告)日:2022-04-01

    申请号:CN201810761994.7

    申请日:2018-07-12

    Abstract: 本发明涉及一种基于多情境嵌入的个性化场所语义识别方法,本发明针对传统个性化场所语义识别方法中,情境信息考虑不足以及特征工程的固有局限性问题,提出了一种将个性化场所语义和手机App相关性协同识别的方法。对于个性化场所语义识别,利用深度神经网络得到与之相关的多情境信息(时间、用户、用户活动等)的表示。对于手机App相关性识别,利用词嵌入得到不同手机App的表示。通过共享手机App的表示,对模型参数进行协同训练。本发明结合情境感知和表示学习进行个性化场所语义识别,在普适计算和基于位置的服务(LBS)等领域具有广阔的应用前景。

    一种保留统计级特征属性的身份证号脱敏方法

    公开(公告)号:CN112182654A

    公开(公告)日:2021-01-05

    申请号:CN202011048516.5

    申请日:2020-09-29

    Abstract: 本发明涉及数据处理领域,尤其涉及一种保留统计级特征属性的身份证号脱敏方法,包括以下步骤:身份证号进行分段;分别对地区编码、出生日期、顺序码进行脱敏:获取相同省份下的所有地区编码集和,从集合中获取新的地址编码;获取基准日期与待脱敏出生日期的间隔天数,间隔天数通过转换得到新的间隔天数,新的间隔天数进制转换后与一个随机数进行模运算,得到最终的间隔天数,根据最终的间隔天数得到新的出生日期;通过与一随机整数进行计算得到新的顺序码;根据固定算法得到新的校验码;组合形成新的身份证号。本发明的有益效果在于:采用分段处理机制,可以灵活选择要脱敏的分段信息,同时保持身份证号本身的结构特征和分析价值。

    一种基于GRU的多因素感知短期景区内游客人数预测方法

    公开(公告)号:CN109389244B

    公开(公告)日:2020-08-18

    申请号:CN201811038526.3

    申请日:2018-09-06

    Abstract: 本发明涉及一种基于GRU的多因素感知短期景区内游客人数预测方法,具体实施如下:1)对原始景区数据进行预处理,得到多个时间序列和预测时刻的相关情境信息及其距当前时刻的时刻数;2)利用CNN卷积神经网络提取时间序列的特征向量;利用GRU网络处理CNN提取的特征向量,得到时序特征向量;3)将GRU中得到的时序特征向量和预测时刻的相关情境信息及其距当前时刻的时刻数独热(one‑hot)编码相连接,输入到全连接层中,得到预测时刻景区内游客人数。本发明利用CNN和GRU处理景区多时序数据,并加入预测时刻的相关情境信息及其距当前时刻的时刻数来预测短期景区内游客人数,在智能旅游、流量预测等领域具有广阔的应用前景。

    一种基于副本选择的大数据实时查询系统负载均衡方法

    公开(公告)号:CN103731498B

    公开(公告)日:2017-01-25

    申请号:CN201310755662.5

    申请日:2013-12-31

    Abstract: 本发明涉及计算机数据库处理领域,尤其涉及一种基于副本选择的大数据实时查询系统负载均衡方法,包括节点负载信息收集和节点负载均衡两个过程,节点负载均衡过程包括预处理和选择副本两个阶段。本发明的有益效果:本发明针对现有的大数据实时查询系统负载均衡方法过于简单且不考虑机器当前状态的问题,提出了新的基于副本选择的大数据实时查询系统负载均衡方法,本发明的优点包括:负载均衡效果优于现有的大数据实时查询系统;时间复杂度较小,为O(n2),其中n为块的数目;适用于异构分布式系统和系统中运行其他任务的情况。

    一种基于分组的全局多查询优化方法

    公开(公告)号:CN107133281B

    公开(公告)日:2020-12-15

    申请号:CN201710242819.2

    申请日:2017-04-14

    Abstract: 本发明涉及一种基于分组的全局多查询优化方法,具体实施如下:1)为输入系统的查询语句建立签名;2)根据签名对查询语句进行分组;3)通过对每一分组内的查询计划进行代价估算来进行计划选择;4)将每一分组选择的计划进行合并,最终得到多个全局计划。本发明通过建立查询签名,结合分组思想,确保在最短时间内得到较优全局计划,以此提高多查询优化效率。在大数据背景下的数据统计、数据挖掘、报表生成和联机查询等领域具有广阔的应用前景。

    融合多视图和半监督学习的搜索引擎用户信息需求满意度评估方法

    公开(公告)号:CN105488522B

    公开(公告)日:2018-09-07

    申请号:CN201510824301.0

    申请日:2015-11-23

    Abstract: 本发明涉及融合多视图和半监督学习的搜索引擎用户信息需求满意度评估方法,该方法分为数据预处理、训练子视图满意度模型、对未标注数据分配伪标签、训练基于多视图和半监督学习的用户满意度模型和评估六个阶段,本发明通过半监督学习的方法使用少量标注数据和大量未标注数据来提高评估模型的性能,并引入多视图学习的思想来克服传统的基于单视图的半监督学习方法容易陷入局部最优的问题。有益效果在于:(1)可以在少量的标注数据的情况下,有效地评估搜索引擎的用户信息需求满意度;(2)可以通过使用少量标注数据和大量未标注数据来提高用户满意度模型评估性能;(3)分别从行为和时间的角度来描述用户的搜索过程,通过相互学习来避免模型陷入局部最优。

    基于核函数的融合主动学习和非参半监督聚类的稀有类别检测方法

    公开(公告)号:CN105469118B

    公开(公告)日:2018-07-20

    申请号:CN201510884354.1

    申请日:2015-12-04

    Abstract: 本发明涉及基于核函数的融合主动学习和非参半监督聚类的稀有类别检测方法,本发明针对传统稀有类别检测方法中对已标记数据点利用不充分和需要预先指定类别相关信息的问题,提出了一种基于核函数的融合主动学习和非参半监督聚类的稀有类别检测方法,通过使用非参半监督聚类的方法利用少量标注数据和大量未标注数据来优化数据分布模型,并结合主动学习选择出在所有未标记数据点中最具代表性的异常点提交给专家进行标注,从而减少了稀有类别检测过程中人工标注的工作量,提高了稀有类别检测过程的效率,并且解决了在非线性情况下的稀有类别发现问题。

    一种基于图知识库的分布式信息检索集合选择方法

    公开(公告)号:CN107133274A

    公开(公告)日:2017-09-05

    申请号:CN201710228718.X

    申请日:2017-04-10

    Abstract: 本发明涉及一种基于图知识库的分布式信息检索集合选择方法,主要包括如下步骤:1)采用实体链接方法,从各个集合的样本文档中获取集合的实体词集;2)基于上下文相关度和结构相关度,计算实体词的权重,使用加权的实体词集表示集合的语义信息;3)采用查询扩展方法扩展查询中包含的实体词,并为查询实体词赋予不同的权重;4)采用查询与集合相关度度量方法计算集合评分,选择评分较高的前若干个集合。本发明利用图知识库中蕴含的实体关系和网络结构,使用基于图知识库的集合语义建模方法、查询扩展方法和查询与集合相关度度量方法,提高了集合选择方法的准确度。

    基于核函数的融合主动学习和非参半监督聚类的稀有类别检测方法

    公开(公告)号:CN105469118A

    公开(公告)日:2016-04-06

    申请号:CN201510884354.1

    申请日:2015-12-04

    CPC classification number: G06K9/6218 G06K9/6276

    Abstract: 本发明涉及基于核函数的融合主动学习和非参半监督聚类的稀有类别检测方法,本发明针对传统稀有类别检测方法中对已标记数据点利用不充分和需要预先指定类别相关信息的问题,提出了一种基于核函数的融合主动学习和非参半监督聚类的稀有类别检测方法,通过使用非参半监督聚类的方法利用少量标注数据和大量未标注数据来优化数据分布模型,并结合主动学习选择出在所有未标记数据点中最具代表性的异常点提交给专家进行标注,从而减少了稀有类别检测过程中人工标注的工作量,提高了稀有类别检测过程的效率,并且解决了在非线性情况下的稀有类别发现问题。

Patent Agency Ranking