-
公开(公告)号:CN109117476A
公开(公告)日:2019-01-01
申请号:CN201810761994.7
申请日:2018-07-12
Applicant: 浙江鸿程计算机系统有限公司
IPC: G06F17/27
Abstract: 本发明涉及一种基于多情境嵌入的个性化场所语义识别方法,本发明针对传统个性化场所语义识别方法中,情境信息考虑不足以及特征工程的固有局限性问题,提出了一种将个性化场所语义和手机App相关性协同识别的方法。对于个性化场所语义识别,利用深度神经网络得到与之相关的多情境信息(时间、用户、用户活动等)的表示。对于手机App相关性识别,利用词嵌入得到不同手机App的表示。通过共享手机App的表示,对模型参数进行协同训练。本发明结合情境感知和表示学习进行个性化场所语义识别,在普适计算和基于位置的服务(LBS)等领域具有广阔的应用前景。
-
公开(公告)号:CN107092592A
公开(公告)日:2017-08-25
申请号:CN201710229368.9
申请日:2017-04-10
Applicant: 浙江鸿程计算机系统有限公司
IPC: G06F17/27
Abstract: 本发明涉及一种基于多情境数据和代价敏感集成模型的场所个性化语义识别方法,具体实施如下:1)从智能手机使用日志的各类情境数据中提取有效特征,并通过聚类发现加速度数据中的用户活动,构建高情境层次的场所用户活动特征;2)根据场所的活动分布,计算场所语义相似性以获取代价矩阵;3)结合代价矩阵对场所的特征进行建模,引入无标签场所数据进行半监督学习得到多个代价敏感的基分类器;4)集成多个基分类器输出识别模型,对用户访问场所进行个性化语义识别。本发明结合情境感知、代价敏感和半监督学习进行场所个性化语义识别,在普适计算、基于位置的服务等领域具有广阔的应用前景。
-
公开(公告)号:CN104200104A
公开(公告)日:2014-12-10
申请号:CN201410452578.0
申请日:2014-09-04
Applicant: 浙江鸿程计算机系统有限公司
IPC: G06F19/00
Abstract: 本发明涉及空气污染物的细粒度区域估计,尤其涉及一种基于空间特征的细粒度空气污染物浓度区域估计方法,包括预处理阶段、预测阶段、估计阶段;预处理阶段进行网格划分得到训练样本,预测阶段采用距离度量学习方法学习马氏距离函数来寻找区域最近的k个区域,再对这k个区域形成的特征向量进行多元线性回归训练,估计阶段利用训练得到的多元线性回归模型对区域的空气污染物浓度进行估计。本发明的有益效果在于:本发明可用来对无空气质量监测站点的某个小区域的空气污染物浓度进行估计,充分利用邻近的空气质量监测站点,引入k个邻近区域,可以更好地捕捉空气污染物浓度在空间上的细粒度变化,更准确地估计出当前区域的污染物浓度。
-
公开(公告)号:CN103793467A
公开(公告)日:2014-05-14
申请号:CN201310716665.8
申请日:2013-12-16
Applicant: 浙江鸿程计算机系统有限公司
IPC: G06F17/30
CPC classification number: G06F17/30442
Abstract: 本发明涉及大数据实时查询技术领域,尤其涉及一种基于超图和动态规划的大数据实时查询优化方法,该方法通过采用基于最佳代价的连接顺序优化方法来提升查询效率,在大数据环境下满足用户的实时查询需求。本发明的有益效果在于:针对执行计划搜索空间过大的问题,构建满足左线性树的搜索策略,大大降低了搜索的空间,提升了基于超图和动态计划算法运行的效率;构建满足大数据环境的最佳代价模型,综合考虑了大数据环境下传输代价及哈希连接算法运行特性等因素,确保了优化方法生成的计划是最佳的。
-
公开(公告)号:CN103164537A
公开(公告)日:2013-06-19
申请号:CN201310125029.8
申请日:2013-04-09
Applicant: 浙江鸿程计算机系统有限公司
IPC: G06F17/30
Abstract: 本发明涉及互联网搜索引擎日志划分领域,尤其涉及一种面向用户信息需求的搜索引擎日志数据挖掘的方法,包括:查询日志块归类、查询相似度计算和用户信息需求提供,综合计算查询词相似度和查询结果相似度作为查询相似度,以此为依据判断了两个查询是否具有相同的信息需求,有效快速的对搜索日志进行划分。本发明的有益效果在于:本发明针对传统的搜索引擎质量评价方法不能完整描述用户复杂、模糊信息需求的缺陷,提出了基于行为日志的搜索引擎用户信息需求满意度评估方法,以用户信息需求为单位,通过分析搜索引擎日志中用户的搜索行为来评估用户满意度,分析出用户的个性化需求,并从而促进搜索引擎技术的发展、提高搜索引擎的服务质量。
-
公开(公告)号:CN103020289A
公开(公告)日:2013-04-03
申请号:CN201210583024.5
申请日:2012-12-25
Applicant: 浙江鸿程计算机系统有限公司
IPC: G06F17/30
Abstract: 本发明涉及互联网信息技术领域,尤其涉及一种基于日志挖掘的搜索引擎用户个性化需求提供方法,该方法采用马尔可夫模型来对用户的搜索行为进行建模,包括表示用户满意和不满意的行为模型;用最大似然估计来计算用户的搜索行为分别从满意和不满意行为模型中生成的最大似然估计;最后用最大似然估计比来评估用户的满意程度,在复杂、模糊的搜索引擎用户行为信息日志中来评估用户满意度,分析出用户的个性化需求,并通过搜索引擎提供给用户个性化需求的结果,从而促进搜索引擎技术的发展、提高搜索引擎的服务质量。
-
公开(公告)号:CN102306176A
公开(公告)日:2012-01-04
申请号:CN201110247045.5
申请日:2011-08-25
Applicant: 浙江鸿程计算机系统有限公司
IPC: G06F17/30
Abstract: 本发明涉及数据仓库搜索技术,尤其涉及一种基于数据仓库内在特征的OLAP关键词查询方法,将可能的查询结果返回给OLAP用户,简化用户多维分析的过程,本发明只对维度表建立索引,这样提高了索引的速度,消除了无关信息的噪音;在索引过程中,通过过滤非相关维度属性来减少无关信息对查询结果的影响,采用过滤重复的维度列的方法规避冗余数据对语义的影响;根据维度层次粒度产生了维度层次权重系数,通过在传统的全文检索排序策略上增加维度层次权重系数来提升命中结果准确度;通过Joins相似的排序评分方法提高了结果排序的准确性,解决了现有技术中存在的问题。
-
-
-
-
-
-