-
公开(公告)号:CN114764603A
公开(公告)日:2022-07-19
申请号:CN202210493240.4
申请日:2022-05-07
Applicant: 支付宝(杭州)信息技术有限公司 , 清华大学
Abstract: 本说明书实施例提供一种针对用户分类模型、业务预测模型确定特征的方法及装置,在针对用户分类模型确定特征的方法中,基于各候选表各自的累积分数,从各候选表中选取目标候选表,并从目标候选表中,选取若干目标用户特征。将各目标用户特征添加到第k‑1轮基础表,得到中间基础表。基于中间基础表中的用户特征和用户类别标签,训练当前的用户分类模型。对训练后的用户分类模型进行性能评估,并至少基于得到的第一性能指标值,确定目标候选表的第k轮分数。根据第k轮分数,确定目标候选表的更新的累积分数,以及确定第k轮基础表,以用于下一轮迭代;在多轮迭代后,将最后一轮基础表中的用户特征,作为针对用户分类模型确定的最终用户特征。
-
公开(公告)号:CN114764603B
公开(公告)日:2024-07-02
申请号:CN202210493240.4
申请日:2022-05-07
Applicant: 支付宝(杭州)信息技术有限公司 , 清华大学
IPC: G06F18/24 , G06F18/214 , G06Q10/0637
Abstract: 本说明书实施例提供一种针对用户分类模型、业务预测模型确定特征的方法及装置,在针对用户分类模型确定特征的方法中,基于各候选表各自的累积分数,从各候选表中选取目标候选表,并从目标候选表中,选取若干目标用户特征。将各目标用户特征添加到第k‑1轮基础表,得到中间基础表。基于中间基础表中的用户特征和用户类别标签,训练当前的用户分类模型。对训练后的用户分类模型进行性能评估,并至少基于得到的第一性能指标值,确定目标候选表的第k轮分数。根据第k轮分数,确定目标候选表的更新的累积分数,以及确定第k轮基础表,以用于下一轮迭代;在多轮迭代后,将最后一轮基础表中的用户特征,作为针对用户分类模型确定的最终用户特征。
-
公开(公告)号:CN112506454B
公开(公告)日:2022-07-29
申请号:CN202011212679.2
申请日:2020-11-03
Applicant: 清华大学
IPC: G06F3/14
Abstract: 本发明公开了一种移动终端及其数据显示方法、装置,移动终端包括:通过微处理器接收采集装置发送的与移动终端外接的显示设备的设备标识并发送给调制解调器;调制解调器从云端获取设备标识对应的显示设备的屏幕驱动程序和编解码协议并发送给微处理器;转换装置对从微处理器获取的屏幕驱动程序和编解码协议进行固化;当从调制解调器接收到云端发送的待显示数据时,通过屏幕驱动程序和编解码协议将待显示数据转换成显示设备对应的显示内容,并通过输出装置传输至显示设备。由此,使得移动终端可以适配所有类型的显示设备,将云端内容显示到任何可见的屏幕上,降低了成本,减少了人力和物力消耗。
-
公开(公告)号:CN112101419A
公开(公告)日:2020-12-18
申请号:CN202010824572.7
申请日:2020-08-17
Applicant: 清华大学
Abstract: 本发明公开了一种基于众包的高效分类系统及其创建、使用方法,其中,该系统包括:学习模块,用于通过在线学习方法以及在在线学习方法中加入记忆窗口的拓展方法来学习类别权重分布;优化模块,用于根据已有或学习模块学习到的学习类别权重,运用贪心算法逐层构建决策树,作为询问策略;众包模块,用于生成优化模块中选择出的问题节点对应的众包问题,将众包问题发布到众包平台以收集聚合答案,实施询问策略。
-
公开(公告)号:CN107346313B
公开(公告)日:2020-11-27
申请号:CN201610294838.5
申请日:2016-05-05
Applicant: 清华大学 , 腾讯科技(深圳)有限公司
IPC: G06F16/29 , G06F16/215
Abstract: 本发明涉及一种虚拟面挖掘的方法和装置。所述方法包括:获取兴趣点数据、签到点数据和路网数据,对所述兴趣点数据和签到点数据进行整合得到点集合;根据所述点集合获取各兴趣点的签到点集合,对所述签到点集合中签到点进行过滤得到正确的签到点点集;获取所述正确的签到点点集的最小外接多边形;根据所述路网数据对所述正确的签到点点集的最小外接多边形进行边界优化。上述虚拟面挖掘的方法和装置,获取该签到点点集的最小外接多边形,采用路网对最小外接多边形进行边界优化,该最小外接多边形即为兴趣点的虚拟面,实现了对虚拟面的挖掘。
-
公开(公告)号:CN111625529A
公开(公告)日:2020-09-04
申请号:CN202010477079.2
申请日:2020-05-29
Applicant: 清华大学
IPC: G06F16/215 , G06F16/22 , G06F16/28 , G06F16/26
Abstract: 本申请实施例公开了一种提高数据可视化质量的方法、装置和计算机可读存储介质,该方法包括:获取关系型数据表,对关系型数据表进行数据可视化获取初始的数据可视化结果;通过数据清洗模型检测初始的数据可视化结果中包含的数据错误并生成候选修复建议;根据数据错误和修复建议构建错误-修复图;从错误-修复图中选取出最佳复合子图;将最佳复合子图传输给用户使用户与最佳复合子图进行交互式数据清洗,获取交互式数据清洗结果;根据交互式数据清洗结果迭代地对关系型数据表进行数据错误修复,获取新的数据可视化结果。通过该实施例方案,降低了数据清洗的成本;避免错误可视化结果误导用户得出错误分析的结果。
-
公开(公告)号:CN104266656B
公开(公告)日:2017-06-06
申请号:CN201410446777.0
申请日:2014-09-03
Applicant: 清华大学 , 北京三星通信技术研究有限公司
Abstract: 本发明公开了一种用于道路网的最短路径搜索方法及装置,其中,方法包括以下步骤:将道路网分割为多个子网络;生成树状结构道路网络;计算同一层的子网络的边界节点之间的最短路径;输入查询点和目标点;根据最短路径通过动态规划算法得到查询点和目标点之间的初始最短路径;对初始最短路径进行补充以获取查询点和目标点之间完整的最短路径。本发明实施例的方法通过将道路网分割为多个子网络以生成树状结构道路网络,并且计算同一层的子网络的边界节点之间的最短距离,从而当输入查询点和目标点时,实现快速得到查询点和目标点之间最短路径,不但效率高,而且很好地满足实时性要求。
-
公开(公告)号:CN102591867A
公开(公告)日:2012-07-18
申请号:CN201110002625.8
申请日:2011-01-07
Applicant: 清华大学
Abstract: 本发明提供了一种基于移动设备位置的搜索服务方法和一种搜索服务数据库的建立方法,其中的搜索服务方法具体包括:依据移动设备的当前位置和当前方位,在搜索服务数据库中进行搜索,并将第一搜索结果推送给移动设备用户,其中,该搜索服务数据库中包括有感兴趣地理数据和对应的结构化数据;或者,在接收到移动设备用户发送的搜索请求时,从该搜索请求中提取关键词;依据所述关键词及该移动设备用户的当前位置和当前方位,在该搜索服务数据库中进行搜索,并将第二搜索结果返回给该移动设备用户。本发明能够将包含有丰富、详细、充实结构化数据的搜索结果提供给移动设备用户,从而给用户带来更好的查询体验与视觉效果。
-
公开(公告)号:CN101504660A
公开(公告)日:2009-08-12
申请号:CN200910079301.7
申请日:2009-03-06
Applicant: 清华大学
IPC: G06F17/30
Abstract: 本发明涉及一种纯扩展标记语言数据库的查询管理方法及其系统,属于计算机纯扩展标记语言数据库的查询管理技术领域。包括数据文件管理模块,用于对数据进行处理,其将XML数据记录存储在页的各个槽里,每页都有惟一的页号,而页里的每一个槽都有惟一的槽号,用“页号+槽号”惟一地定位一条记录的位置,存放同一个XML文档数据的页用页头的指针连接起来,构成一个双向链表,节点存储结构中包含code域,用于被关系分析单元赋予code值;查询操作模块,用于实现查询操作,含有关系分析单元和结构连接单元,用于执行结构连接操作。本发明的查询管理方法和查询管理系统具有较高的时间性能,能够大幅度提高查询效率,并且便于实现和应用。
-
公开(公告)号:CN111597209B
公开(公告)日:2023-11-14
申请号:CN202010367321.0
申请日:2020-04-30
Applicant: 清华大学
IPC: G06F16/2453 , G06F16/28 , G06F16/26
Abstract: 本申请实施例公开了一种数据库物化视图构建系统、方法以及系统创建方法,该系统包括:查询负载预处理模块、离线训练模块和在线推荐模块;查询负载预处理模块用于对输入的查询负载进行预处理获取子查询代表;离线训练模块用于通过查询负载历史数据对预设的深度学习模型和强化学习模型进行训练;在线推荐模块用于通过深度学习模型预测每一个子查询代表对应的原查询使用该子查询代表对应的物化视图进行视图重写后,得到的新查询的查询代价;并通过强化学习模型获取查询代价最低的最优子查询和相应的最优物化视图。该实施例方案较大程度降低了批量查询的冗余代价,并实现了物化视图近似优化过程的收敛。
-
-
-
-
-
-
-
-
-