-
公开(公告)号:CN112396113B
公开(公告)日:2024-10-15
申请号:CN202011318226.8
申请日:2020-11-23
Applicant: 国家电网公司东北分部 , 清华大学 , 国家电网有限公司
IPC: G06F18/2113 , G06F18/2411
Abstract: 本发明属于电力系统运行和控制技术领域,涉及一种电力系统运行方式数据特征两阶段选择方法。首先通过基于标准化互信息和交互信息增益的IG‑RFE特征选择Filter阶段算法,去除相关算法中的先验参数并且正确判断特征之间的复杂依赖关系,从而实现电力系统运行方式数据关键特征的自动搜寻和提取;然后通过改进混合核函数SVM算法协同递归特征消除RFE搜索方法进行不良特征的移除,直到获得结果数量为预设值大小的特征集合,实现了电力系统关键特征高效、准确自动搜寻。本方法提高了电力系统运行方式数据特征选择的效率和准确率,为电网运行方式数据特征选择提供技术依据和实用化方法。
-
公开(公告)号:CN114548421B
公开(公告)日:2024-10-01
申请号:CN202210023353.8
申请日:2022-01-10
Applicant: 清华大学
IPC: G06N20/00 , H04L41/0823 , H04L41/142 , H04L41/16
Abstract: 本发明提供一种针对联邦学习通信开销的优化处理方法及装置。该方法包括:将初始全局模型分发到本地客户端,获得本地客户端基于自适应梯度量化模型得到的当前轮次的目标量化等级;目标量化等级用于对本地客户端在当前轮次上传的梯度进行量化;基于惰性梯度聚合模型,确定是否获取本地客户端在当前轮次对应的量化梯度;量化梯度是本地客户端基于目标量化等级对当前轮次上传的梯度进行量化得到的;对量化梯度进行聚合处理,并根据聚合结果更新初始全局模型,得到下一轮次对应的目标全局模型。本发明提供的方法,通过自适应梯度量化模型动态调整量化等级,同时通过惰性梯度聚合模型调整通信频率,有效提高了通信效率,并减少了通信开销。
-
-
公开(公告)号:CN114676218B
公开(公告)日:2024-08-27
申请号:CN202210233595.X
申请日:2022-03-10
Applicant: 清华大学
IPC: G06F16/33 , G06F16/332 , G06F16/35
Abstract: 本发明提供一种信息检索方法、装置、电子设备及可读存储介质,其中,所述信息检索方法包括以下步骤:获取待查询语句;基于预先训练的检索模型,输出与所述待查询语句具有文本对应关系的ID;其中,所述检索模型是基于海量文本样本和ID训练得到的,且所述检索模型中存储有各所述海量文本样本与ID的文本对应关系。相比于现有技术在检索时需要对待检索语句和文本进行向量相似度计算,本发明在检索时不需要对检索文本进行编码、存储、计算,降低了计算代价和存储代价,提高了检索的效率。
-
公开(公告)号:CN118522391A
公开(公告)日:2024-08-20
申请号:CN202410530256.7
申请日:2024-04-29
IPC: G16H10/60 , G16H30/20 , G06F18/10 , G06F18/213 , G06F18/241 , G06V10/764 , G06V10/82 , G06N3/045 , G06N3/0985
Abstract: 本申请涉及计算机技术领域,特别是涉及一种数据分析方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括:获取待分析对象对应的目标医学数据;对所述目标医学数据进行预处理,以获取预处理数据;确定数据分析目标,并结合所述预处理数据构建任务提示词;将所述任务提示词输入医学数据分析模型,以获取所述待分析对象对应的医学数据分析结果。本方案能够提供准确、可信的医学数据分析结果。
-
公开(公告)号:CN113705251B
公开(公告)日:2024-08-06
申请号:CN202110356556.4
申请日:2021-04-01
Applicant: 腾讯科技(深圳)有限公司 , 清华大学
Abstract: 本申请实施例公开了一种机器翻译模型的训练方法、语言翻译方法及设备,涉及自然语言处理的机器翻译领域。该方法包括:对第一双语平行数据库中的数据进行划分,划分为源自源语言数据和源自目标语言数据,通过源自源语言数据对初始机器翻译模型进行微调,得到微调后的机器翻译模型,应用该微调后的机器翻译模型进行翻译任务,能够消除由于不同语言的数据之间存在的语言覆盖偏差对机器翻译模型的影响,从而提高通过该方法训练得到的机器翻译模型的性能,应用该模型可以得到译文质量和忠实度较高的译文。
-
公开(公告)号:CN118334619A
公开(公告)日:2024-07-12
申请号:CN202410433937.1
申请日:2024-04-11
Applicant: 清华大学
IPC: G06V20/58 , G06T7/13 , G06T7/136 , G06T7/73 , G08G1/01 , G08G1/017 , G08G1/00 , G01S17/93 , G01S17/86
Abstract: 本申请涉及自动驾驶技术领域,特别涉及一种基于单目相机的智能网联公交多车编队感知方法及装置,其中,方法包括:检测智能网联公交的多车编队中前车在图像上的检测框,并裁剪出前车的背板,以检测前车的多个中心点;计算前车在相机坐标系下的位置和航偏角,并根据相机与后车标定得到的外参矩阵将相机坐标系下前车的坐标转换到后车的车辆坐标系下,以得到前车在后车的车辆坐标系下的坐标,生成智能网联公交多车编队感知结果。由此,解决了相关技术中,由于激光雷达和雷达系统的成本相对较高且对环境条件敏感,导致车辆编队技术的整体部署成本增加和准确性降低,且由于多摄像头系统需要精确的校准和同步,增加了系统的复杂度和维护难度等问题。
-
公开(公告)号:CN117997591A
公开(公告)日:2024-05-07
申请号:CN202311808709.X
申请日:2023-12-26
Applicant: 清华大学 , 上海人工智能创新中心
Abstract: 本发明涉及数据安全领域,提供一种基于纵向联邦学习的大模型安全调用方法和装置,所述方法包括:基于纵向联邦学习技术,将目标大模型拆分为第一子模型和第二子模型;利用预设的安全计算方法,将客户端的原始数据在所述第一子模型中进行安全计算,以得到所述第一子模型输出的计算结果;所述第二子模型基于所述计算结果在明文条件下计算输出最终计算结果,完成大模型的调用。解决了现有技术中大模型调用时需要上传原始数据,数据安全性较低的问题,提高了大模型调用过程中输入数据和大模型参数的安全性。
-
公开(公告)号:CN117558338A
公开(公告)日:2024-02-13
申请号:CN202311321088.2
申请日:2023-10-12
Applicant: 清华大学 , 北京智源人工智能研究院
Abstract: 本发明提供一种基于联邦学习的蛋白质‑配体亲和力预测方法和装置,所述方法包括:获取待预测的蛋白质表示参数和配体表示参数;将所述蛋白质表示参数和所述配体表示参数输入预先训练的亲和力预测模型中,得到所述亲和力预测模型输出的预测结果;所述亲和力预测模型是基于联邦学习框架进行训练得到的,所述联邦学习框架包括多个用于训练蛋白质表示模型的第一本地端、用于训练配体表示模型的多个第二本地端,和用于模型聚合的服务器端;解决了现有技术中联邦学习模型预测准确性较低的技术问题,在保证数据泄漏风险较低的情况下,提高了模型预测结果的准确性。
-
公开(公告)号:CN110781598B
公开(公告)日:2024-02-09
申请号:CN201911040182.4
申请日:2019-10-29
Applicant: 国家电网有限公司 , 国网河北省电力有限公司雄安新区供电公司 , 清华大学
IPC: G06F30/20 , G06F119/08
Abstract: 本发明公开了一种区域综合能源系统运行状态计算方法,所述方法包括,建立以下计算模型:建筑热负荷模型、热力管道模型、耦合设备模型、电力系统模型、热电联产机组模型、地源热泵机组模型;基于上述模型,依次获取负荷节点热功率、热力系统的运行状态结果、热电联产机组模型运行状态结果、地源热泵机组模型的运行状态结果及节点的电功率,最终获取区域综合能源系统的运行状态。本发明的计算方法可以用于分析区域综合能源系统的运行状态,并可同时计算各种并网能源设备的内部运行状态,为研究系统和设备特性、制定相应的运行控制策略提供数据基础。
-
-
-
-
-
-
-
-
-