-
公开(公告)号:CN119692411A
公开(公告)日:2025-03-25
申请号:CN202411679953.5
申请日:2024-11-22
Applicant: 北京计算机技术及应用研究所
IPC: G06N3/08 , G06F18/214 , G06N3/045 , G06V10/82 , G06V10/764 , G06V10/74 , G06N5/04
Abstract: 本发明涉及一种提升多模态模型细颗粒度判别能力的微调优化方法,属于人工智能领域。本发明通过对微调阶段的图像编码器通道引入ArcFace的角度边界辅助损失来优化图像和文本的联合表示学习。该方法包括预训练和微调两个阶段,预训练阶段使用在大规模图像‑文本对数据集上进行训练,微调阶段则基于特定领域数据集通过固定文本分支的全部参数和图像分支的多数参数,并在图像分支结合辅助损失函数调整模型参数,从而实现多模态模型对特定细颗粒场景判别能力的优化提升。
-
公开(公告)号:CN119441989A
公开(公告)日:2025-02-14
申请号:CN202411679330.8
申请日:2024-11-22
Applicant: 北京计算机技术及应用研究所
IPC: G06F18/241 , A61B5/00 , A61B5/369 , G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种基于乘员脑电信号的融合风险分类方法,属于自动驾驶、人工智能和脑电信号处理领域。本发明针对预警信号利用在线学习算法训练一个预警信号提取特征网络;结合预警信号提取特征网络提取的特征和P300信号提取的特征实现基于脑电信号的风险分类器的训练;基于脑电信号实现风险的精准预测。本发明相比于之前研究单纯依靠P300信号,增加了预警信号数据特征,并且可以实现预警信号在线学习,结合车载计算机可以实现风险的快速精准识别。
-
公开(公告)号:CN119226631A
公开(公告)日:2024-12-31
申请号:CN202411296848.3
申请日:2024-09-18
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/9536 , G06N20/20 , G06F18/2135 , G06F18/2431
Abstract: 本发明涉及一种基于协同过滤的分布式自动机器学习方法,属于自动机器学习领域。本发明为元知识库中的每个数据集搜索前N个模型并将它们存储在哈希字典中,并计算元知识库中的数据集的元特征子集的权重;基于协同过滤的分布式AutoML框架CF‑DAML,首先通过模型推荐模块计算新数据集的元特征并为其推荐合适的模型,然后,CF‑DAML在指定的时间限制内使用分布式模型训练系统DSTM在新数据集的训练集上训练推荐出的模型,并在其验证集上评估训练的模型,最后,CF‑DAML采用选择性堆叠集成系统MSSE集成几个高性能模型为新数据集的测试集预测标签。本发明在保证分类准确率提升的基础上大大降低了时间复杂度。
-
公开(公告)号:CN119274539A
公开(公告)日:2025-01-07
申请号:CN202411397414.2
申请日:2024-10-09
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种端到端的普通话和低资源粤语统一识别方法,属于语音识别领域。本发明应用于普通话和粤语同时识别的场景。该发明采用端到端的CTC‑Attention联合训练方法,且构建了普通话‑粤语统一识别字典,并结合语言识别LID模块缓解了多语言识别中存在的上下文识别混淆的问题。本发明通过构建端到端的语音识别神经网络模型架构实现普通话和低资源粤语的统一识别,并提出了一种建模单元的构建方式,提升模型的收敛性能。该端到端的语音识别方法能够在普通话和粤语同时出现的场景下的完成语音识别的需要,并达到较好的性能。
-
公开(公告)号:CN119692413A
公开(公告)日:2025-03-25
申请号:CN202411621410.8
申请日:2024-11-14
Applicant: 北京计算机技术及应用研究所
IPC: G06N3/082 , G06F9/455 , G06N3/0985
Abstract: 本发明涉及一种智能感知算法训练框架统一支撑方法,属于深度学习领域。本发明包括主流国产框架转换兼容技术;统一训练系统;训练框架多硬件兼容技术;多类型计算资源虚拟化技术。本发明集成国产主流训练框架PaddlePaddle,通过X2Paddle工具实现对PyTorch训练框架在训练代码层和模型层的统一转换兼容能力;并以计算资源虚拟化技术进行训练环境管理,以镜像的方式实现对不同训练框架的兼容支持,实现主流国产硬件计算设备的接入;通过模型资源管理和构建场景开发套件,实现算法资源集成,以实现对不同任务常场景的快速开发能力;通过分布式训练技术,支持对单机多卡和多机多卡资源的调度使用。通过超参数调优和模型压缩技术,实现对训练模型效果和训练效率寻优。
-
公开(公告)号:CN119670832A
公开(公告)日:2025-03-21
申请号:CN202411621205.1
申请日:2024-11-14
Applicant: 北京计算机技术及应用研究所
IPC: G06N3/08 , G06F18/213 , G06F18/214 , G06N20/20 , G06N20/00 , G06F21/62 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及一种通信受限条件下的边云协同训练方法,属于边云协同领域。本发明融合了联邦学习和分割学习两种分布式机器学习算法,解决了传统的联邦学习因边缘设备算力限制而造成的无法训练或训练过慢的问题,能够充分利用边缘设备和云端设备的算力资源。同时模型分割后,通过对边缘设备侧特征提取器获取的中间层特征进行1bit量化操作和加噪声处理,缓解了边云协同训练时易造成的数据隐私安全问题。边缘设备侧的特征提取器无需在训练过程中进行参数更新,因此不需要进行边云之间多轮梯度的交换传输,且中间层特征经过量化操作后特征大小被极大压缩,这些都减小了边云协同训练时的通信占用,适用于通信受限的场景。
-
公开(公告)号:CN119743261A
公开(公告)日:2025-04-01
申请号:CN202411679407.1
申请日:2024-11-22
Applicant: 北京计算机技术及应用研究所
IPC: H04L9/30
Abstract: 本发明涉及一种基于量子近似优化算法的整数分解方法,属于密码破译技术领域。本发明构建子句以描述分解RSA密钥M的优化算法,M为一整数;基于子句构建参数化量子线路;基于量子近似优化算法求解参数化量子线路的参数,测量最终量子态;量子态测量结果映射为RSA密钥M的两项质因数P和Q,P和Q用于计算RSA算法的私钥。本发明采用参数化量子门电路描述密钥整数分解优化问题,易于在通用量子计算机上实现和进行扩展。
-
-
-
-
-
-