-
公开(公告)号:CN119202660A
公开(公告)日:2024-12-27
申请号:CN202411292061.X
申请日:2024-09-14
Applicant: 人民中科(北京)智能技术有限公司 , 人民中科(黑龙江)数字产业有限公司
IPC: G06F18/213 , G06F18/10 , G06N5/02
Abstract: 本发明涉及互联网大数据技术领域,且公开了一种社交平台账号画像多模态向量化表征方法,包括作品内容画像表征、账号资料画像表征和社交关系画像表征。该社交平台账号画像多模态向量化表征方法,将基于用户发表的作品内容、账号资料、账号社交关系等信息对账号画像进行建模,并利用多模态内容将账号特征向量化,尽可能地多维度、全方位的表征账号信息,从而精准构建账号画像,通过特征向量化技术,解决文本标签提取信息损失问题和人工设计文本标签缺陷,同时通过作品内容、账号资料、账号社交关系等多个维度,以及多模态内容识别与分析,解决只基于文本信息表征账号画像不全面的问题。
-
公开(公告)号:CN118485051A
公开(公告)日:2024-08-13
申请号:CN202410329444.3
申请日:2024-03-21
Applicant: 人民中科(黑龙江)数字产业有限公司 , 人民中科(北京)智能技术有限公司
IPC: G06F40/186 , G06F40/216 , G06F16/35 , G06F18/241 , G06F18/22 , G06N3/0455
Abstract: 本发明涉及一种教育公文生成方法、装置、计算机设备及存储介质,其中,该方法包括:获取教育公文生成需求信息,其中,所述需求信息中包括待生成教育公文的类型和描述;将所述需求信息输入至训练好的大语言模型中,生成所述需求信息对应的教育公文,其中,所述训练好的大语言模型为基于不同类型的教育公文的结构、提示词模板以及主题库进行训练而得到的,所述训练好的大语言模型的输入为所述需求信息,输出为所述需求信息对应的教育公文。通过本申请,解决了相关技术缺乏对垂直领域语义概念的关注而导致预训练大语言模型文本生成中内容不符合要求,结构不准确的问题,实现了提高生成教育公文的质量和准确度的效果。
-
公开(公告)号:CN119785129A
公开(公告)日:2025-04-08
申请号:CN202510292848.4
申请日:2025-03-13
Applicant: 人民中科(北京)智能技术有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/42 , G06V10/74 , G06V10/82 , G06N3/0455 , G06N3/0895
Abstract: 本公开属于计算机视觉技术领域,具体涉及一种组合零样本图像分类及模型的训练方法和装置。其中组合零样本图像分类模型的训练方法包括:获取图像分类数据集,并划分为训练集和测试集;构建神经网络模型,基于所述训练集对所述神经网络模型进行训练,生成所述组合零样本图像分类模型,其中,所述神经网络模型至少包括组合识别分支和基元识别分支,所述组合识别分支用于基于训练集样本的全局特征获取每个样本的组合特征表示,所述基元识别分支用于通过挖掘训练样本的全局基元关系得到解耦后的基元特征以进行基元的识别,所述基元包括属性和对象。本公开提高组合零样本图像分类的性能。
-
公开(公告)号:CN117555979A
公开(公告)日:2024-02-13
申请号:CN202410040660.6
申请日:2024-01-11
Applicant: 人民中科(北京)智能技术有限公司
Abstract: 本发明公开了一种高效的自底向上的地图位置缺失识别方法,包括以下步骤:S1、数据准备;S2、地图关键点检测模型的训练:将数据预处理后组合;进行高分辨率的特征提取;将高分辨率特征转换为热图,并预测每一个关键点的嵌入向量;得到预测结果,与真实标注进行均方差损失计算来反向传播进行模型优化;直至模型优化至达到输出标准,完成训练;S3、模型量化;S4、地图关键点检测模型推理,输出地图位置缺失识别结果。本发明在保证精度的同时提高从海量数据中检测出问题地图的效率,可以直接在输入的图片上定位地图关键点,有着较高的效率;同时需要的计算和存储资源也相对有限,可以满足海量数据的处理以及服务实际部署的需求。
-
公开(公告)号:CN119783753A
公开(公告)日:2025-04-08
申请号:CN202510288277.7
申请日:2025-03-12
Applicant: 人民中科(北京)智能技术有限公司
IPC: G06N3/082 , G06N3/0499
Abstract: 本公开属于人工智能技术领域,具体涉及一种深度学习模型的压缩方法、装置和电子设备。其中所述方法包括:获取待压缩的深度学习模型,分别确定模型参数的费舍尔重要度与参数关联重要度;基于费舍尔重要度与参数关联重要度确定协同重要度;基于模型参数的协同重要度对所述深度学习模型进行剪枝。本公开提供了一种剪枝效率更佳的深度学习模型的压缩方法。
-
公开(公告)号:CN119339100A
公开(公告)日:2025-01-21
申请号:CN202411371157.5
申请日:2024-09-29
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
IPC: G06V10/44 , G06V10/764 , G06V10/80 , G06N3/045 , G06N3/0464 , G06N3/049
Abstract: 本发明涉及神经网络技术领域,公开了一种基于SNN信息补充的图像识别方法、装置、设备及介质,该方法包括:获取目标图像,并输入图像识别模型中的脉冲神经网络和卷积神经网络,进行特征提取并前向传播;在每个对应处理阶段,对脉冲神经网络和卷积神经网络中当前处理阶段各自对应的输入特征进行处理,得到第一特征和第二特征,将其合并为第三特征,将第三特征和第二特征分别输出至脉冲神经网络和卷积神经网络的下一处理阶段;当脉冲神经网络的最后的处理阶段得到目标特征后,通过其全连接层基于目标特征确定目标图像的分类结果,本发明通过卷积神经网络为脉冲神经网络每个阶段提取的特征提供补充特征,从而提高脉冲神经网络的图像处理性能。
-
公开(公告)号:CN116821417B
公开(公告)日:2023-12-12
申请号:CN202311082820.5
申请日:2023-08-28
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
IPC: G06F16/783 , G06N3/045 , G06V10/80 , G06V10/82 , G06V20/40
Abstract: 本发明实施例提供了一种视频标签序列生成方法和装置,其中,该方法包括:对样本视频内容和标题进行多模态特征提取得到多种特征编码;将多种特征编码输入到预训练的多模态混合编码器中进行特征融合,得到多模态混合特征;通过顺序提示模型为样本视频生成对应的顺序提示信息;将顺序提示信息与样本视频对应的标签进行对齐训练,得到每个顺序提示信息与标签的唯一对应关系;基于顺序提示信息和唯一对应关系对样本视频进行标签排序得到目标序列,通过目标序列和多模态混合特征对顺序感知标签解码器进行训练,得到训练好的标签解码器。通
-
公开(公告)号:CN119559077A
公开(公告)日:2025-03-04
申请号:CN202510115303.6
申请日:2025-01-24
Applicant: 人民中科(北京)智能技术有限公司
Abstract: 本发明的实施例提供了基于多智能体强化学习下的ISP调参方法和设备。所述方法包括获取不同强化学习环境的原始图像,将原始图像中的RGB图像转换成RAW图像,得到RAW‑RGB数据集;构建多智能体强化学习模型,通过训练集对所述多智能体强化学习模型进行训练,得到训练好的多智能体强化学习模型;根据训练好的多智能体强化学习模型对输入的RAW图像进行参数预测,得到ISP参数。以此方式,可以通过多智能体结构考虑了同一模块中参数的内在关联以及不同模块间参数的耦合关系,进行有效率地反馈与决策,缩短搜索最优参数的时间,得到更加精准的ISP参数。
-
公开(公告)号:CN119129570A
公开(公告)日:2024-12-13
申请号:CN202411220435.7
申请日:2024-09-02
Applicant: 人民中科(北京)智能技术有限公司
IPC: G06F40/194 , G06F40/30 , G06F16/16 , G06F40/166 , G06N20/00
Abstract: 本发明涉及自然语言处理技术领域,且公开了一种基于对比句向量表征框架的公平竞争审查方法,S1.采集大量的政策措施文件;S2.基于专家审查构建公平竞争审查的案例库;S3.对语义相似度计算模型训练;S4.S1得到的待审查文件通过S3得到的语义相似度计算模型与S2的案例库文件语义相似度计算;S5.基于S4的语义相似度结果识别相关涉嫌违规的条款,从而实现待审查文件违规类型识别判断。该基于对比句向量表征框架的公平竞争审查方法,能够通过政策措施文本采集、基于专家审查的公平竞争审查案例库的构建、语义相似度计算模型构建及训练、待审查文件与案例库文件语义相似度计算以及待审查文件的违规类型识别,提升审查工作智能化水平和工作效率。
-
公开(公告)号:CN118841041A
公开(公告)日:2024-10-25
申请号:CN202411219212.9
申请日:2024-09-02
Applicant: 人民中科(北京)智能技术有限公司
IPC: G10L25/81 , G10L15/08 , G10L15/26 , G10L25/78 , G06F18/2321 , G06F18/2134
Abstract: 本发明涉及音频数据处理技术领域,且公开了一种音频数据自动化片段对齐标注的技术方法,S1,输入后的音频/语音数据首先通过人声分离模块将原始数据分离为音乐音轨和人声音轨两个文件;S2,人声音轨进入有效片段切分模块,模块只使用人声音轨数据进行音频切分;S3,切分后的有效人声片段将被输入到自动语音识别(ASR)模块进行文本转录;S4,片段聚类模块使用DBSCAN聚类算法对文字识别结果进行文本聚类,聚类时使用的特征是文本的TF‑IDF特征。该音频数据自动化片段对齐标注的技术方法,可以极大程度的降低人工标注的时间成本和人力成本,自动化的提供高质量的音频标注数据,推动了音频比对模型的进一步发展与应用。
-
-
-
-
-
-
-
-
-