-
公开(公告)号:CN119398057A
公开(公告)日:2025-02-07
申请号:CN202311388559.1
申请日:2023-10-24
Applicant: 上海处理器技术创新中心 , 上海最知科技有限公司
IPC: G06F40/30 , G06F40/289 , G06F40/211
Abstract: 本申请公开了一种基于大语言模型的数据处理方法及相关产品。该数据处理方法包括:采集原始文本数据;提取所述原始文本数据的语义标签;生成与所述语义标签相关的多条关联文本;以及将所述语义标签和对应的多条关联文本组合,以构建出语义标注数据集。本申请可以提取文本数据中的语义标签,并生成与所提取的语义标签相关的多条关联文本。此后,将多条关联成本与语义标签组合,可以构建内容丰富且多样的语义标注数据集,这样构建的语义标注数据集能够提供充足的上下文信息。由此,在进行数据处理时,大语言模型能够利用丰富的上下文语义信息来消解词语的多义性所带来的问题,有效解决数据增强中词语多义所引发的语义偏移问题。
-
公开(公告)号:CN117315502A
公开(公告)日:2023-12-29
申请号:CN202311386812.X
申请日:2023-10-24
Applicant: 上海处理器技术创新中心
IPC: G06V20/13 , G06V10/764 , G06V10/82 , G06N3/04
Abstract: 本申请公开了一种遥感图像处理方法、电子设备及存储介质。该遥感图像处理方法包括:获取图像帧数据;对图像帧数据进行图像预处理,得到可视图像数据;基于可视图像数据确定有效图像数据;以及将有效图像数据传输至地面站。利用本申请的技术方案,能够对遥感图像数据中的有效数据进行提取后进行传输,提升遥感图像数据的传输效率。
-
公开(公告)号:CN119398161A
公开(公告)日:2025-02-07
申请号:CN202410562170.2
申请日:2024-05-08
Applicant: 上海处理器技术创新中心
Abstract: 本申请公开了一种构建数据集的方法、设备和计算机可读存储介质,包括:获取原始数据集的推理路径;提取所述推理路径中的主路径和剩余路径;根据所述主路径和剩余路径进行数据生成,以获取增强数据;以及合并所有增强数据作为新的数据集。通过本申请的方案,可以自动构建数据集,增强构建数据集的鲁棒性,提高数据集的质量。
-
公开(公告)号:CN117574973A
公开(公告)日:2024-02-20
申请号:CN202311580204.2
申请日:2023-11-24
Applicant: 中国科学院计算技术研究所 , 上海处理器技术创新中心
IPC: G06N3/0495 , G06N3/045 , G06N3/042 , G06N5/04 , G06F18/2433 , G16C20/70 , G16C20/10 , G16C10/00
Abstract: 本发明提出一种原子间势能面模型的离群点感知自适应混合精度量化方法和系统,通过对不同阶数项系数使用不同数据宽度的混合精度量化,本发明提出的离群点感知的量化方法可以有效的提高量化表示的效率;本发明提出了对由量化带来的多项式表示的误差进行系统性控制的机制与方法,并提出在误差控制的约束下实现对不同阶数项系数混合精度量化的最优量化精度自适应选择方法。本发明通过对原子间势能模型多项式系数表的数据分析,自适应地给出最优的混合精度量化方案并依据此方案对多项式系数表执行离群点感知的混合精度量化操作,提高原子间势能模型的推理规模与推理速度。
-
-
-