-
公开(公告)号:CN119380341A
公开(公告)日:2025-01-28
申请号:CN202411946533.9
申请日:2024-12-27
Applicant: 数据堂(北京)科技股份有限公司
IPC: G06V20/70 , G06V30/19 , G06V10/82 , G06N3/0464
Abstract: 本申请公开了一种大模型多模态数据语义表征对齐方法,其通过采用基于深度学习的数据处理技术对第一模态数据和第二模态数据分别进行细粒度局部特征提取,并计算所述第一模态数据和第二模态数据的细粒度局部特征之间的相似度,作为初对齐损失函数值,接着,进一步结合全局上下文语义信息,对所述第一模态数据和第二模态数据的细粒度局部特征进行语义强化编码,通过上下文级别的语义对齐度量得到精对齐损失函数值,进而,基于精对齐损失函数值和初对齐损失函数值来指导模型训练,以实现多模态数据的语义表征对齐。通过这种方式,可以显著提高多模态数据在语义层面的对齐精度,为后续的数据融合和应用提供更准确的特征基础。
-
公开(公告)号:CN111078928A
公开(公告)日:2020-04-28
申请号:CN201911327469.5
申请日:2019-12-20
Applicant: 数据堂(北京)科技股份有限公司
IPC: G06F16/583 , G06K9/62
Abstract: 本发明提供了一种图像去重方法及装置,可以计算待去重的每个图像的目标哈希值,具体将图像划分为多个局部图像,分别缩小图像和每个局部图像的尺寸,分别对缩小后的图像和每个缩小后的局部图像进行DCT变换,得到图像对应的DCT系数矩阵和每个局部图像对应的DCT系数矩阵;根据图像对应的DCT系数矩阵计算图像的哈希值,以及根据每个局部图像对应的DCT系数矩阵计算每个局部图像的哈希值;对图像的哈希值和每个局部图像的哈希值进行整合得到图像的目标哈希值。进一步通过两两匹配多个图像的目标哈希值确定多个图像中的重复图像,并去重。基于本发明可以对实现整体+局部的图像对比,提高了鲁棒性和精确性。
-
公开(公告)号:CN118071994B
公开(公告)日:2024-08-27
申请号:CN202410213038.0
申请日:2024-02-27
Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司
IPC: G06V10/25 , G06V20/70 , G06V20/64 , G06V10/762
Abstract: 本发明提供了自动驾驶场景下不完整点云数据标注方法、装置及终端,属于点云数据标注技术领域,本方法包括利用启动标注模块在点云数据内进行范围框选,形成启动三维矩形框;对启动三维矩形框的点云进行过滤,然后再进行聚类,形成多个簇,选取待标注目标簇,然后利用预设规则生成外接三维矩形框;计算凸包边界,自动矫正外接三维矩形框,使之与目标朝向保持一致,构建最小矩形框;推理最小矩形框的生长方向,确定生长距离,以此自动补全最小矩形框,形成完整的待标注目标矩形框。本发明能够帮助标注人员快速准确完成不完整目标的完整目标框自动标注,提高工作效率。本发明可以适应多种不同类型的目标。
-
公开(公告)号:CN117830438A
公开(公告)日:2024-04-05
申请号:CN202410239833.7
申请日:2024-03-04
Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司
Abstract: 本发明提供了一种基于特定标志物的激光雷达与相机联合标定方法,属于点云数据处理技术领域,包括利用棋盘格标定板,标定相机内参;将标志物摆放到三脚架上,标志物充满相机整个视野,三脚架高度互不相同,以相机为参考,满足相机的远近高低处都有标志物,录制标定数据包;解析标定数据包,获取相机和雷达数据;在相机和雷达数据中,选取距离各个标志物中心最近的2D点和3D点,组成数据对,然后拷贝坐标值到文件中保存,实现雷达和相机之间的空间对应关系的准确建立;输入到slovepnp函数中,进行外参的求解;进行外参准确性的验证。本方法能够低成本、高效率准确建立雷达和相机之间的空间对应关系,为多传感器数据融合提供可靠基础。
-
公开(公告)号:CN116483733A
公开(公告)日:2023-07-25
申请号:CN202310687517.1
申请日:2023-06-12
Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司
Abstract: 本发明公开了一种多维度人工智能产品评测方法及装置,该方法包括:确定人工智能产品的评测对象,所述评测对象包括人工智能模型、人工智能算法和人工智能硬件;确定每个评测对象在每个评测维度的评测项,所述评测维度包括功能评测、性能评测和安全性评测;采集每个评测对象在每个评测维度的评测项的评测数据,按照每个评测项的评测方法,对该评测对象进行评测,获得该评测对象在该评测维度的该评测项的评测结果;其中,评测对象在功能评测的评测项的评测方法为基于环境条件集合的评测方法。本发明可以针对人工智能技术评测对象,实现人工智能的全周期评测。
-
公开(公告)号:CN115830419A
公开(公告)日:2023-03-21
申请号:CN202310087039.0
申请日:2023-02-09
Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司
IPC: G06V10/776 , G06V40/16 , G06V10/82
Abstract: 本发明公开了一种数据驱动式人工智能技术评测系统及方法,涉及人工智能评测技术领域,系统包括评测对象单元、评测过程单元、评测结果单元和算法优化单元,评测对象单元的数据信息传递至评测过程单元评测,评测过程单元评测结果传递至评测结果单元;算法优化单元接收评测结果数据,并将接收到的待优化的评测结果数据传递至评测对象单元进行优化;方法步骤包括生成评测任务;执行评测任务;生成评测结果。本发明针对不同技术领域和不同应用场景下的评测对象,可以快速选择适合的评测工具、评测数据、评测标准和基准模型后执行评测,输出评测结果,并推动评测对象的算法优化,从而极大降低用户进行人工智能评测的技术门槛。
-
公开(公告)号:CN108600386A
公开(公告)日:2018-09-28
申请号:CN201810437347.0
申请日:2018-05-09
Applicant: 数据堂(北京)科技股份有限公司
Abstract: 本申请公开了一种提供数据服务的方法及系统,所述提供数据服务的方法根据多个数据源中每个数据源的分配系数,确定待转发的数据源,由于所述分配系数与数据源确定为待转发的数据源的概率以及数据源的服务稳定性成正比,从而使得服务稳定性高的数据源可以有较大的概率确定为待转发的数据源,实现了对多个数据源的自动切换和同时应用,不仅降低了在当数据服务请求的并发量较大时,单一数据源的压力,而且避免了某一数据源的服务稳定性较差而导致的大量用户的数据服务请求得不到响应的情况,提升了用户的用户体验。
-
公开(公告)号:CN119378564A
公开(公告)日:2025-01-28
申请号:CN202411949511.8
申请日:2024-12-27
Applicant: 数据堂(北京)科技股份有限公司
IPC: G06F40/30 , G06F40/126 , G06F40/216
Abstract: 本申请涉及数据标注技术领域,其具体地公开了一种大模型数据智能标注方法及系统,其采用基于深度学习的自然语言处理技术对未标注文本数据集中的各个未标注文本数据进行置信度评估,选择最小置信度对应的文本数据作为代表样本数据,并对所述代表样本数据进行语料扩充,进而,通过对所述代表样本数据和语料扩充后的代表样本数据进行语义特征提取和补偿式交互融合,以充分利用两者之间的共有信息和独特信息,从而实现对所述代表样本数据的全面语义理解和智能标注。通过这种方式,可以显著提高数据标注的效率和准确性,同时大幅度减少人工干预的需求,降低标注成本。
-
公开(公告)号:CN118071994A
公开(公告)日:2024-05-24
申请号:CN202410213038.0
申请日:2024-02-27
Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司
IPC: G06V10/25 , G06V20/70 , G06V20/64 , G06V10/762
Abstract: 本发明提供了自动驾驶场景下不完整点云数据标注方法、装置及终端,属于点云数据标注技术领域,本方法包括利用启动标注模块在点云数据内进行范围框选,形成启动三维矩形框;对启动三维矩形框的点云进行过滤,然后再进行聚类,形成多个簇,选取待标注目标簇,然后利用预设规则生成外接三维矩形框;计算凸包边界,自动矫正外接三维矩形框,使之与目标朝向保持一致,构建最小矩形框;推理最小矩形框的生长方向,确定生长距离,以此自动补全最小矩形框,形成完整的待标注目标矩形框。本发明能够帮助标注人员快速准确完成不完整目标的完整目标框自动标注,提高工作效率。本发明可以适应多种不同类型的目标。
-
公开(公告)号:CN115617955B
公开(公告)日:2023-03-21
申请号:CN202211602620.3
申请日:2022-12-14
Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/279 , G06F40/30 , G06F18/214 , G06F18/25 , G06N3/0442 , G06N3/0464 , G06N3/092
Abstract: 本发明涉及一种分级预测模型训练方法、标点符号恢复方法及装置,所述训练方法包括如下步骤:提取样本文本的样本词语集合,以及提取样本语音的样本音频特征;将所述样本词语集合、所述样本音频特征进行多模态特征融合,获得乘积量化特征;提取所述样本词语集合的样本语义特征,将所述样本语义特征与所述乘积量化特征分别输入低频标点符号预测模型、高频标点符号预测模型。本标点符号分级预测模型训练方法通过低频标点符号预测模型、高频标点符号预测模型进行训练,从而获得最优低频预测模型以及最优高频预测模型,利用两种不同的预测模型对文本的标点符号进行分级预测,可以扩大标点符号识别范围,提高文本标点符号的准确率。
-
-
-
-
-
-
-
-
-