-
公开(公告)号:CN113706642B
公开(公告)日:2023-04-07
申请号:CN202111012833.6
申请日:2021-08-31
Applicant: 北京三快在线科技有限公司
IPC: G06T9/00 , G06N3/0464 , G06N3/08
Abstract: 本说明书公开了一种图像处理方法及装置。通过编码器将目标图像划分为各图像块并进行分组,在每组图像块内计算各图像块的组内权重,以确定各组图像块对应的加权特征矩阵以及该目标图像对应的组合加权特征矩阵。基于得到的组合加权特征矩阵,进一步计算各组图像块的全局权重,以确定各组图像块的全局加权特征矩阵,并确定由各全局加权特征矩阵构成的全局特征,作为编码器的编码结果,将该编码结果输入到解码器后,确定该目标图像的图像处理结果。能够在减少计算量的同时,进行分组以及全局的自注意力权重计算,能够充分确定各图像块间以及各组图像块间的相关度,以得到准确的注意力权重,使得解码器能够输出更准确的图像处理结果。
-
公开(公告)号:CN113886477B
公开(公告)日:2023-01-06
申请号:CN202111145349.0
申请日:2021-09-28
Applicant: 北京三快在线科技有限公司
Abstract: 本说明书公开了一种人脸识别的方法及装置,客户端在获取并对至少一个待识别基础图像进行处理后,得到后续服务器用于人脸识别的目标图像,以及得到该服务器用于对该目标图像进行人脸识别的辅助信息,将该目标图像进行格式转换,转换为服务器接收人脸图像的预设接口所支持的图像格式,并将辅助信息按照该预设接口支持的图像格式所支持的扩展数据格式,写入到该格式转换后图像中,得到待识别人脸图像,而后,客户端可以将待识别人脸图像发送到服务器,以使得服务器通过预设接口,解析待识别人脸图像,得到辅助信息,并基于辅助信息,对待识别人脸图像进行人脸识别。
-
公开(公告)号:CN114417108A
公开(公告)日:2022-04-29
申请号:CN202111621546.5
申请日:2021-12-23
Applicant: 北京三快在线科技有限公司
IPC: G06F16/953 , G06F40/30
Abstract: 本发明实施例提供了一种文本内容的位置预测方法和装置,其中,所述方法包括:获取包含条状的文本内容区域的图像;提取出文本内容区域的第一语义特征,根据第一语义特征提取出文本内容区域的第二语义特征;分别对第二语义特征进行条形池化处理和特征加权处理得到文本内容区域的位置信息。本发明实施例对第一语义特征进行二次提取得到第二语义特征,可以获取更加细化的边缘信息,提升了语义分割结果,进而提高文本内容的位置预测的准确度。对第二语义特征进行条形池化处理,捕获空间区域的长依赖关系,防止无关区域的干扰。对第二语义特征进行特征加权处理,增强文本内容的特征,同时聚合全局和局部的上下文信息,增强长文本内容的位置预测能力。
-
公开(公告)号:CN114118218A
公开(公告)日:2022-03-01
申请号:CN202111283429.2
申请日:2021-11-01
Applicant: 北京三快在线科技有限公司 , 中国科学院计算技术研究所
Abstract: 本说明书公开了一种模型训练的方法,由于终端可以从待训练模型所需的基础损失函数中,以用于收敛该待训练模型中模型参数的相关项作为导函数,并通过求解出该导函数的方式,得到用于训练待训练模型的实际损失函数,这样可以有效地去除基础损失函数中冗余项对待训练模型过程中的不利影响,从而有效地提高了模型训练的效率。
-
公开(公告)号:CN113887719A
公开(公告)日:2022-01-04
申请号:CN202111067265.X
申请日:2021-09-13
Applicant: 北京三快在线科技有限公司
Abstract: 本说明书公开了一种模型压缩方法及装置,可先获取已训练完成的神经网络模型,并针对该神经网络模型中的每个嵌入层,确定该嵌入层的嵌入矩阵以及该嵌入层的基准矩阵。之后,以该嵌入矩阵的行数与基准矩阵的行数为约束,构建索引矩阵,并基于该嵌入层的索引矩阵与基准矩阵,确定该嵌入层的重构矩阵。最后,以最小化该嵌入层的嵌入矩阵与重构矩阵之间的差异为目标,调整基准矩阵与索引矩阵中的参数,并基于调整后的各基准矩阵与各索引矩阵,确定压缩后的神经网络模型,用于部署至终端中执行业务。以模型中各嵌入层的嵌入矩阵与重构矩阵之间的差异为优化目标,得到各嵌入层压缩后的基准矩阵与索引矩阵,极大降低了模型压缩的数据量。
-
公开(公告)号:CN113688832A
公开(公告)日:2021-11-23
申请号:CN202110993903.4
申请日:2021-08-27
Applicant: 北京三快在线科技有限公司
Abstract: 本说明书公开了一种模型训练及图像处理方法、装置。通过待训练的图像处理模型的第一模型中的对待处理图像进行处理并输出已处理图像,并且采用图像处理模型中的第二模型来预测已处理图像中各已处理区域与对应的标注图像的标注区之间的预测差异度,以根据预测差异度来为各已处理区域确定出区域权重,并通过以区域权重加权后的已处理图像和标注图像之间真实的标注差异度的最小为目标调整图像处理模型中的参数。使得在训练的过程中能够对预测差异度较大的区域投入更多的关注,从而避免待处理图像中需要进行处理的区域较小而导致模型训练得到较小的损失时所输出的已处理图像在需要处理的区域仍然难以得到较好的处理。
-
公开(公告)号:CN113643420A
公开(公告)日:2021-11-12
申请号:CN202110749332.X
申请日:2021-07-02
Applicant: 北京三快在线科技有限公司
Abstract: 本说明书公开了一种三维重建方法及装置。通过对采集的重建对象的各帧图像进行目标检测,将属于预设类型的目标物的位置进行掩膜处理以确定重建图像,并根据采集各帧重建图像时的时序信息,对各重建图像进行分组,得到若干数据组,在数据组内,进行重建图像的顺序特征匹配,在数据组间,针对每个数据组,将该数据组的首帧重建图像与其他数据组的各帧重建图像进行两两匹配,以寻找不同数据组的共视区域,进行三维重建。通过对特征匹配会产生干扰的目标物添加掩膜,去除其对匹配准确性的干扰,以及按时序对图像进行分组,减少进行整体暴力特征匹配的计算时间和计算量,提高三维重建的准确率以及重建效率。
-
公开(公告)号:CN113507608A
公开(公告)日:2021-10-15
申请号:CN202110642898.2
申请日:2021-06-09
Applicant: 北京三快在线科技有限公司
IPC: H04N19/176 , H04N19/122 , H04N19/149
Abstract: 本申请公开了一种图像编码方法,属于图像处理领域,有助于提升视觉编码模型对输入图像尺寸的适用范围。本方法包括:确定组成输入图像的每个图像块的一维空间张量组成的张量序列,并输入至多阶段视觉注意力模型首个阶段的编码网络;依次通过多阶段视觉注意力模型中各阶段的编码网络,对输入至该编码网络的张量序列所携带的图像块的图像内容特征进行尺度和维度变换以及图像块位置编码,并基于进行图像块位置编码以及尺度和维度变换的结果进行编码映射,输出输入图像的不同尺度和维度的张量,以及输入图像的类别编码。本方法通过隐式动态生成图像块的位置编码用于对图像块进行编码映射,实现了通过视觉模型对变化尺寸输入图像进行编码处理。
-
公开(公告)号:CN112070833A
公开(公告)日:2020-12-11
申请号:CN202010790386.6
申请日:2020-08-07
Applicant: 北京三快在线科技有限公司
Abstract: 本申请公开了一种招牌地图生成方法、装置和路径规划方法、装置,所述招牌地图生成方法包括:获取目标区域的图像序列;从所述图像序列中识别出关注点招牌帧;确定图像序列中各帧的相机位姿,根据各帧的相机位姿生成目标区域的路网图,并根据所述关注点招牌帧的相机位姿在所述路网图中标记出相应的关注点;根据所述路网图和各关注点的招牌图像生成招牌地图。本申请的招牌地图生成方法以招牌图像为主要数据生成室内地图,它可以绕过多个传统室内建图算法在技术上和运营上的难点,可以成为用户线下体验的入口,实现用户消费行为的线上化、数字化。
-
公开(公告)号:CN111899327A
公开(公告)日:2020-11-06
申请号:CN202010644317.4
申请日:2020-07-07
Applicant: 北京三快在线科技有限公司
Abstract: 本申请公开了一种轨迹点数据优化方法、装置、电子设备和存储介质,所述方法包括:获取目标区域的轨迹点数据,所述轨迹点数据包括多个散点;确定各散点的散点速度并根据各散点速度确定过滤速度区间;根据所述过滤速度区间确定散点中的异常点,从所述轨迹点数据中删除与确定的异常点对应的轨迹点数据。本申请针对基于三维重建构建室内路网中使用的关键帧位姿等数据容易出现异常等情况,能够自动化地滤出数据中的停滞点和跳变点,无需人工参与,成本较低,且能够高效地获取精准的路网拓扑结构。
-
-
-
-
-
-
-
-
-