-
公开(公告)号:CN110457155B
公开(公告)日:2020-09-11
申请号:CN201910703759.9
申请日:2019-07-31
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种样本类别标签的修正方法、装置及电子设备,用于通过可视化方法基于用户标注的数据对类标进行修正。该方法包括:获取分类数据的类标数据,并进行特征提取得到特征数据;对所述特征数据多次采样,按照采样顺序将对应得到的多层特征数据中每相邻两层特征数据按照上下级关系进行级联,构建层次结构图;将所述层次结构图的任一层至少部分区域的特征数据,及所述至少部分区域的特征数据下级级联的特征数据联合,对联合后的特征数据进行降维,对应得到一个二维平面数据;接收基于所述二维平面数据进行标注的数据,得到可信数据集;基于所述可信数据集和所述类标数据,利用双重优化类标数据的修正方法,修正获取的类标数据。
-
公开(公告)号:CN111625715A
公开(公告)日:2020-09-04
申请号:CN202010388074.2
申请日:2020-05-09
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本公开是关于一种信息提取方法、装置、电子设备及存储介质,涉及信息处理技术领域,用以解决相关技术中对象元信息较为复杂,缺乏针对性,无法准确高效应用的问题,本公开方法包括:获取目标对象对应的标签集合以及目标账户的账户信息,其中标签集合包括至少两个用于描述对象的标签;基于预设映射方式,获取根据账户信息映射得到的注意力特征,其中注意力特征包含标签集合中各个标签对应的权重,预设映射方式是根据样本账户对应的样本对象的历史行为确定的;根据注意力特征以及标签集合,确定目标账户对应的目标对象元信息。由于本公开实施例可以得到与用户关联的注意力特征,可以表示出用户对标签集合中各个标签的关注度,针对性地刻画目标对象。
-
公开(公告)号:CN111539269A
公开(公告)日:2020-08-14
申请号:CN202010264369.9
申请日:2020-04-07
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于文本区域的识别方法、装置、电子设备和存储介质,所述方法包括:获取待处理图像中像素点的特征值的梯度值;通过将各像素点的梯度值与第一梯度阈值进行比较,筛选出梯度值不小于所述第一梯度阈值的目标像素点;通过拟合所述目标像素点得到四边形区域;基于所述四边形区域确定所述待处理图像中的文本区域。根据本公开的实施例,通过梯度值对图像中的像素点进行筛选,能够较为准确地识别出图像中的文本区域。
-
公开(公告)号:CN111405293A
公开(公告)日:2020-07-10
申请号:CN202010202915.6
申请日:2020-03-20
Applicant: 北京达佳互联信息技术有限公司
IPC: H04N19/70 , H04N19/503
Abstract: 本公开关于一种视频传输方法及装置,提高了视频传输的速度。发送端响应于对目标视频的上传指令,确定目标视频的N个关键帧图像,N个关键帧图像中任意两个关键帧图像的差异值大于预设阈值;根据N个关键帧图像,将目标视频分为N个分段视频,一个分段视频包括一个关键帧图像,一个分段视频包括的关键帧图像与该分段视频中其他帧图像的差异值均小于或等于预设阈值;确定每个分段视频对应的平均帧图像,确定每个分段视频包括的每帧图像与该分段视频对应的平均帧图像的差值,得到每个平均帧图像对应的差值图像,每个平均帧图像为相应的分段视频的静态图像;向接收端发送每个分段视频对应的平均帧图像,以及每个平均帧图像对应的差值图像的压缩文件。
-
公开(公告)号:CN111402893A
公开(公告)日:2020-07-10
申请号:CN202010210590.6
申请日:2020-03-23
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种语音识别模型确定方法、语音识别方法及装置、电子设备,涉及语音识别领域。所述语音识别模型确定方法包括:获取样本语音数据;对样本语音数据进行分帧,对分帧获得的各帧样本语音数据进行特征提取,获得各帧样本语音数据的语音特征;对各帧样本语音数据的语音特征基于音节进行对齐,得到各帧样本语音数据对应的音节标签;采用待训练语音识别模型对各帧样本语音数据的语音特征进行识别,获得各帧样本语音数据对应的预测音节。采用本方法能够提升语音识别的准确性。
-
公开(公告)号:CN111080752A
公开(公告)日:2020-04-28
申请号:CN201911286226.1
申请日:2019-12-13
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开公开一种基于音频的动作序列生成方法、装置以及电子设备,涉及数据处理技术领域,包括:提取音频帧序列中各音频帧的特征分量,并确定音频帧序列中各音频帧的位置编码;将音频帧序列中各音频的特征分量以及位置编码依序输入给已训练的基于自注意力机制的模型进行处理,得到音频帧序列对应的动作序列。通过该方式可以获取与音频数据对应的动作序列,增加了音频数据对应动作序列的多样性。
-
公开(公告)号:CN110941989A
公开(公告)日:2020-03-31
申请号:CN201910996351.5
申请日:2019-10-18
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开是关于一种图像校验、视频校验方法、装置、设备及存储介质,该图像校验方法包括:获取源图像和待检测图像的多个局部特征点;根据多个局部特征点,得到源图像和待检测图像中满足目标匹配条件的目标局部特征点对;对每对目标局部特征点对,基于目标局部特征点对中第一特征点和第二特征点在对应图像中的坐标,将第一特征点映射至第二特征点所在图像,得到第一特征点的映射点;在第二特征点所在图像中,确定第二特征点与映射点之间的距离;获取参考局部特征点对的数量,参考局部特征点对为距离小于目标距离阈值的目标局部特征点对;当参考局部特征点对的数量大于目标数量时,确定待检测图像为对源图像进行复制得到的图像。
-
公开(公告)号:CN110781345A
公开(公告)日:2020-02-11
申请号:CN201911051111.4
申请日:2019-10-31
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开提供一种视频描述生成模型的获取方法、视频描述生成方法、装置、电子设备及计算机可读存储介质,所述视频描述生成模型的获取方法包括:从预设视频库中获取多个视频;对于每个视频,识别所述视频中的每一视频帧以提取该视频帧中的文字;合并每个视频的视频帧对应的文字,作为所述视频的视频描述;将多个视频分别对应的视频帧及视频描述作为训练样本进行训练,获取视频描述生成模型。本公开实施例能够有效减少人工标注成本。
-
公开(公告)号:CN108984628B
公开(公告)日:2020-01-24
申请号:CN201810637242.X
申请日:2018-06-20
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本发明实施例提供了一种内容描述生成模型的损失值获取方法及装置。在本发明实施例中,根据目标损失值就可以确定出预设内容描述生成模型生成的视频的内容描述的错误程度,之后选择与该错误程度相适应的优化方式来优化预设内容描述生成模型中的预设参数矩阵,从而可以提高预设内容描述生成模型中的预设参数矩阵的稀疏性,也即使得预设参数矩阵中的非零的数值尽量少,进而使得视频的视频特征的各个维度与视频的内容主题之间的关系越清晰,可解释性越高,以使得视频的视频特征与根据预设内容描述生成模型生成的该视频的内容描述的内容主题之间的相关性更加显著可见。
-
公开(公告)号:CN110619350A
公开(公告)日:2019-12-27
申请号:CN201910741273.4
申请日:2019-08-12
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开关于一种图像检测方法、装置和存储介质。所述方法,包括:获取目标图像的特征图;根据所述特征图,通过图像检测模型,获取所述目标图像的第一检测结果,所述第一检测结果包括所述目标图像中包含的检测框、所述检测框的第一预测类别、所述第一预测类别的置信度;响应于所述第一预测类别的置信度满足第一阈值条件,获取所述第一预测类别对应的目标检测框;通过预设的分类模型,提取所述目标检测框的图像特征,并基于所述图像特征获取所述目标检测框的最终预测类别;其中,所述分类模型独立于所述图像检测模型,且与所述图像检测模型级联。从而取得了提高图像检测结果准确性以及图像检测方案适用性的有益效果。
-
-
-
-
-
-
-
-
-