-
公开(公告)号:CN111897996A
公开(公告)日:2020-11-06
申请号:CN202010797673.X
申请日:2020-08-10
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/735 , G06F16/78 , G06F16/783
Abstract: 本公开关于一种话题标签推荐方法、装置、设备及存储介质,属于多媒体技术领域。本公开的实施例提供了一种基于视频在多个模态的特征来推荐话题标签的方法,通过视频中的图像以及视频生产者的用户特征,由机器自动化地生成话题标签,将话题标签推荐给用户。由于推荐的话题标签既与视频的内容匹配,又体现了视频生产者自身的信息,因此充分保证了话题标签与视频之间的匹配度,从而提高了话题标签的精确性,使得推荐的话题标签更加贴近用户意图。
-
公开(公告)号:CN112925905B
公开(公告)日:2024-02-27
申请号:CN202110117737.1
申请日:2021-01-28
Applicant: 北京达佳互联信息技术有限公司
Inventor: 王思博
IPC: G06F16/35 , G06F16/783 , G06V20/62 , G06V30/148 , G06V10/82
Abstract: 本申请公开了一种提取视频字幕的方法、装置、电子设备和存储介质。用于解决对如何从视频中准确的提取关键字幕的问题。本申请实施例中,通过对视频进行文本检测,能够得到多个文本区域,基于对多个文本区域的特征分析和聚类分析,能够进一步挑选出重要的文本区域,从而提取出视频中的重要字幕信息。
-
公开(公告)号:CN110443280B
公开(公告)日:2022-06-03
申请号:CN201910603697.4
申请日:2019-07-05
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/774 , G06K9/62 , G06N20/00
Abstract: 本公开关于一种图像检测模型的训练方法、装置及存储介质,所述方法,包括:获取用以训练目标模型的样本图像集合;根据所述样本图像集合中包含的不同样本类别对应的样本数量,以及所述目标模型针对当前输入的目标样本图像的预测概率,确定所述目标模型针对所述目标样本图像的类别回归损失函数;针对所述样本图像集合中的每个样本图像,调整所述目标模型的类别回归损失函数,并通过所述样本图像训练所述目标模型中的模型参数。解决了在样本不均衡的情况下,训练任务比较难收敛,训练得到的模型的准确率和召回率不高的技术问题。取得了提高样本数量少的样本类别的收敛速度,增加训练得到的模型的准确率和召回率的有益效果。
-
公开(公告)号:CN112381091A
公开(公告)日:2021-02-19
申请号:CN202011322639.3
申请日:2020-11-23
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种视频内容识别方法,该方法包括:从视频中获取包含有文本行的目标视频帧;对所述目标视频帧进行文字识别操作,获得所述文本行对应的文字识别结果;所述文字识别结果所述文字识别结果包括文本行位置信息、文本行内容信息和文本行区域图像;根据所述文本行区域图像,提取出所述文本行对应的文本图像特征,以及,根据所述文本行位置信息、所述文本行内容信息和所述文本行区域图像,提取出所述文本行对应的内容关联特征;根据所述文本图像特征和所述内容关联特征,确定所述文本行在所述视频中的结构化信息;所述结构化信息用于对所述视频进行视频内容识别操作。采用该方法可以解决相关技术中视频内容识别准确度不高的问题。
-
公开(公告)号:CN110443280A
公开(公告)日:2019-11-12
申请号:CN201910603697.4
申请日:2019-07-05
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种图像检测模型的训练方法、装置及存储介质,所述方法,包括:获取用以训练目标模型的样本图像集合;根据所述样本图像集合中包含的不同样本类别对应的样本数量,以及所述目标模型针对当前输入的目标样本图像的预测概率,确定所述目标模型针对所述目标样本图像的类别回归损失函数;针对所述样本图像集合中的每个样本图像,调整所述目标模型的类别回归损失函数,并通过所述样本图像训练所述目标模型中的模型参数。解决了在样本不均衡的情况下,训练任务比较难收敛,训练得到的模型的准确率和召回率不高的技术问题。取得了提高样本数量少的样本类别的收敛速度,增加训练得到的模型的准确率和召回率的有益效果。
-
公开(公告)号:CN110263730A
公开(公告)日:2019-09-20
申请号:CN201910550592.7
申请日:2019-06-24
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种图像识别方法、装置、电子设备及存储介质,该方法包括:获取待识别图像;将待识别图像输入到预先训练的目标算法模型中,得到待识别图像的潜在识别区域,其中,潜在识别区域为包含指定内容、且大小不大于预设阈值大小的区域;对潜在识别区域进行上采样;利用目标算法模型对上采样后的潜在识别区域进行分析,得到分类识别结果。本公开的图像识别方法,获取潜在识别区域,并对潜在识别区域进行上采样,进而得到潜在识别区域的分类识别结果,提高了对小物体识别的成功率。并且分类识别及潜在识别区域的识别均利用同一目标算法模型,能够有效减少计算量,并且大大降低了目标算法模型的复杂程度。
-
公开(公告)号:CN113989703A
公开(公告)日:2022-01-28
申请号:CN202111210643.5
申请日:2021-10-18
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开提供媒体资源标注方法、装置、设备及存储介质,涉及数据处理技术领域,以解决媒体资源标注消耗大量人力成本问题。该方法包括:获取待标注媒体资源中至少两个采样媒体资源帧的初始标注信息;对于每一采样媒体资源帧从至少两个采样媒体资源帧中确定相似采样媒体资源帧;对每一采样媒体资源帧的中对象的初始标注信息和各自对应的相似采样媒体资源帧中对象的初始标注信息进行同化处理得到每个采样媒体资源帧中对象的目标标注信息;基于每个采样媒体资源帧中对象的目标标注信息确定每两个相邻采样媒体资源帧之间的非采样媒体资源中对象的标注信息;将所有目标标注信息和非采样媒体资源中对象的标注信息作为待标注媒体资源中对象的标注信息。
-
公开(公告)号:CN110263730B
公开(公告)日:2022-01-21
申请号:CN201910550592.7
申请日:2019-06-24
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种图像识别方法、装置、电子设备及存储介质,该方法包括:获取待识别图像;将待识别图像输入到预先训练的目标算法模型中,得到待识别图像的潜在识别区域,其中,潜在识别区域为包含指定内容、且大小不大于预设阈值大小的区域;对潜在识别区域进行上采样;利用目标算法模型对上采样后的潜在识别区域进行分析,得到分类识别结果。本公开的图像识别方法,获取潜在识别区域,并对潜在识别区域进行上采样,进而得到潜在识别区域的分类识别结果,提高了对小物体识别的成功率。并且分类识别及潜在识别区域的识别均利用同一目标算法模型,能够有效减少计算量,并且大大降低了目标算法模型的复杂程度。
-
公开(公告)号:CN110619350B
公开(公告)日:2021-06-18
申请号:CN201910741273.4
申请日:2019-08-12
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开关于一种图像检测方法、装置和存储介质。所述方法,包括:获取目标图像的特征图;根据所述特征图,通过图像检测模型,获取所述目标图像的第一检测结果,所述第一检测结果包括所述目标图像中包含的检测框、所述检测框的第一预测类别、所述第一预测类别的置信度;响应于所述第一预测类别的置信度满足第一阈值条件,获取所述第一预测类别对应的目标检测框;通过预设的分类模型,提取所述目标检测框的图像特征,并基于所述图像特征获取所述目标检测框的最终预测类别;其中,所述分类模型独立于所述图像检测模型,且与所述图像检测模型级联。从而取得了提高图像检测结果准确性以及图像检测方案适用性的有益效果。
-
公开(公告)号:CN111897996B
公开(公告)日:2023-10-31
申请号:CN202010797673.X
申请日:2020-08-10
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/735 , G06F16/78 , G06F16/783
Abstract: 本公开关于一种话题标签推荐方法、装置、设备及存储介质,属于多媒体技术领域。本公开的实施例提供了一种基于视频在多个模态的特征来推荐话题标签的方法,通过视频中的图像以及视频生产者的用户特征,由机器自动化地生成话题标签,将话题标签推荐给用户。由于推荐的话题标签既与视频的内容匹配,又体现了视频生产者自身的信息,因此充分保证了话题标签与视频之间的匹配度,从而提高了话题标签的精确性,使得推荐的话题标签更加贴近用户意图。
-
-
-
-
-
-
-
-
-