一种检测方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN116958976A

    公开(公告)日:2023-10-27

    申请号:CN202210774351.2

    申请日:2022-07-01

    Abstract: 本申请公开了一种检测方法、装置、设备及计算机可读存储介质,包括:获取待检测图像和目标检测模型,目标检测模型包括区域检测子模型和字符检测子模型;将待检测图像输入区域检测子模型,得到待检测图像中的书写区域和选中区域;将书写区域输入字符检测子模型,得到书写区域中的书写内容;基于待检测图像中不同类别的项目内容对待检测图像进行分割处理,得到分割位置信息;基于书写区域的第一位置信息、选中区域的第二位置信息、分割位置信息和预设的位置与语义之间的映射关系,分别确定书写区域和选中区域对应的语义信息,得到检测结果。如此,在语义分析的时候结合分割技术,增强识别结果的准确性,减少识别时长,并且简化识别过程。

    媒资召回方法、装置、电子设备及存储介质

    公开(公告)号:CN117150054A

    公开(公告)日:2023-12-01

    申请号:CN202311038448.8

    申请日:2023-08-16

    Abstract: 本发明涉及人工智能技术领域,提供一种媒资召回方法、装置、电子设备及存储介质,包括:获取当前媒资的海报图片及文本描述,生成海报特征向量和文本特征向量,输入多模态交叉联合学习网络第一层进行模态内特征学习,分别得到第一输出结果和第二输出结果并输入联合学习网络第二层捕捉文本和图像模态间联系,分别得到第三输出结果和第四输出结果并进行拼接,输入联合学习网络第三层进行多模态特征联合学习,得到当前媒资的联合表示;基于联合表示,计算当前媒资与其他媒资之间的相似度并排序,确定召回媒资集合。本发明通过堆叠的三层网络结构进行多模态交叉联合学习,考虑了图像模态对用户行为的影响,增加了召回样本的多样性,可以提升推荐效果。

    文本识别方法、装置、设备及存储介质

    公开(公告)号:CN111985465A

    公开(公告)日:2020-11-24

    申请号:CN202010825772.4

    申请日:2020-08-17

    Abstract: 本发明实施方式涉及图像处理技术领域,公开了一种文本识别方法、装置、设备及存储介质。本发明中,在基于预设的文本检测模型识别出待识别文本图像中包含的多个文本框后,通过基于各文本框的定位信息来确定对应文本框的中心坐标和行高,进而基于确定的中心坐标和行高对各文本框进行排序,从而将断开的同行文本、多个短文本能够按照实际顺序进行排序,最终基于排序获得的能够标识文本框在待识别文本图像中正确顺序的目标识别顺序将文本框输入预设的文本识别模型进行解析,从而保证了从待识别文本图像中识别出的文本信息的完整性和准确性。

    一种处理异常工单的方法及系统

    公开(公告)号:CN111191529A

    公开(公告)日:2020-05-22

    申请号:CN201911298894.6

    申请日:2019-12-17

    Abstract: 本发明的实施方式提供了一种处理异常工单的方法,其中,所述异常工单为除质检结论为合格的工单以外的其他工单。所述处理异常工单的方法包括:通过深度神经网络模型从所述异常工单中提取特征属性,其中,该特征属性具有m个维度,m>200;将所述特征属性转换成状态矩阵;将所述状态矩阵输入到异常工单决策模型中,其中,所述异常工单决策模型是以经过人工处理的异常工单的信息记录为样本数据通过深度强化学习算法训练得到的,所述异常工单决策模型的输入量为所述状态矩阵,所述异常工单决策模型的输出量为表征处理方案的权重向量;及通过所述异常工单决策模型计算出针对所述异常工单的处理方案。

    视频片段生成方法、装置、设备及可读存储介质

    公开(公告)号:CN118803346A

    公开(公告)日:2024-10-18

    申请号:CN202410010534.6

    申请日:2024-01-02

    Abstract: 本申请涉及视频处理领域,提供一种视频片段生成方法、装置、设备及可读存储介质。所述视频片段生成方法包括:对目标视频进行抽帧处理得到目标图像帧;对各所述目标图像帧进行人脸检测和目标行为检测,得到各所述目标图像帧中的关键图像帧;基于所述关键图像帧对所述目标视频的片段进行截取,得到关键视频片段。本申请通过对待处理的目标视频进行抽帧处理得到目标图像帧,然后对各目标图像帧进行人脸检测和目标行为检测,基于检测结果筛选各目标图像帧中的关键图像帧,最后在关键图像帧的基础上,对目标视频的片段进行截取,得到关键视频片段。适用于各种类型的长视频,泛化能力强,生成关键视频片段的效率高。

Patent Agency Ranking