-
公开(公告)号:CN111583097A
公开(公告)日:2020-08-25
申请号:CN201911177083.0
申请日:2019-11-26
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请实施例提供了一种图像处理方法、装置、电子设备及计算机可读存储介质,属于图像处理领域,该方法包括:对待处理图像进行分割,得到待处理图像中的目标区域;对目标区域进行风格转换。基于本申请实施例提供的方案,能够提高图像的处理效果,更好的满足实际应用需求。
-
公开(公告)号:CN116361530A
公开(公告)日:2023-06-30
申请号:CN202111599816.7
申请日:2021-12-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F16/953 , G06N3/0464 , G06N3/08
Abstract: 本申请实施例提供了一种神经网络架构的搜索方法、装置、电子设备、计算机可读存储介质及计算机程序产品,涉及人工智能技术领域。该方法包括:获取搜索空间对应的超网络的性能信息;基于获取的性能信息,优化超网络的网络结构参数,或从搜索空间对应的超网络中搜索神经网络架构。本申请的实施有利于提高搜索得到的神经网络架构的性能。同时,由电子设备执行的上述神经网络架构的搜索方法可以使用人工智能模型来执行。
-
公开(公告)号:CN114792388A
公开(公告)日:2022-07-26
申请号:CN202110098019.4
申请日:2021-01-25
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06V10/80 , G06V10/40 , G06V10/82 , G06F16/35 , G06F40/126 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种图像描述文字生成方法、装置及计算机可读存储介质,其中方法包括:获取目标图像的视觉特征;基于目标图像的目标描述文字中的至少一个已知词,获取对应的融合向量;基于视觉特征和融合向量,获取目标图像的图像描述文字。其中,该方案的多个步骤都可以通过人工智能模块实现。该方案通过目标图像的图像描述文字中已知词获取对应的融合向量,再结合目标图像的视觉特征获取对应的新的已知词,进而根据这些词得到图像描述文字,该方案在生成图像描述文字过程中无需计算所有已知词与待预测词之间的注意力值,减小了计算开销。
-
公开(公告)号:CN111723937A
公开(公告)日:2020-09-29
申请号:CN202010152713.5
申请日:2020-03-06
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06N20/00
Abstract: 本申请实施例提供了一种多媒体数据的描述信息的生成方法、装置、设备及介质,该方法包括:提取待处理的多媒体数据的特征信息,其中,该多媒体数据包括视频或图像;基于所提取的特征信息,生成多媒体数据的文字描述。基于本申请实施例所提供的方法,能够有效提高所生成的多媒体数据的文字描述的准确性。
-
公开(公告)号:CN110555332A
公开(公告)日:2019-12-10
申请号:CN201810541055.1
申请日:2018-05-30
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请实施例提供了一种基于图像生成文本信息的方法、电子设备及存储介质,该方法包括:获取待处理图像的第一图像特征信息,以及至少一个文本属性对应的文本属性信息;根据第一图像特征信息和文本属性信息,确定待处理图像所对应的文本信息。本申请实施例的方案,通过将待处理图像的图像特征信息和图像的文本属性信息结合,基于多维度特征实现了对图像所对应文本信息的生成,通过本申请实施例的方案,能够有效提高基于图像所生成的文本信息的精度。
-
公开(公告)号:CN115222011A
公开(公告)日:2022-10-21
申请号:CN202110414442.0
申请日:2021-04-16
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请实施例涉及AI技术领域,提供了一种神经网络架构搜索方法。该方法中,在获得搜索空间内的第一候选操作集之后,电子设备根据第一候选操作集各个候选操作的权值,从第一候选操作集中获得至少两个第一目标操作,以根据该至少两个第一目标操作获得数据处理网络。其中,第一候选操作集包含搜索空间内至少两个子空间的候选操作,且第一候选操作集中各个候选操作的权值的和为1。即,本方法以全部候选子空间作为权值归一化的基础。可见,采用本技术方案,基于搜索空间的全局性能从搜索空间中获得数据处理网络,从而能够确保所得到的数据处理网络的性能最佳。
-
公开(公告)号:CN113747168A
公开(公告)日:2021-12-03
申请号:CN202010478653.6
申请日:2020-05-29
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: H04N19/42 , H04N21/2343 , H04N21/4402 , G06N3/08 , G06N3/04
Abstract: 本申请提供了多媒体数据描述模型的训练方法和描述信息的生成方法,该模型包括依次级联的编码模块和解码模块,解码模块包括至少一个解码器,该训练方法包括:获取训练数据集;基于训练数据集对模型进行训练,直至模型的总损失函数收敛;总损失函数包括第一损失函数,训练时,对于训练数据集中的每一样本多媒体数据,将该样本多媒体数据输入至编码模块中,得到编码特征,将编码特征分别输入至各解码器中,得到各解码器的第一解码结果;基于各样本多媒体数据的各描述标注和对应于各解码器的第一解码结果,计算第一损失函数的值。基于本申请提供的方法,能够有效提高生成的多媒体数据的描述信息的准确性。
-
公开(公告)号:CN113742520A
公开(公告)日:2021-12-03
申请号:CN202010476330.3
申请日:2020-05-29
Applicant: 北京大学 , 北京三星通信技术研究有限公司
IPC: G06F16/732 , G06F16/78 , G06F16/783 , G06K9/62
Abstract: 本发明公布了一种基于半监督学习的密集视频描述算法的视频查询检索方法,通过半监督学习的方法训练密集视频描述网络模型,利用大量的无标注视频数据,提升密集视频描述算法的性能;实现的视频查询检索系统包括:密集视频描述网络模型、半监督学习模块和视频查询检索模块、视频数据库。采用本发明提供的技术方案,能够有效提高视频查询检索的精度。
-
公开(公告)号:CN113742520B
公开(公告)日:2023-11-07
申请号:CN202010476330.3
申请日:2020-05-29
Applicant: 北京大学 , 北京三星通信技术研究有限公司
IPC: G06F16/732 , G06F16/78 , G06F16/783 , G06V10/774
Abstract: 本发明公布了一种基于半监督学习的密集视频描述算法的视频查询检索方法,通过半监督学习的方法训练密集视频描述网络模型,利用大量的无标注视频数据,提升密集视频描述算法的性能;实现的视频查询检索系统包括:密集视频描述网络模型、半监督学习模块和视频查询检索模块、视频数据库。采用本发明提供的技术方案,能够有效提高视频查询检索的精度。
-
-
-
-
-
-
-
-