-
公开(公告)号:CN115222011A
公开(公告)日:2022-10-21
申请号:CN202110414442.0
申请日:2021-04-16
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请实施例涉及AI技术领域,提供了一种神经网络架构搜索方法。该方法中,在获得搜索空间内的第一候选操作集之后,电子设备根据第一候选操作集各个候选操作的权值,从第一候选操作集中获得至少两个第一目标操作,以根据该至少两个第一目标操作获得数据处理网络。其中,第一候选操作集包含搜索空间内至少两个子空间的候选操作,且第一候选操作集中各个候选操作的权值的和为1。即,本方法以全部候选子空间作为权值归一化的基础。可见,采用本技术方案,基于搜索空间的全局性能从搜索空间中获得数据处理网络,从而能够确保所得到的数据处理网络的性能最佳。
-
公开(公告)号:CN113747168A
公开(公告)日:2021-12-03
申请号:CN202010478653.6
申请日:2020-05-29
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: H04N19/42 , H04N21/2343 , H04N21/4402 , G06N3/08 , G06N3/04
Abstract: 本申请提供了多媒体数据描述模型的训练方法和描述信息的生成方法,该模型包括依次级联的编码模块和解码模块,解码模块包括至少一个解码器,该训练方法包括:获取训练数据集;基于训练数据集对模型进行训练,直至模型的总损失函数收敛;总损失函数包括第一损失函数,训练时,对于训练数据集中的每一样本多媒体数据,将该样本多媒体数据输入至编码模块中,得到编码特征,将编码特征分别输入至各解码器中,得到各解码器的第一解码结果;基于各样本多媒体数据的各描述标注和对应于各解码器的第一解码结果,计算第一损失函数的值。基于本申请提供的方法,能够有效提高生成的多媒体数据的描述信息的准确性。
-
公开(公告)号:CN117274579A
公开(公告)日:2023-12-22
申请号:CN202210682096.9
申请日:2022-06-15
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请实施例提供了一种图像处理方法及相关设备,涉及人工智能技术领域。其中,图像处理方法包括:获取目标图像;划分所述目标图像,得到至少一个子图像;通过与子图像匹配的目标解码器确定子图像的语义分割结果;基于子图像的语义分割结果确定目标图像的语义分割结果。本申请的实施可以针对不同的子图像采用不同的解码器确定各自相应的语义分割结果,极大地提高目标图像语义分割的资源利用效率,降低不必要的资源浪费。同时,上述图像处理方法可以使用人工智能模型来执行。
-
公开(公告)号:CN116361530A
公开(公告)日:2023-06-30
申请号:CN202111599816.7
申请日:2021-12-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F16/953 , G06N3/0464 , G06N3/08
Abstract: 本申请实施例提供了一种神经网络架构的搜索方法、装置、电子设备、计算机可读存储介质及计算机程序产品,涉及人工智能技术领域。该方法包括:获取搜索空间对应的超网络的性能信息;基于获取的性能信息,优化超网络的网络结构参数,或从搜索空间对应的超网络中搜索神经网络架构。本申请的实施有利于提高搜索得到的神经网络架构的性能。同时,由电子设备执行的上述神经网络架构的搜索方法可以使用人工智能模型来执行。
-
公开(公告)号:CN114792388A
公开(公告)日:2022-07-26
申请号:CN202110098019.4
申请日:2021-01-25
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06V10/80 , G06V10/40 , G06V10/82 , G06F16/35 , G06F40/126 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种图像描述文字生成方法、装置及计算机可读存储介质,其中方法包括:获取目标图像的视觉特征;基于目标图像的目标描述文字中的至少一个已知词,获取对应的融合向量;基于视觉特征和融合向量,获取目标图像的图像描述文字。其中,该方案的多个步骤都可以通过人工智能模块实现。该方案通过目标图像的图像描述文字中已知词获取对应的融合向量,再结合目标图像的视觉特征获取对应的新的已知词,进而根据这些词得到图像描述文字,该方案在生成图像描述文字过程中无需计算所有已知词与待预测词之间的注意力值,减小了计算开销。
-
公开(公告)号:CN111723937A
公开(公告)日:2020-09-29
申请号:CN202010152713.5
申请日:2020-03-06
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06N20/00
Abstract: 本申请实施例提供了一种多媒体数据的描述信息的生成方法、装置、设备及介质,该方法包括:提取待处理的多媒体数据的特征信息,其中,该多媒体数据包括视频或图像;基于所提取的特征信息,生成多媒体数据的文字描述。基于本申请实施例所提供的方法,能够有效提高所生成的多媒体数据的文字描述的准确性。
-
-
-
-
-