-
公开(公告)号:CN117808665A
公开(公告)日:2024-04-02
申请号:CN202311267704.0
申请日:2023-09-27
Applicant: 海信视像科技股份有限公司
IPC: G06T3/04 , G10L21/10 , G10L21/18 , G10L15/18 , G10L15/26 , G10L13/047 , G10L13/033 , G06V10/26 , G06V10/46 , G06V10/24 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/0455 , G06V20/40
Abstract: 本申请一些实施例示出一种服务器、显示设备及图像处理方法,所述方法包括:接收人脸图像数据;对所述人脸图像数据进行人脸分割预处理,得到多个部位对应的内部中间风格编码特征,所述内部中间风格编码特征为自然人脸风格的编码特征;获取多个部位的外部中间风格编码特征,所述外部中间风格编码特征为目标风格的编码特征;将所述内部中间风格编码特征和所述外部中间风格编码特征输入训练好的风格对抗生成网络模型中,生成目标风格化人脸图像数据。通过对人脸图像数据进行人脸分割预处理,得到真人形象域的结构特征,并通过外部网络控制目标域的生成转换,引入艺术风格特征,得到高清风格化人脸图像。
-
公开(公告)号:CN117808096A
公开(公告)日:2024-04-02
申请号:CN202311110983.X
申请日:2023-08-30
Applicant: 海信视像科技股份有限公司
IPC: G06N5/04 , G06N3/0455 , G06N3/0464 , G06N3/082 , G06F16/332 , G06F16/33
Abstract: 本公开涉及回复技术领域,尤其涉及一种回复方法、装置和电子设备,用于解决如何提升Transformer神经网络的推理速度的问题。该方法包括:获取至少两个待识别文本对应的拼接矩阵、待识别文本对应的掩膜操作矩阵、以及待识别文本对应的前缀和矩阵;基于拼接矩阵和前缀和矩阵,确定每个待识别文本的特征向量;对每个特征向量执行如下操作:基于特征向量和掩膜操作矩阵二者进行编码,得到特性向量对应的编码结果;基于解码器的解码参数、编码结果、上一周期的解码结果、以及掩膜操作矩阵四者进行解码,得到特征向量的解码结果;基于每个特征向量的解码结果,得到每个待识别文本的回复文本。
-
公开(公告)号:CN116152402A
公开(公告)日:2023-05-23
申请号:CN202211735800.9
申请日:2022-12-30
Applicant: 海信视像科技股份有限公司
IPC: G06T13/40 , G06T13/20 , G06T3/00 , G06N3/0475 , G06N3/094
Abstract: 本申请实施例提供了一种动画生成设备及方法,涉及显示技术领域。该动画生成设备及方法包括:首先对目标人脸图像进行风格迁移,获取所述目标人脸图像对应的迁移图像,再对所述迁移图像进行关键点检测,获取所述迁移图像的人脸关键点,根据所述人脸关键点和所述迁移图像的角点,确定所述迁移图像的驱动关键点和驱动锚点,然后获取所述迁移图像的纹理坐标以及所述迁移图像的多个纹理三角形;最终根据实时获取的驱动语音对应的顶点坐标序列、所述纹理坐标以及所述多个纹理三角形对所述迁移图像进行驱动,以生成所述目标人脸图像对应的风格迁移动画。本申请实施例用于提升通过目标人像生成风格迁移动画的转换效果。
-
公开(公告)号:CN115662390A
公开(公告)日:2023-01-31
申请号:CN202211189061.8
申请日:2022-09-28
Applicant: 海信视像科技股份有限公司
IPC: G10L13/10 , G06N3/045 , G06N3/0464 , G06N3/09
Abstract: 本公开涉及一种模型训练方法、韵律边界预测方法、装置及电子设备,尤其涉及语音合成技术领域;其中,该方法包括:获取训练样本,训练样本包括语音数据对应的音素序列、音素时长序列以及预先标注的韵律边界;将音素序列和音素时长序列输入至初始韵律边界预测模型,得到对应的韵律边界预测结果;基于预设损失函数,根据韵律边界预测结果和预先标注的韵律边界,对初始韵律边界预测模型进行训练,得到目标韵律边界预测模型。本公开实施例通过训练样本对初始韵律边界预测模型进行训练,得到目标韵律边界预测模型,能够实现韵律边界的自动预测,避免人工标注带来的高成本和误差,使得韵律边界预测结果更准确,且有利于提高合成的语音的准确性。
-
公开(公告)号:CN113139036B
公开(公告)日:2022-07-01
申请号:CN202010067585.4
申请日:2020-01-20
Applicant: 海信视像科技股份有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/36 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本申请提出一种信息交互方法及设备。该方法包括:接收接收来自于智能设备的查询请求,根据查询请求得到用户查询语句文本;获取知识库中与所述查询语句文本中实体指称对应的实体,并选择一个核心实体,根据所述核心实体的属性信息得到所述核心实体的候选三元组集合;抽取所述用户查询语句文本中的关系信息得到关系集合,将所述关系集合中的关系分别与所述核心实体组合得到候选逻辑表达式集合;筛选所述候选逻辑表达式,得到所述查询请求对应的候选答案集合;根据所述查询语句文本的语义向量与所述候选答案集合中每个答案的语义向量间的相似度选择所述查询请求对应的答案;向所述智能设备发送查询响应,所述查询响应携带所述查询请求对应的答案。
-
公开(公告)号:CN114464169A
公开(公告)日:2022-05-10
申请号:CN202011134640.3
申请日:2020-10-21
Applicant: 海信视像科技股份有限公司
IPC: G10L15/04 , G10L15/16 , G10L15/183 , G06F40/30
Abstract: 本申请公开了一种对话状态追踪方法、智能设备及服务设备。该智能设备,包括:输入接口和控制器;所述控制器被配置用于:将通过所述输入接口输入的本轮查询语句发送至服务设备,以使服务设备根据本轮查询语句与上轮查询语句的时间间隔、本轮查询语句与上轮查询语句的相似度以及本轮查询语句的定位领域及其得分,判断是否对本轮查询语句和上轮查询语句进行会话切分;根据会话切分的判断结果对用户的人机交互的会话进行切分,得到用户对应的至少一个切分后的会话语句;利用预设深度学习模型,对各会话语句进行处理,得到用户的各会话语句对应的对话状态信息,能够提高输出的对话状态信息的准确率,进而提高机器输出内容的准确性。
-
公开(公告)号:CN114187905A
公开(公告)日:2022-03-15
申请号:CN202010880811.0
申请日:2020-08-27
Applicant: 海信视像科技股份有限公司
IPC: G10L15/22 , G10L15/26 , G10L15/18 , G10L15/16 , G10L15/06 , H04N21/422 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请实施例提供了一种用户意图识别模型的训练方法、服务器及显示设备,训练方法包括:将训练样本集中的样本分为多个训练组,每个所述训练组包括支撑集和查询集;将所述训练组输入用户意图识别模型,分别提取支撑集的样本特征和查询集的样本特征;通过余弦函数计算所述支撑集的样本特征和查询集的样本特征之间的相似度;根据所述相似度计算所述用户意图识别模型的损失函数;通过多个所述训练组优化所述损失函数,直至所述用户意图识别模型收敛。本申请基于小样本分类的方式对用户意图识别模型进行训练,能够充分利用样本数据,提高了用户意图识别模型的泛化性和识别准确性。
-
公开(公告)号:CN113919325A
公开(公告)日:2022-01-11
申请号:CN202111277465.8
申请日:2021-10-29
Applicant: 海信视像科技股份有限公司
IPC: G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本申请实施例提供一种自然语言处理方法、设备、存储介质及程序产品,该方法包括获取目标文本,将所述目标文本输入自然语言处理NLP模型,得到目标处理结果,所述目标处理结果包括各标签及分别对应的概率值,将所述目标文本输入置信度模型,得到所述目标处理结果对应的置信度,所述置信度与所述各标签的概率值的分布相关,根据所述置信度,对所述目标处理结果进行处理。本申请实施例能够不依赖人工,通过专门训练得到置信度模型来确定NLP模型得到的目标处理结果的置信度,该置信度的范围可以是0到1之间的数值,提高了置信度的准确性。
-
公开(公告)号:CN113836935A
公开(公告)日:2021-12-24
申请号:CN202111057489.2
申请日:2021-09-09
Applicant: 海信视像科技股份有限公司
Abstract: 本申请实施例提供了一种服务器及文本纠错方法,服务器被配置为:对接收到的语音命令进行语音识别,得到待纠错文本;对所述待纠错文本进行检错,得到所述待纠错文本对应的待纠错实体;通过多种召回方法对所述待纠错实体进行候选召回,得到多个候选实;根据所述待纠错实体在多个预设层面的特征计算每个候选实体的概率,根据每个候选实体的概率确定所述待纠错实体对应的纠错后实体。本申请实施例通过多种召回方法对所述待纠错实体进行候选召回,实现了多视角召回,得到的候选实体数量众多且非常全面,根据每个候选实体的概率确定纠错后实体,提高了纠错准确率,能够很好地解决常见文本错误类型的文本错误。
-
公开(公告)号:CN111125303A
公开(公告)日:2020-05-08
申请号:CN201911207035.1
申请日:2019-11-29
Applicant: 海信视像科技股份有限公司
IPC: G06F16/33 , G06F16/338
Abstract: 本申请实施例提供一种用户输入语句误纠筛查方法及装置,该方法包括:接收用户输入语句;对所述用户输入语句进行纠错,得到所述用户输入语句对应的纠错结果;确定所述纠错结果是否与用户实际预期匹配;根据所述纠错结果是否与用户实际预期匹配,对所述用户输入语句进行响应。该方法可以仅在纠错结果合理时使用纠错结果对用户的输入进行响应处理,从而使得响应结果可以符合用户实际预期,极大提升用户的使用体验。
-
-
-
-
-
-
-
-
-