Patent search ap:("北京中科闻歌科技股份有限公司") AND inv:"徐楠" Page 9

81.

发明公开
一种领域预训练模型数据构建方法和系统无效

公开(公告)号：CN117786465A

公开(公告)日：2024-03-29

申请号：CN202410199457.3

申请日：2024-02-23

Applicant: 北京中科闻歌科技股份有限公司 , 天津中科闻歌科技有限公司

Inventor： 王林 , 徐楠 , 董立峰 , 罗引 , 王磊

IPC: G06F18/24 , G06F18/214 , G06N3/08

Abstract: 本发明公开了一种领域预训练模型数据构建方法和系统，包括：自动化数据质量筛选模块。本模块采用混合算法，结合领域专家知识和自定义规则，自动筛选用于标注的原始数据质量，对于低质量的文本数据在本环节直接排除掉。自定义的规则包括：文本信息熵筛查、困惑度筛查、重复度筛查、完整性筛查。本发明一种领域预训练模型数据构建系统及方法，能够提高数据集的质量和多样性，确保预训练模型在领域的应用场景中发挥出最佳的效能。

82.

发明授权
一种基于异常检测的社交机器人检测方法及装置有权

公开(公告)号：CN112685204B

公开(公告)日：2024-03-05

申请号：CN202011593204.2

申请日：2020-12-29

Applicant: 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司 , 深圳中科闻歌科技有限公司

Inventor： 王宇琪 , 孔庆超 , 王婧宜 , 徐楠 , 彭鑫 , 曲宝玉 , 曹家 , 罗引 , 王磊 , 奉凡

IPC: G06F11/00 , G06Q50/00

Abstract: 本申请涉及一种基于异常检测的社交机器人检测方法及装置，其中方法包括：在目标数据源中，筛选得到满足预设数量要求，且对应于目标类别的待检测信息；通过确定发布各个所述待检测信息的账户，得到每个所述账户对应的待检测信息集；根据所述待检测信息集，确定所述账户对应的行为特征信息；采用预设异常检测算法对所述行为特征信息进行异常检测，确定所有行为特征信息中的异常行为特征信息；基于异常行为特征信息确定所有账户中的社交机器人账户。通过本实施例中的方法，只依赖于筛选得到的待检测信息即可快速确定社交机器人账户，相对于人工筛选，可以有效提高处理效率以及准确率。

83.

发明公开
实时问答虚拟人视频生成方法、电子设备及存储介质审中-实审

公开(公告)号：CN116996630A

公开(公告)日：2023-11-03

申请号：CN202310964008.9

申请日：2023-08-02

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 陈博 , 郑洋 , 李彤 , 徐楠 , 李军锋 , 曹家 , 王磊

IPC: H04N5/262 , G10L21/10 , G10L21/18 , H04N5/265 , G06N3/0475 , G06N3/094 , G06F16/332

Abstract: 本发明提供了一种实时问答虚拟人视频生成方法、电子设备及存储介质，方法包括：基于待播报信息获取对应的场景视频；对音频文件进行特征提取，得到对应的音频特征；基于场景视频和音频特征，生成口型与音频特征相匹配的场景视频，作为初始人脸驱动视频；基于场景视频中的目标图像以及初始驱动视频，获取对应的人脸关键点、人脸深度图和人脸的RGB编码特征；基于获取的人脸关键点、人脸深度图和人脸的RGB编码特征，得到目标人脸驱动视频；利用目标人脸驱动视频中的人脸替换场景视频中的人脸，得到虚拟人视频；将虚拟人视频和音频文件进行合成，得到待播报的虚拟人播报视频。本发明能够提高虚拟人视频的制作效率。

84.

发明公开
逆转图像重建方法、装置、设备及可读存储介质审中-实审

公开(公告)号：CN116862803A

公开(公告)日：2023-10-10

申请号：CN202310864682.X

申请日：2023-07-13

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 徐楠 , 郝艳妮 , 陈博 , 李军锋 , 曹家 , 王磊

IPC: G06T5/00 , G06V10/56 , G06V10/82 , G06N3/0464 , G06V10/44 , G06N3/048

Abstract: 本公开涉及一种逆转图像重建方法、装置、设备及可读存储介质。本公开通过获取待逆转图像，所述待逆转图像包括待逆转的高质量图像和/或待逆转的低质量图像，对所述待逆转图像进行逆转处理，得到逆转图像。由于对所述待逆转图像进行逆转处理，得到逆转图像，进而可以对逆转图像的隐空间特征进行约束，使逆转得到的隐空间特征的分布更符合GAN隐空间中原始隐空间编码的分布，在图像编辑中减少图像伪影的出现，从而提高真实图像的图像编辑的效果。并且，本公开实施例可以适用于高质量图像以及低质量图像，提高了逆转方法的泛化性能，提升了低质量图像逆转的重建效果，保证了GAN逆转方法对图像质量的稳定性。

85.

发明授权
一种视频合成方法、装置、设备及存储介质有权

公开(公告)号：CN112866586B

公开(公告)日：2023-03-07

申请号：CN202110003232.2

申请日：2021-01-04

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 徐楠 , 郝艳妮 , 罗引 , 张西娜 , 孔庆超 , 吴晓飞 , 曲宝玉 , 曹家 , 王磊

IPC: H04N5/265 , G10L13/04 , G10L13/047 , G10L21/10 , G10L25/57

Abstract: 本发明实施例公开了一种视频合成方法、装置、设备及存储介质。获取的待合成文本可以是任意语种的文本，待合成视频可以是用户选择的包括任意主播形象的视频片段，根据获取的待合成文本自动生成音频流，基于待合成视频中的无音视频流生成视频特征和唇部特征，并根据音频流生成音频特征和口型特征，基于口型特征和唇部特征确定口唇映射关系，根据口唇映射关系生成口唇一致的视频序列，进一步地，根据融合后的视频序列，生成目标合成视频，使整个目标合成视频中的人脸和唇部动作保持一致，并使目标合成视频中的主播唇动保持自然一致，并生成符合用户意愿的目标合成视频，提高用户观看体验。

Previous page
1
2
3
4
5
6
7
8
9

Patent Agency Ranking