一种语料标注方法、装置及相关设备

    公开(公告)号:CN115249018A

    公开(公告)日:2022-10-28

    申请号:CN202111582918.8

    申请日:2021-12-22

    Abstract: 本申请提供了一种语料标注方法,语料标注装置获取用户通过客户端提供的语料集合,该语料集合包括用户期望被标注的多种语义类别的语料,并确定语料集合中属于目标语义类别的人工标注语料以及自动标注语料,并获取针对该人工标注语料的人工标注结果,从而根据该人工标注语料的人工标注结果,对自动标注语料进行自动标注,该人工标注结果以及自动标注语料对应的自动标注结果用于作为训练数据对推理模型进行训练。如此,通过对部分语料进行自动标注,可以提高生成标注语料的效率、降低人力成本,同时,领域专家可以仅需对每一语义类别下的少量语料进行人工标注,从而可以减少人工标注的语料数量。此外,本申请还提供了对应的装置及相关设备。

    一种数字人绑定评估方法
    22.
    发明公开

    公开(公告)号:CN119068158A

    公开(公告)日:2024-12-03

    申请号:CN202311218488.0

    申请日:2023-09-20

    Abstract: 一种数字人绑定评估方法,涉及计算机视觉技术领域。方法包括获取待测数字人模型和标准数字人模型,待测数字人模型描述有通过目标绑定方法对骨骼和/或表情基绑定的不同点位,标准数字人模型用于表征绑定效果评估标准;通过目标驱动方式,分别驱动待测数字人模型和标准数字人模型,得到待测驱后数据和标准驱后数据,待测驱后数据用于表征待测数字人被驱动所形成的动画,标准驱后数据用于表征标准数字人模型被驱动所形成的动画;对待测驱后数据与标准驱后数据进行相似度评估,得到评估数据,以通过评估数据表征目标绑定方法对待测数字人模型的绑定效果。这样,可以实现客观、统一的数字人绑定效果评估。

    数字人视频的生成方法、装置、设备及存储介质

    公开(公告)号:CN118870137A

    公开(公告)日:2024-10-29

    申请号:CN202310429308.7

    申请日:2023-04-20

    Abstract: 本申请公开了一种数字人视频的生成方法、装置、设备及存储介质,属于人工智能技术领域。该方法包括:获取数字人对应的单张对象图像,响应于针对对象图像中对象属性的调整指令,生成用于展示对象属性调整后数字人状态的数字人图像资源,数字人图像资源包括至少一张数字人图像;用音频驱动数字人图像资源中的数字人做出与音频内容匹配的口型,以生成以对象属性调整后的状态表达音频内容的数字人视频。本申请提供了一种支持灵活编辑对象属性的数字人视频生成流程,基于输入的单张对象图像,无需更多操作,即可根据用户需求来调整数字人呈现的对象属性,生成自然、真实性强的数字人视频,提升用户体验,降低生成过程中提高真实性所需的操作成本。

    一种虚拟形象的管理方法及相关系统

    公开(公告)号:CN118521684A

    公开(公告)日:2024-08-20

    申请号:CN202310486823.9

    申请日:2023-04-28

    Abstract: 本申请提供了一种虚拟形象的管理方法,应用于人工智能(AI)技术领域,由虚拟形象的管理系统执行,该系统用于生成虚拟形象,虚拟形象为具有表情或动作的对象生物体的图像化表示,该方法包括:接收用户配置的包括第一对象的纹理信息的虚拟形象模板,获取用于驱动所述虚拟形象模板的视频数据和音频数据,从视频数据中提取第二对象的面部特征或动作特征,从音频数据中提取第二对象的面部特征或动作特征,将视频数据中提取的面部特征或动作特征以及音频数据中的提取的面部特征或动作特征映射至虚拟形象模板,获得所述虚拟形象。如此可以实现自然、真实地生成数字人等虚拟形象,提升生成效果,能够满足业务需求。

    虚拟人视频生成方法和装置
    25.
    发明公开

    公开(公告)号:CN117011401A

    公开(公告)日:2023-11-07

    申请号:CN202210457342.0

    申请日:2022-04-27

    Abstract: 本申请公开了一种虚拟人视频生成方法和装置,该方法包括:获取驱动文本;基于驱动文本和第一视频的动作标注,获取与驱动文本对应的动作类型,其中,动作标注中包括第一视频中的人物的多个动作类型;基于动作类型,从第一视频中提取出与驱动文本对应的动作表示;基于动作表示,生成虚拟人视频。通过本申请,可以自动生成人物动作准确、可控并符合预设动作规范的虚拟人视频,且可以通过调整动作规范来实现虚拟人动作的个性化定制。

    2d数字人动作库的生成方法、装置、集群和存储介质

    公开(公告)号:CN119091015A

    公开(公告)日:2024-12-06

    申请号:CN202311100254.6

    申请日:2023-08-29

    Abstract: 本公开提供了一种2d数字人动作库的生成方法、装置、集群和存储介质,属于2d数字人技术领域。该方法包括:获取第一图像文件和第一形象在目标场景的参考动作库,第一图像文件包括第二形象的2d真人照片或者第二形象的2d真人动作视频,参考动作库包括第一形象的多个2d数字人动作,基于第一图像文件和参考动作库,生成第二形象在目标场景的基础动作库,该基础动作库包括多个2d数字人动作,基础动作库中的2d数字人动作与该参考动作库中的2d数字人动作相同,基础动作库用于生成第二形象的2d数字人动作视频。采用本公开的方法,获得2d数字人动作库时能够自动获得动作库,提升2d数字人动作库的获得效率。

    一种数字人的音唇同步评测方法、装置及计算设备集群

    公开(公告)号:CN119071468A

    公开(公告)日:2024-12-03

    申请号:CN202310840758.5

    申请日:2023-07-10

    Abstract: 一种数字人的音唇同步评测方法,包括:获取用户输入的数字人视频;将数字人视频中的音频转换为第一文本,并对第一文本进行切分,得到多个子文本;确定数字人视频包含的各个子视频中数字人的嘴型和相应的子视频中音频之间的匹配程度,得到多个音唇同步准确率,其中,一个音唇同步准确率与一个子视频关联;基于子文本的时间戳和音唇同步准确率对应的子视频的时间戳,在时间上将各个子文本与各个音唇同步准确率对齐,得到各个子文本对应的音唇同步准确率;输出各个子文本对应的音唇同步准确率。这样,用户可以通过各个子文本对应的音唇同步准确率,快速的定位到数字人视频中哪些部分的音唇同步需要改善,并对数字人视频制作流程进行优化。

    一种3D人脸动画生成方法及装置
    28.
    发明公开

    公开(公告)号:CN118537457A

    公开(公告)日:2024-08-23

    申请号:CN202310627046.5

    申请日:2023-05-30

    Abstract: 一种3D人脸动画生成方法及装置,包括:获取3D人脸基准模型和待处理的音频数据以及该音频数据对应的脸部状态语义信息,其中,脸部状态语义信息用于指示所述音频数据所包括的每一段语音内容对应的脸部状态;基于所述3D人脸基准模型、音频数据和脸部状态语义信息,生成3D人脸动画,该3D人脸动画中的3D人脸基准模型受音频数据驱动做出与所述音频数据的每一段语音内容相匹配的脸部状态,使得该3D人脸动画能够更加真实准确、自然流畅表达出一段音频数据中的情绪变化。

    一种数字人视频生成方法及相关装置

    公开(公告)号:CN118537456A

    公开(公告)日:2024-08-23

    申请号:CN202310505617.8

    申请日:2023-05-06

    Abstract: 本申请提供了一种数字人视频生成方法及相关装置,所述方法应用于数字人生成领域,所述方法包括:获取第一音频,使用第一音频驱动数字人,生成第一数字人视频,其中,第一数字人视频中包括数字人的第一面部动作系列和第一肢体动作序列中的至少一种,第一音频与第一面部动作系列和第一肢体动作序列中的至少一种适配,其中,面部动作包括面部各个器官的微表情和面部肌肉的微表情。将音频应用于数字人领域,使得数字人的肢体动作和面部动作可以随着音频的变化而变化,实施本申请实施例,丰富了数字人的形态、表情和动作。

    派单方法、系统以及计算机设备集群

    公开(公告)号:CN117391324A

    公开(公告)日:2024-01-12

    申请号:CN202210776484.3

    申请日:2022-07-01

    Abstract: 本申请涉及智能派单技术领域,特别涉及一种派单方法、系统以及计算机设备集群。本申请的派单方法可根据工单内容等信息,按照疑难程度、工单与派送对象之间的适配程度对工单进行分类,将需要依赖人工处理的疑难工单以及非疑难工单中置信度较低的工单发送至人工池,使这些类别的工单在人工辅助派发的基础上得到准确且及时的处理,将不需要依赖人工处理的非疑难中置信度高的工单派发至与其置信度对应的派发对象进处理,这种根据工单类型采用不同派发方式进行工单派发的方法,可保证各类型工单都能得到及时准确地处理,提高了工单处理的效率,提高了用户体验。

Patent Agency Ranking