-
公开(公告)号:CN118840458A
公开(公告)日:2024-10-25
申请号:CN202410942273.1
申请日:2024-07-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例涉及数字人穿模矫正方法及装置,方法包括:首先,获取数字人的第一动作序列,其中包括数字人在多个时间帧的位姿信息;然后,将目标变量在第一动作序列中取极值时的时间帧确定为关键帧,得到关键帧集合;所述目标变量用于表征数字人关节属性;接下来,根据关键帧内数字人各个肢体部位的表面顶点关于其它各个肢体部位的有向距离场,确定各个关键帧的穿模损失;然后,根据基于所述穿模损失所确定的目标总损失,调整所述关键帧内各个关节的旋转角,以更新所述关键帧的位姿信息;最后,基于更新后的各个关键帧的位姿信息,对第一动作序列中各个非关键帧的位姿信息进行插值计算,得到更新后的第二动作序列。
-
公开(公告)号:CN118410789A
公开(公告)日:2024-07-30
申请号:CN202410425777.6
申请日:2024-04-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/20 , G06N3/08 , G06N3/045 , G06N3/0442 , G06F18/24
Abstract: 本公开提供一种多音字的读音预测方法和系统,包括:获得待预测文本,待预测文本包括待预测多音字,从预先训练的各模型信息中,获得与待预测多音字对应的目标模型信息,其中,目标模型信息包括目标微调参数矩阵和目标分类器,根据预设编码器和目标模型信息确定与待预测文本对应的目标读音预测结果,目标读音预测结果包括与待预测多音字对应的目标读音,预测系统在对预测待预测文本进行读音预测的情况下,共享预设编码器,调用专属的目标模型信息,以结合预设编码器和目标模型信息确定待预测文本中的多音字的目标读音,可以提高对多音字预测的准确性,进而可以提高对待预测文本的读音预测的准确性和可靠性。
-
公开(公告)号:CN117012178A
公开(公告)日:2023-11-07
申请号:CN202310954803.X
申请日:2023-07-31
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了韵律标注数据生成方法及装置,该方法包括:从目标视频中提取目标音频,以及提取目标音频对应的目标文本;利用预训练的音频文本对齐模型,对目标音频和目标文本进行字级别的对齐处理,得到对齐结果;基于对齐结果,对目标音频进行特征提取处理,从而得到目标文本中的各个字分别对应的音频特征;利用预设的关联于多个韵律标签的韵律识别规则,基于音频特征确定各个字分别对应的韵律标签;在目标文本中为各个字分别标注识别的韵律标签,并将标注后的目标文本作为韵律标注数据。
-
公开(公告)号:CN116993873A
公开(公告)日:2023-11-03
申请号:CN202310957070.5
申请日:2023-07-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06T13/40 , G06F16/33 , G06F40/211 , G06F40/284 , G06F40/289 , G06F40/30
Abstract: 本说明书实施例涉及一种数字人动作编排方法及装置,所述方法的输入包括目标文本对应的第一词语序列和第一动作集合,第一动作集合中包含若干动作,任一动作具有预设的触发词以及对应的动作持续时长;然后,根据动作对应的触发词,将所述第一词语序列中的各个词语与所述第一动作集合的动作进行匹配,得到第一匹配结果,第一匹配结果中包含各个词语对应的备选动作集合;然后,根据各个词语在所述目标文本中的位置,以及动作的动作持续时长,从所述第一匹配结果中确定一组在时间维度上没有重叠的动作序列,得到第一动作序列,所述第一动作序列用于指示所述数字人在播报所述目标文本时做出相应的动作。
-
公开(公告)号:CN111552787B
公开(公告)日:2023-06-30
申请号:CN202010328553.5
申请日:2020-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/289 , G06F40/35 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例公开了一种问答处理方法、装置、设备及存储介质,获取用户问题匹配的候选对话记录集,针对候选对话记录集中每段对话记录,以用户问题替换对话记录的代表问题,得到待分类的文本对象,并通过文本分类模型对文本对象进行分类,得到表征用户问题与对话记录之间的匹配程度文本对象的文本分类结果,根据每个文本对象的文本分类结果,从候选对话记录集选出目标对话记录,并将目标对话记录提供给当前提问用户。
-
公开(公告)号:CN111538906B
公开(公告)日:2023-06-20
申请号:CN202010477510.3
申请日:2020-05-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F21/62 , G06F40/30 , G06N3/0464
Abstract: 本说明书实施例提供一种基于隐私保护的信息推送方法和装置,可以用于在保护用户隐私数据的前提下,基于历史会话中的对象选择序列建立异构图,并根据异构图体现出的推送对象之间的深层关联关系,从多个候选推送对象中确定若干个目标对象进行信息推送。根据一个实施方式,可以获取当前会话中的对象选择序列,并添加目标项构成预测序列,接着,将预测序列中的各项基于异构图确定描述向量,再根据各个描述向量推测目标项的预测向量,之后根据预测向量和各个候选推送对象的描述向量的对比,为目标项确定多个目标对象。该实施方式可以提高信息推送的准确度。
-
公开(公告)号:CN112948580B
公开(公告)日:2023-05-12
申请号:CN202110154293.9
申请日:2021-02-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35
Abstract: 本说明书实施例提供了一种文本分类的方法和系统。所述方法包括:获取待分类文本;确定所述待分类文本中的至少一个关键词;通过文本分类模型处理所述至少一个关键词及所述待分类文本,确定所述待分类文本的类别。可以通过文本分类模型,基于待分类文本及待分类文本对应的至少一个关键词的特征信息确定待分类文本的类别,可以实现在待分类文本中融合上关键词嵌入信息,从而更准确地完成文本分类。
-
公开(公告)号:CN110765247B
公开(公告)日:2022-10-25
申请号:CN201910940923.8
申请日:2019-09-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/35 , G06F16/9535
Abstract: 本说明书提供一种用于问答机器人的输入提示方法及装置,所述方法包括:对问答机器人接收到的提问输入信息进行分词、归一化预处理,基于预处理后的信息在知识点数据库中选择搜索候选提示信息,并以文本相似度和候选提问信息的频次信息即流量占比作为衡量指标,筛选出目标提示信息,将目标提示信息推荐给用户。
-
公开(公告)号:CN114996429A
公开(公告)日:2022-09-02
申请号:CN202210750003.1
申请日:2022-06-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06K9/62 , G16H80/00
Abstract: 公开了一种由计算机实现的自动问答方法,包括:获取对话前文,所述对话前文包括要回复的询问;基于所述对话前文,利用检索模型在问答知识库中检索对所述询问的一个或多个第一候选回复;基于所述对话前文,利用对话生成模型自动生成对所述询问的一个或多个第二候选回复,所述一个或多个第一候选回复和所述一个或多个第二候选回复构成候选回复集;利用回复打分模型对所述候选回复集中的候选回复打分;以及基于对所述候选回复集中的候选回复的打分结果从所述候选回复集中选择对所述询问的回复。本申请还涉及相关联的自动问答系统、装置和介质。本申请的方案能够更灵活、更高质量地生成对对话前文中的询问的回复。
-
公开(公告)号:CN112052323A
公开(公告)日:2020-12-08
申请号:CN202010952296.2
申请日:2020-05-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F16/335 , H04L12/58
Abstract: 本说明书提供的群聊机器人自主应答的方法和系统,在接收到所述目标通讯群中的目标用户发送的输入语句后,基于输入语句和预设的知识库生成一个与输入语句匹配的目标,并将所述目标答案发送给目标客户端或包括目标客户端在内的第二组客户端,以降低对其他用户的影响。所述方法不仅可以主动对用户提出的问题进行回答,同时又不会对群聊中的其他用户造成干扰,在提升工作效率的同时,又可以提升用户体验。
-
-
-
-
-
-
-
-
-