-
公开(公告)号:CN114491024A
公开(公告)日:2022-05-13
申请号:CN202111680038.4
申请日:2021-12-31
Applicant: 长城信息股份有限公司
IPC: G06F16/35 , G06F40/30 , G06F16/2458 , G06K9/62
Abstract: 本发明公开了一种基于小样本的特定领域多标签文本分类方法,通过对原始语料中带有原始标签的语料进行标签进行分类,然后改变原始标签进行语料扩充,并基于扩充后的语料,通过mask language model对预训练语言模型进行了多任务的训练来更新模型参数,使模型充分学习到领域的语义知识,在预测的阶段则使用知识库检索的方式,使用knn减少随机性,提升分类结果的准确性。在得到预测的结果后,继续将预测的结果当作人工标签重复上述步骤,使模型能够继续学习本领域的知识,并且检索知识库也越来越大,分类的结果也得到相应的提升。
-
公开(公告)号:CN117237521A
公开(公告)日:2023-12-15
申请号:CN202310172081.2
申请日:2023-02-27
Applicant: 长城信息股份有限公司
IPC: G06T17/00 , G10L25/18 , G10L25/30 , G06T15/20 , G06N3/0442 , G06N3/0475 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种语音驱动人脸生成模型构建方法、目标人说话视频生成方法,其中模型构建方法包括:获取目标人视频数据和音频数据;将视频数据进行分帧,确定每一帧的3DMM系数;分别提取3DMM系数中关联表情和姿态的系数,构建表情特征向量和姿态特征向量;构建基于LSTM网络的语音‑系数映射模型;利用微分渲染器得到初步渲染图序列;构建基于GAN网络的真实感渲染网络;先后对语音‑系数映射模型和真实感渲染网络进行训练,得到最终的语音驱动人脸生成模型。给定目标人驱动音频数据,该模型可以生成具有真实感的目标人人脸渲染帧图像序列,结合驱动音频数据,即可合成高清且具有自然头部动作的目标人说话视频。
-
公开(公告)号:CN114187390A
公开(公告)日:2022-03-15
申请号:CN202111440928.8
申请日:2021-11-30
Applicant: 长城信息股份有限公司
IPC: G06T13/20 , G06T13/40 , G06F16/783 , G06F16/71 , G06F16/901 , G06F16/903
Abstract: 本发明公开了一种语音向具象化智能体三维图形流转化方法、设备及介质,其中方法包括:步骤1,对自然语音集合中每个音频帧,构建其与对应三维面部图形之间的映射关系,并存储映射关系集;步骤2,对需要转化的音频数据等间隔分帧处理得到音频帧序列,并在映射关系集检索音频帧对应的图形帧,再对得到的图形帧序列进行插值和平滑处理,得到最终的图形帧序列即可渲染为为具象化智能体动画。本发明不需要类似于深度学习的大量浮点数运算,不需要依赖独立图形处理器,降低了对硬件环境的要求,进而降低了部署成本,提高了适用范围。
-
公开(公告)号:CN114187111A
公开(公告)日:2022-03-15
申请号:CN202111530922.X
申请日:2021-12-15
Applicant: 长城信息股份有限公司
Abstract: 本发明公开了一种基于区块链的投资品NFT展示方法及装置,其中方法包括:将购买的投资品信息上传至区块链,通过智能合约铸造出投资品NFT;通过预言机系统周期性将链外的投资品动态收益数据并写入区块链存储单元;响应用户的请求,调用智能合约中的收益计算函数和写入区块链存储单元的投资品动态收益数据,计算出该投资品NFT的资产动态收益情况并展示。该投资品NFT具备可计算能力,可以自我计算收益等动态属性,当用户在链上进行投资品NFT的展示、交易、转移时,需要获取投资品NFT的当前收益情况,得到当前该投资品NFT的实际总价值以进行展示。
-
公开(公告)号:CN114491024B
公开(公告)日:2024-04-26
申请号:CN202111680038.4
申请日:2021-12-31
Applicant: 长城信息股份有限公司
IPC: G06F16/35 , G06F40/30 , G06F16/2458 , G06F18/22 , G06F18/2431 , G06F18/2415
Abstract: 本发明公开了一种基于小样本的特定领域多标签文本分类方法,通过对原始语料中带有原始标签的语料进行标签进行分类,然后改变原始标签进行语料扩充,并基于扩充后的语料,通过mask language model对预训练语言模型进行了多任务的训练来更新模型参数,使模型充分学习到领域的语义知识,在预测的阶段则使用知识库检索的方式,使用knn减少随机性,提升分类结果的准确性。在得到预测的结果后,继续将预测的结果当作人工标签重复上述步骤,使模型能够继续学习本领域的知识,并且检索知识库也越来越大,分类的结果也得到相应的提升。
-
公开(公告)号:CN116089578A
公开(公告)日:2023-05-09
申请号:CN202211640035.2
申请日:2022-12-20
Applicant: 长城信息股份有限公司
IPC: G06F16/332 , G06F16/35
Abstract: 本发明公开了一种智能问答数据自动标注方法、系统及存储介质,根据用户提问问题,从知识库中召回与之最接近的若干标准问题供用户选择,若用户选择了其中的一条标准问题,则判断用户提问问题与选择的标准问题的相似度是否超过阈值,若是,则将用户提问问题标注为选择的标准问题的相似问题;若用户没有选择任何一条标准问题,则将用户提问问题与知识库中所有标准问题进行聚类,若用户提问问题单独为一类,则将其标注为新增标准问题,否则,将其标注为所在类的聚类中心对应的标准问题的相似问题。本发明实现了智能问答中用户提问问题的自动标注,使智能问答机器人能够在使用过程中持续优化问答能力,同时减少了大量人工工作量,提升了标注效率。
-
公开(公告)号:CN115965721A
公开(公告)日:2023-04-14
申请号:CN202210905623.8
申请日:2022-07-29
Applicant: 长城信息股份有限公司
IPC: G06T13/40 , G06V10/764 , G10L21/06
Abstract: 本发明公开了一种基于随机游走的三维伴言手势实时生成方法、设备及介质。首先收集一定数量的人类短时间说话的人体关键点三维坐标样本。根据样本来源和最大标准差将其分为数个伴言手势群。再在每个群中,通过计算不同样本首尾帧之间的向量距离,生成样本之间的一对多有向连接图。而后搜索输入音频的连续低幅值区域(说话停顿处),计算每一段语音的时长;根据每一段语音的时长,利用随机数在有向连接图中选择节点(样本)及其邻接节点,通过插入过渡帧,最终拼接为与输入音频等时长的人体关键点三维坐标序列。本发明的优势在于,实现成本相较现有技术更低;相对于重复播放录制视频,本发明生成的伴言手势也几乎不存在重复的情况,效果更好。
-
公开(公告)号:CN115966004A
公开(公告)日:2023-04-14
申请号:CN202211522066.8
申请日:2022-11-30
Applicant: 长城信息股份有限公司
IPC: G06V40/16 , G06N3/048 , G06N3/084 , G06N3/0464
Abstract: 本发明公开了一种基于注意力指导轻量级网络的人脸关键点检测方法,采用优化的深度残差结构作为教师主干网络,使用注意力机制、逐点组卷积(pointwise group convulution)和通道混洗(channel shuffle)在保障精确率损失不多的同时可以大大减少了计算成本,这些轻量级的模型是在牺牲了部分精度的情况下提高计算速率,然后进一步通过复杂但准确性高的教师网络来指导精简的学生网络进行训练,从而得到计算量少,参数少的较精确的网络模型。
-
公开(公告)号:CN113888127A
公开(公告)日:2022-01-04
申请号:CN202111167847.5
申请日:2021-09-29
Applicant: 长城信息股份有限公司
Abstract: 本发明公开了一种基于多对象匹配的自助服务排队方法、系统、终端及可读存储介质,该方法包括:步骤1:基于优先级策略模型得到客户对象优先级、机具对象优先级、坐席对象优先级以及员工对象优先级,步骤2:以客户优先级为顺序针对每个客户对象,分别基于所述机具对象优先级、坐席对象优先级以及员工对象优先级按序匹配机具对象、坐席对象以及员工对象得到每个客户对象的匹配结果。本发明同时考虑到客户、机具、坐席以及员工,分别构建各自优先级队列,将其作为一个整体纳入匹配规则中,可以有效克服现有远程坐席和自助设备的配比差导致的服务体验不佳的问题,有效减少二次排队的情况。
-
-
-
-
-
-
-
-