一种基于图论的Transformer自动语音识别模型的性能分析方法

    公开(公告)号:CN119274542A

    公开(公告)日:2025-01-07

    申请号:CN202411529131.9

    申请日:2024-10-30

    Abstract: 本发明涉及一种基于图论的Transformer自动语音识别模型的性能分析方法,属于人工智能与语音识别领域。包括:获取Transformer自动语音识别模型,获取音频数据;将音频数据输入Transformer自动语音识别模型,通过前向传播获取模型中各层的多个注意力头的权重矩阵,提取模型输出的单词文本;对每个注意力头的权重矩阵在给定时间内进行求平均处理,得到该注意力头的人工神经活动;使用皮尔逊相关系数对所述注意力头的人工神经活动进行相关性计算得到相关系数,基于相关系数构建功能连接矩阵;计算功能连接矩阵的图论参数;计算输出的单词文本的单词错误率;基于图论参数和单词错误率,分析Transformer自动语音识别模型的性能。本发明方法对Transformer自动语音识别模型的性能分析提供依据。

    基于语义对齐的图像风格迁移方法

    公开(公告)号:CN119722438A

    公开(公告)日:2025-03-28

    申请号:CN202411747070.3

    申请日:2024-12-02

    Abstract: 本申请公开了一种基于语义对齐的图像风格迁移方法、装置、介质和设备,通过获取风格图像和内容图像,利用预构建的风格迁移网络处理风格图像和所述内容图像,得到风格化图像,其中,风格迁移网络包括编码模块、解码模块、第一风格注意模块、第二风格注意模块,第一自适应解耦模块、第二自适应解耦模块、第一动态风格调制核模块和第二动态风格调制核模块,输出所述风格化图像,通过风格注意模块将内容图的特征映射到风格图的内容特征之间建立映射关系,引入基于内容的动态风格调制核模块对映射矩阵进行调整,同时使用自适应解耦模块实现内容与风格的显式解耦,从而实现语义、风格更加和谐的图像风格迁移效果。

Patent Agency Ranking