基于领域对抗学习的多语言语音情感识别系统

    公开(公告)号:CN117831566A

    公开(公告)日:2024-04-05

    申请号:CN202311863177.X

    申请日:2023-12-29

    Inventor: 胡敏 李敏 黄宏程

    Abstract: 本发明涉及一种基于领域对抗学习的多语言语音情感识别系统,属于人机交互领域。该系统包括情感特征编码器、情感分类器、语种判别器和说话人判别器。其中情感特征编码器基于卷积神经网络,用于学习并提取跨语言共享的情感特征;情感分类器根据情感特征识别出输入语音的情感状态;语种判别器和说话人判别器均基于领域对抗神经网络进行不同语种以及不同说话人的识别,以情感特征为输入,输出输入语音所述的语种和对应的说话人。本发明可消除不同语言的数据分布差异,具有较好的情感显著特征的提取能力,能够在不同语言和文化背景下有效识别和分析人类语音中的情感表达。

    一种多模态感知的异常步态分类系统

    公开(公告)号:CN117582215A

    公开(公告)日:2024-02-23

    申请号:CN202311850223.2

    申请日:2023-12-29

    Inventor: 黄宏程 王杰 胡敏

    Abstract: 本发明涉及一种多模态感知的异常步态分类系统,属于分类检测领域。该系统包括:数据采集模块、数据预处理模块、特征筛选模块、网络模型模块和报告生成模块:将所采集到的数据全部上传到云端,并且对这些数据进行报告分析,生成报告给医生进行意见建议,使对测试者更加显示化准确化的检测是否是异常。本发明通过COA从多模态传感器特征数据中,选择出最佳的特征子集供后续模型分类,在保持准确度的前提下,减小了模型训练的参数。通过提出的TAMResnet‑BiGRU模型,对空间和时间的特征进行自适应注意,获取了更多有用特征,有利于模型分类的准确性提升。

    一种数字孪生辅助数据中心网络负载均衡的方法

    公开(公告)号:CN116233133A

    公开(公告)日:2023-06-06

    申请号:CN202211740947.7

    申请日:2022-12-30

    Abstract: 本发明涉及一种数字孪生辅助数据中心网络负载均衡的方法,属于数字孪生领域,包括以下步骤:S1:搭建基于数字孪生的数据中心网络框架;S2:采集物理数据中心网络的数据;S3:计算链路利用率、时延、丢包率,交换机负载,流量矩阵;S4:在当前采集周期时间里,判断到达边缘交换机新流大小,若为老鼠流,则使用ECMP方式进行路由;若为大象流,则转至大象流调度模块进行调度;S5:大象流调度模块采用DDPG进行调度决策,其输出是一组链路权重,通过路径计算子模块计算最优转发路径,然后经过流量管理模块下发流表到物理数据中心网络;S6:通过南向接口协议,物理数据中心网络层收到流表,对大流选择最优路径重路由。

    一种基于多视点几何的三维人体姿态估计方法

    公开(公告)号:CN116206328A

    公开(公告)日:2023-06-02

    申请号:CN202211669053.3

    申请日:2022-12-23

    Inventor: 胡敏 杜蔻 黄宏程

    Abstract: 本发明涉及一种基于多视点几何的三维人体姿态估计方法,属于计算机视觉领域。该方法包括:S1:对人体骨骼序列和多个摄像机视图之间的交互进行建模,即使用预先训练好的二维自底向上姿态估计器来定位每个摄像机视图中的2D人体关键点;S2:利用基于混合注意力机制的图匹配网络来捕获上下文信息,在不同的视图中匹配出相同的人体并学习捕获多个视图之间的关系,以便对截断的视角进行预测。本发明解决了从多个标定的摄像机视图恢复三维人体姿态的任务中,视图特征融合有效性较差、匹配算法无法捕获多视图关系的问题,同时显著降低了模型的计算复杂度。

    一种基于时序图神经网络的物联网服务聚类方法

    公开(公告)号:CN116166977A

    公开(公告)日:2023-05-26

    申请号:CN202211603107.6

    申请日:2022-12-13

    Inventor: 胡敏 孙涛 黄宏程

    Abstract: 本发明涉及一种基于时序图神经网络的物联网服务聚类方法,属于移动物联网领域。该方法包括两个部分:生成融合服务标签的服务功能特征向量和生成基于服务节点时序协作网络的表征向量;对于传统的服务功能语义特征稀疏问题,本发明使用基于协同过滤的服务标签选取方法,为时序协作下的服务选取最适合其功能向量的标签,以增强其服务功能向量信息的密度表示。本发明方法与聚类效果较好的BTM模型对比,在轮廓系数上提升了10.4%的性能,在戴维森堡丁系数上提升了7%,在调整兰德系数上提升了1.5%的性能,在纯度表现上约1.4%的性能提升。

    一种用于智慧监护的人体行为识别方法

    公开(公告)号:CN116152915A

    公开(公告)日:2023-05-23

    申请号:CN202211631394.1

    申请日:2022-12-19

    Abstract: 本发明涉及一种用于智慧监护的人体行为识别方法,属于计算机视觉领域。该方法结合了RGB图像的特征丰富的优点和骨骼图像结构的长处,分别对视频中人物的空间和时间特征进行建模,避免了因骨骼建模时缺失环境特征导致的误判和图像序列时间建模时的性能损耗。同时有效的提高了模型的精度。本发明提出了融合图像与骨骼数据的方式实现对人体行为的识别,可以用于远程监控和智能医疗监护设施,网络以图像方式获得空间特征信息和简要的环境上下文信息,以骨骼运动特征获得行为活动的时间序列特征。

    一种边缘协作式副本放置方法
    59.
    发明公开

    公开(公告)号:CN115904731A

    公开(公告)日:2023-04-04

    申请号:CN202211696741.9

    申请日:2022-12-28

    Abstract: 本发明涉及一种边缘协作式副本放置方法,属于边缘计算领域。该方法包括三个部分:基于基站内容与基站用户的相似度划分边缘协作区域;边缘资源管理器预测区域内副本流行度并完成副本放置推荐;云中心节点通过强化学习算法优化每个边缘协作域的副本部署规则以解决边缘节点中副本的局部冗余,提高用户服务质量。

    一种基于MC-T算法的CT图像三维重建方法

    公开(公告)号:CN112802193B

    公开(公告)日:2023-02-28

    申请号:CN202110263368.7

    申请日:2021-03-11

    Abstract: 本发明属于图像处理领域,具体涉及一种基于MC‑T算法的CT图像三维重建方法,该方法包括:获取待重建的脑出血CT图像和脑出血CT病灶掩膜图;对获取脑出血CT图像和脑出血CT病灶掩膜图进行预处理;采用MC‑T算法对预处理后的图像数据进行重建,得到重建后的三维图像;本发明针对传统的MC算法中存在的计算速度慢以及二义性问题,提出了一种基于MC算法改进的三维重建算法,该算法以二维脑出血CT图像和病灶分割掩膜切片作为输入,在三维数据场中通过体素棱边标记的方法,有效的排除了空体元的检测。

Patent Agency Ranking