-
公开(公告)号:CN119811366A
公开(公告)日:2025-04-11
申请号:CN202411694486.3
申请日:2024-11-25
Applicant: 浙江大学软件学院(宁波)管理中心(宁波软件教育中心) , 宁波明物智能科技有限公司
Inventor: 白富仁
IPC: G10L15/00 , G10L15/25 , G10L19/02 , G10L21/01 , G10L21/055 , G10L25/18 , G10L25/24 , G10L25/57 , G10L25/30 , G06N3/0464
Abstract: 本发明公开了一种高效的基于多尺度Transformer的密集预测视觉语音识别算法。该算法针对现有视觉语音识别技术在捕捉长程依赖关系和局部高频特征方面的不足,以及计算复杂度较高的问题,提出了一种创新的MTF‑TCN网络架构。通过结合Inception mixer结构的并行卷积、最大池化路径和自注意力路径,本发明有效学习视觉数据中的高频和低频信息,并通过频率斜坡结构平衡不同层上的频谱成分。此外,引入的稀疏注意力机制和时间卷积技术,降低了模型的计算复杂度,同时保持了对关键视觉特征的敏感性,以及为模型引入了局部连通性的归纳偏差,从而增强了对高局部性特征的提取能力,进一步优化了模型的性能和计算效率。本发明的有益效果包括提高了视觉语音识别的准确性和鲁棒性,同时降低了算法的计算成本,适用于各种噪声环境下的语音识别任务。
-
公开(公告)号:CN119028344A
公开(公告)日:2024-11-26
申请号:CN202411072894.5
申请日:2024-08-06
Applicant: 宁波明物智能科技有限公司 , 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
Abstract: 本发明涉及工业自动化技术领域,具体涉及一种采用文本语音合成方式的排程工位一体机;包括工位一体机、支架、麦克风和升降组件,升降组件包括电机座、驱动电机、驱动轴、齿轮、齿条、活动套和固定座,电机座与支架固定连接,并位于支架的外侧壁,驱动电机设置于电机座上,驱动轴与驱动电机的输出端连接,齿轮与驱动轴固定连接,活动套与支架固定连接,齿条与活动套活动连接,齿条与齿轮啮合传动,固定座分别与齿条和工位一体机固定连接,通过上述结构的设置,实现了能够对排程工位一体机的高度进行调节,满足不同人员的使用需要,增加了实用性。
-
公开(公告)号:CN118793899A
公开(公告)日:2024-10-18
申请号:CN202411051132.7
申请日:2024-08-01
Applicant: 宁波明物智能科技有限公司 , 浙江大学软件学院(宁波)管理中心(宁波软件教育中心)
Abstract: 本发明涉及数字化车间技术领域,具体涉及一种带文本语音合成方式培训工位一体机,包括工控一体机、文本语音合成转换设备和装配组件,装配组件包括安装框架、两个装配件、高度调节件、连接板、角度调节件、装配框、固定结构、装配座和支撑架,根据培训人员的操作需求是使用习惯,控制高度调节件可调节工控一体机的上下高度位置,再根据操作工控一体机的需求控制角度调节件调节工控一体机的俯仰角度,从而解决了现有的带文本语音合成方式培训工位一体机,工控一体机安装在工位上后位置就无法进行调节,从而导致在进行工位培训操作时无法根据操作者的需求进行调节操作位置的问题。
-
公开(公告)号:CN118094092A
公开(公告)日:2024-05-28
申请号:CN202311719023.3
申请日:2023-12-14
Applicant: 浙江大学
IPC: G06F18/10 , G06F18/213 , G06F18/2433 , G06F18/25 , G06N3/048 , G06N3/047 , G06N3/0442 , G06N3/084 , G06F123/02
Abstract: 本发明公开了一种基于异常波动注意力时序通道的质量预测方法和装置,包括:获取产品生产过程数据并进行预处理;预处理数据包括非时序数据和时序数据;从非时序数据和时序数据分别提取得到时序特征和非时序特征;基于互信息进行时序特征选择;检测选择后的时序特征中的异常数据,则其余为正常数据;以正常数据均值为注意力汇聚值,对选择后的时序特征进行注意力汇聚操作;将非时序特征与汇聚操作后的时序特征融合,经过全连接层、sigmod激活层,输出产品质量概率。本发明方法提高了预测的准确度。
-
-
-