-
公开(公告)号:CN102307309A
公开(公告)日:2012-01-04
申请号:CN201110214935.6
申请日:2011-07-29
Applicant: 杭州电子科技大学
IPC: H04N13/00 , H04N21/6437 , G06F3/01 , G06K9/00
Abstract: 本发明涉及一种基于自由视点的体感交互导播系统及方法。本发明包括服务器端、视频传输网络和客户端;服务器端包括多像机系统、视频处理服务器、流媒体服务器,完成多路视频采集、全景视频合成、H.264编码和RTSP流媒体服务;视频传输网络是基于TCP/IP协议的局域网或广域网;客户端包括自由视点播放终端和体感传感器,完成视频流媒体接收和解码、基于体感控制器的手势识别、自由视点生成等功能模块。本发明通过将多路视频合成全景视频,不仅可直接利用当前已成熟的视频编码和流媒体传输技术,节省软硬件投资和技术成本,而且可实现真正360°全场景的无缝漫游和视点自由切换。
-
公开(公告)号:CN101976338A
公开(公告)日:2011-02-16
申请号:CN201010524357.1
申请日:2010-10-29
Applicant: 杭州电子科技大学
IPC: G06K9/46
Abstract: 本发明涉及一种基于梯度方向直方图的判决式视觉显著性检测方法。目前的方法分辨率低,提取的物体轮廓不全,计算复杂度高。本发明方法首先采用彩色变换方法,提取原始图像在CIELAB空间彩色分量图;其次利用中央-周围计算结构中的取样点统计分量图中每个像素点的局部梯度方向直方图;然后计算每个像素点的局部显著判决矢量和全局显著判决矢量;最后采用线性加权方法获得最终的显著判决结果。本发明方法在视觉显著区域具有更强的响应,而在其他非显著区域有更好的抑制能力。
-
公开(公告)号:CN101324669A
公开(公告)日:2008-12-17
申请号:CN200810120197.7
申请日:2008-07-25
Applicant: 杭州电子科技大学
IPC: G01S15/08
Abstract: 本发明涉及多路超声波传感器信号处理方法。单一传感器信号难以保证输入信息的准确性和可靠性。本发明采用数字处理器TMS320LF2407A,超声波传感器谐振频率为40kHz,具体方法是:将数字处理器初始化,设定多路传感器数据采集通道;定时器T1产生激励脉冲,各个超声波发射传感器接收到激励脉冲后,分别发射超声波;对应的超声波接收传感器接收到超声回波后,CAP模块产生中断,测得障碍物距离信息;如果超声波接收传感器在定时器T2的定时周期内没有接收到超声回波,则判断无障碍物,定时器T2重新开始计时。本发明通过设定不同通道的超声波发射接收通道,完成多路超声波数据采集,可以获得高精度的采集数据。
-
公开(公告)号:CN116597824B
公开(公告)日:2025-05-16
申请号:CN202310580969.X
申请日:2023-05-19
Applicant: 杭州电子科技大学
Abstract: 本发明公开一种基于注意力引导张量网络的想象语音分类方法及系统。获取意念想象语音脑电数据,以及其对应的标签label;对上述意念想象语音脑电数据进行数据增强,构建训练数据集;构建注意力引导张量网络,利用数据集中的数据增强后训练集进行训练,并采用数据集中未增强的测试集进行测试;利用训练并验证好的注意力引导张量网络实现脑电的想象语音分类。本发明方法将数据增强以及注意力机制的分类标识位引导的张量网络技术结合起来,实现高精度的想象语音脑电分类性能。
-
公开(公告)号:CN119862945A
公开(公告)日:2025-04-22
申请号:CN202510068071.3
申请日:2025-01-16
Applicant: 杭州电子科技大学
IPC: G06N5/022 , G06N5/04 , G06F16/9032 , G06F16/903
Abstract: 本申请公开了一种结合大语言模型与知识图谱的问答方法及系统,涉及问答领域,方法包括:基于元知识库,根据检索问题确定对应的元知识,包括知识描述、查询动作及问题实体;元知识库中包括知识图谱;将元知识与短时记忆结合得到提示词信息,然后采用大语言模型执行查询动作并完成当前推理,对得到的响应结果进行评估以得到奖励分数;若奖励分数未满足预设条件,则根据响应结果生成反思修正信息,并与提示词信息一起分别存储至长时记忆及短时记忆中实现数据更新,基于更新后的长时记忆对元知识库进行更新,然后执行下一轮推理;若奖励分数满足预设条件,则将响应结果标记为问答结果。本申请可提高基于知识图谱问答的准确性。
-
公开(公告)号:CN114089834B
公开(公告)日:2024-07-12
申请号:CN202111614470.3
申请日:2021-12-27
Applicant: 杭州电子科技大学
IPC: G06F3/01 , G06F18/213 , G06F18/24 , G06F18/25 , G06N3/0455 , G06N3/09
Abstract: 本发明公开了一种基于时间‑通道级联Transformer网络的脑电识别方法。本发明包括如下步骤:1:获取意念想象英文字符脑电数据,构建预处理模块;2:构建时间‑通道级联Transformer网络的时间模块,该时间模块的输入数据为预处理后的脑电数据,输出是提取后的时间特征;3:构建时间‑通道级联Transformer网络的脑电通道模块,该脑电通道模块的输入数据为时间特征,输出是提取后的时空融合特征;4:构建时间‑通道级联Transformer网络的分类模块,该分类模块的输入为时空融合特征,该分类模块的输出为分类结果。本发明能够有效提高字符想象脑电信号的识别准确率。
-
公开(公告)号:CN118115784A
公开(公告)日:2024-05-31
申请号:CN202410176548.5
申请日:2024-02-08
Applicant: 杭州电子科技大学 , 好易购家庭购物有限公司
IPC: G06V10/764 , G06V10/74 , G06V10/774 , G06V10/82 , G06V10/44
Abstract: 本发明公开了基于相似度转移的弱监督细粒度图片分类方法及系统。本发明通过类别名称作为关键字在搜索网站上查询来免费获得大尺寸图像,作为有潜力的带有标签名的弱标签数据源。本发明提出并训练了一个similarityNet网络,这个网络能输出一个相似度二维向量来很好判断两张图片是否属于同一类别。其次本发明通过网络延伸出一种给webimages提供权重得分的方法,并配合加权分类loss能有效的去噪webimages数据后并将其作为训练样本运用在弱监督细粒度图片分类任务中,从而解决了细粒度图片分类缺乏大量人为标注大量图片数据集的问题。
-
公开(公告)号:CN112288789B
公开(公告)日:2024-03-29
申请号:CN202011151995.3
申请日:2020-10-26
Applicant: 杭州电子科技大学
IPC: G06T7/557 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/0895
Abstract: 本发明公开了一种基于遮挡区域迭代优化的光场深度自监督学习方法。本发明步骤如下:S1:从光场图像中提取网络输入;S2:搭建自监督光场深度估计网络,网络输出为中心子光圈图像的视差图。S3:设计基于遮挡掩模的自监督学习损失函数,设定初始遮挡掩模为无遮挡情况。S4:优化基于遮挡掩模的自监督学习损失函数,训练自监督光场深度估计网络。S5:利用步骤S4中训练完成的自监督光场深度估计网络预测得到中心子光圈图像的视差图,计算中心子光圈图像的遮挡区域,更新遮挡掩模。S6:若更新前和更新后遮挡掩模的差异小于设定阈值,则退出迭代优化;否则返回步骤S4。本发明实现遮挡区域的迭代优化,同时优化光场深度估计结果。
-
公开(公告)号:CN116597824A
公开(公告)日:2023-08-15
申请号:CN202310580969.X
申请日:2023-05-19
Applicant: 杭州电子科技大学
Abstract: 本发明公开一种基于注意力引导张量网络的想象语音分类方法及系统。获取意念想象语音脑电数据,以及其对应的标签label;对上述意念想象语音脑电数据进行数据增强,构建训练数据集;构建注意力引导张量网络,利用数据集中的数据增强后训练集进行训练,并采用数据集中未增强的测试集进行测试;利用训练并验证好的注意力引导张量网络实现脑电的想象语音分类。本发明方法将数据增强以及注意力机制的分类标识位引导的张量网络技术结合起来,实现高精度的想象语音脑电分类性能。
-
公开(公告)号:CN116311498A
公开(公告)日:2023-06-23
申请号:CN202310090465.X
申请日:2023-02-09
Applicant: 杭州浩聚科技有限公司 , 杭州电子科技大学
Abstract: 本发明公开了一种基于视觉检测的正步训练动作要领评估方法。本发明步骤:步骤S1:多机位部署及标定;步骤S2:人体区域提取及相机切换;步骤S3:人体关键点提取;步骤S4:人体各部分姿态计算;步骤S5:人体动作姿态评分。本发明通过人体正步图片或视频,分析出人体各关键部位的位姿数据,如肩、肘、膝、踝关节等部位的姿态信息,以用于判断正步训练时各项分解动作是否符合标准,提高训练效率。本系统具有操作简单,评测精确,性能优良等优点。
-
-
-
-
-
-
-
-
-