-
公开(公告)号:CN118537395A
公开(公告)日:2024-08-23
申请号:CN202410726695.5
申请日:2024-06-06
Applicant: 浙江大学
Abstract: 本发明公开了一种基于YOLO v5双机位双目相机毛笔三维坐标检测方法和装置,该方法基于两个基线正交的双目摄像头实时检测毛笔的三维坐标,包括:(1)采集毛笔图像,仅标注毛笔框制作毛笔目标检测数据集;(2)使用YOLO v5训练毛笔目标检测数据集;(3)利用固定双机位双目摄像机绘制两张实时深度图;(4)将双机位双目摄像机各自检测的目标三维坐标按预设映射方案进行真实目标三维坐标映射;(5)将优化好的整体检测模型到实地应用。本发明具有高精度,低延迟,鲁棒性强特点,可用于书法教学中毛笔书写姿势跟踪、笔迹实时反馈等产品功能应用,具有较好的商业化前景。
-
公开(公告)号:CN118135012A
公开(公告)日:2024-06-04
申请号:CN202410027916.X
申请日:2024-01-09
Applicant: 浙江大学
Abstract: 基于神经网络拟合和预测深度摄像头所拍摄物体高度的方法,包括:收集包含物体高度信息和对应深度图像的数据集;对收集到的深度图像数据进行预处理;设计一个适合处理深度图像数据的神经网络模型;使用预处理后的数据集训练神经网络模型;将训练好的模型部署于实际应用中。本发明广泛适用于工业自动化、机器人技术、增强现实、虚拟现实和智能交通系统等领域,弥补传统高度测量方法成本高、适应性差的缺陷。
-
公开(公告)号:CN117763390A
公开(公告)日:2024-03-26
申请号:CN202311678648.X
申请日:2023-12-08
Applicant: 浙江大学
IPC: G06F18/24 , G06N3/0455 , G06N3/0499 , G06N3/088 , G06F16/901 , G06F16/906
Abstract: 一种基于邻域一致性的图异常检测方法和装置,其方法包括:通过获取用户和商户数据,根据用户和商户实体之间的关系和属性特征构建网络拓扑图;对网络拓扑图进行不同的编码模块,得到三种分离的编码,分别是特征空间编码、结构空间编码、联合空间编码;在编码空间,使用自适应融合模块,获得更为准确的特征空间编码和结构空间编码;根据编码不同的来源设计不同任务,联合训练;在联合训练的基础上,使用一致性损失解耦三种编码;计算损失分数,输出最终分类结果。本发明解决了一致性在端到端图节点分类的应用空缺问题。在电商领域,通过用户和商户实体之间的关系和属性特征构建得到的网络拓扑图,使用本发明可以进一步得到异常用户的识别结果。
-
公开(公告)号:CN114707467A
公开(公告)日:2022-07-05
申请号:CN202210269579.6
申请日:2022-03-18
Applicant: 浙江大学
IPC: G06F40/126 , G06F40/242 , G06F40/284
Abstract: 一种基于自注意力机制的自动化拼音转汉字方法,包括:预处理拼音序列;利用嵌入层获得输入拼音序列的嵌入表示矩阵;在嵌入表示添加位置编码,获得拼音序列的输入表示矩阵;利用拼音序列的输入表示矩阵和自注意力机制获得拼音序列的自注意力输出矩阵;利用全连接层将自注意力输出矩阵变换为输出矩阵;解析输出矩阵,获得汉字序列结果。该发明可在无人工干预的前提下,自动化的将拼音序列转成汉字序列。
-
公开(公告)号:CN114677688A
公开(公告)日:2022-06-28
申请号:CN202210270078.X
申请日:2022-03-18
Applicant: 浙江大学
IPC: G06V30/40 , G06F40/58 , G06F40/126
Abstract: 本发明涉及一种基于Ant Design Vue和Flask的盲文识别系统,其中Ant Design Vue是一种前端技术,Flask是一种基于Python的服务器架构,盲文识别功能是指将盲文图片上的盲文方标识出来并翻译为汉字。所述系统包括登录,注册等账户管理功能,新建盲文识别任务,查看识别任务,检索任务等任务管理功能以及高精度,高效率盲文图片识别的功能。在查看任务详情界面,系统展示本任务所有图片的缩略图,以及所有图片的翻译结果。该发明提供了一个对盲文翻译任务统一管理的盲文翻译平台,注册后就可以使用上述所有功能,该系统可以给盲文学习者以及盲校老师阅读盲文带来极大的便利。
-
公开(公告)号:CN114359908A
公开(公告)日:2022-04-15
申请号:CN202111550512.1
申请日:2021-12-17
Applicant: 浙江大学
IPC: G06V30/148 , G06V30/16
Abstract: 本发明涉及基于像素点级注意力机制的商品图片可读文字甄别方法,包括:通过OCR技术获取商品图片的文字块坐标及文字内容;通过像素点级注意力机制获取文字块的可读置信度;通过自适应阈值和各文字块的可读置信度进行可读文字筛选,改进了现有技术中,利用预训练语言模型对文字块进行筛选时,受到语料库限制造成的矫正结果单一的问题,从而提高了筛选的准确度。
-
公开(公告)号:CN108923951B
公开(公告)日:2020-08-04
申请号:CN201810425552.5
申请日:2018-05-07
Applicant: 浙江大学
IPC: H04L12/24 , H04L12/26 , G06F16/958
Abstract: 一种基于众包的网站无障碍检测系统的任务分配方法,包括:第一步,初始化检测点计数器和检测者计数器为0;第二步,从预测代价矩阵Cost(i,j)中获取具有最小值的检测者;第三步,将任务完成矩阵对应数值置为1,并对相应任务计数器及检测者计数器加1,然后对预测代价矩阵数据进行更新,接着跳转第二步,否则执行第四步;第四步,如果对于所有的检测者,其对应检测点计数器大小都为分检测者平均检测点数,更新Cost(i,j)为无穷大;第五步,对于所有的检测点,其对应的检测者计数器数值都为总检测者数,更新Cost(i,j)为无穷大;最后对于所有的检测点,每个检测点对应的检测者计数器都为总检测者数量,则本算法中断,否则进入第二步。
-
公开(公告)号:CN108923951A
公开(公告)日:2018-11-30
申请号:CN201810425552.5
申请日:2018-05-07
Applicant: 浙江大学
Abstract: 一种基于众包的网站无障碍检测系统的任务分配方法,包括:第一步,初始化检测点计数器和检测者计数器为0;第二步,从预测代价矩阵Cost(i,j)中获取具有最小值的检测者;第三步,将任务完成矩阵对应数值置为1,并对相应任务计数器及检测者计数器加1,然后对预测代价矩阵数据进行更新,接着跳转第二步,否则执行第四步;第四步,如果对于所有的检测者,其对应检测点计数器大小都为分检测者平均检测点数,更新Cost(i,j)为无穷大;第五步,对于所有的检测点,其对应的检测者计数器数值都为总检测者数,更新Cost(i,j)为无穷大;最后对于所有的检测点,每个检测点对应的检测者计数器都为总检测者数量,则本算法中断,否则进入第二步。
-
-
-
-
-
-
-