-
公开(公告)号:CN114882483B
公开(公告)日:2025-04-04
申请号:CN202210337008.1
申请日:2022-04-01
Applicant: 南京大学 , 江苏图客机器人有限公司
IPC: G06V20/62 , G06V30/14 , G06V30/148 , G06V30/19 , G06V30/414 , G06V30/418 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/0895
Abstract: 本发明介绍了一种基于计算机视觉的图书盘点方法,其包括:步骤S1、通过相机获取单层书架的图片序列;步骤S2、对图片序列进行光流预估,得到相邻两帧间每个像素的移动方向和距离;步骤S3、构建并训练旋转实例目标检测模型,对图片序列进行实例目标检测,并进行实例分割,获得书脊和索书号在当前图片的位置,并分配给相应的图书;步骤S4、训练文本识别模型,得到每张图片中包含的图书书名和索书号文本及文本所在的位置;步骤S5、进行目标跟踪,得到每个图书的具体位置和所有识别结果;步骤S6、对所有识别结果进行修正和匹配,得到真实书名结果,并输出图书实例位置和匹配的图书信息作为盘点结果。通过上述步骤最终实现图书盘点的高效率和高准确性。
-
公开(公告)号:CN114743544B
公开(公告)日:2025-01-03
申请号:CN202210410441.3
申请日:2022-04-19
Applicant: 南京大学 , 江苏图客机器人有限公司
Abstract: 本发明公开了一种基于拼音的双阶段解耦合中文语音识别模型,将语音识别过程分解为从语音到拼音,从拼音到汉字两个步骤,独立构建和训练从语音到拼音的声学模型和从拼音到汉字的语言模型:构建基于混合下采样和多路径交叉卷积模块的全卷积声学模型,进行从音频Mel谱特征到拼音的识别;构建基于同音字建模方案的Transformer语言模型,进行从拼音到汉字的转录。声学模型中,提出并采用混合下采样和多路径交叉卷积结构,大幅减少参数量,降低复杂度,节省训练时间和计算资源开销,提高了模型的泛化性能。语言模型中,采用同音字建模,将输出特征维度从4000以上减至55,减少参数量,降低模型学习难度,提高转录准确率。
-
公开(公告)号:CN118740138A
公开(公告)日:2024-10-01
申请号:CN202310336466.8
申请日:2023-03-31
Applicant: 南京大学
IPC: H03K17/96 , G06F3/04883 , G06K7/10
Abstract: 本发明涉及一种基于RFID的触摸开关装置与手势判定方法,所述方法包括:步骤1,利用RFID读写设备收集所述无源标签的射频信号;步骤2,对所述射频信号使用低通滤波器进行过滤,获得低通信号;步骤3,对所述低通信号进行时频变换,获得时频图,对所述时频图进行切分,提取手势发生的时间区间;根据手势发生的时间区间,从所述低通信号中提取包含手势的信号区间;步骤4,对包含手势的信号区间进行手势判定,并输出判定结果。本发明为用户提供了一种无电池、无训练、低延迟和低成本的输入方式,并且无需硬件修改,可以直接部署在商用RFID系统中。
-
公开(公告)号:CN118737107A
公开(公告)日:2024-10-01
申请号:CN202410708282.4
申请日:2024-06-03
Applicant: 南京大学
IPC: G10K11/172 , G06F17/16
Abstract: 本发明公开了一种中低频吸声超材料及其吸声能力的计算方法,所述中低频吸声超材料包括共鸣器阵列,其中,每个共鸣器由罩壳围成且截面呈现“凹”型结构,凹处设有穿孔,多个共鸣器单元连接在一起形成宽带吸声结构,“凹”型结构使得共鸣器单元连接后形成多个狭缝,狭缝与共鸣器单元一同形成新的共振单元,用于声波入射后共振结构内空气产生共振并与狭缝内壁摩擦生热,实现声能的吸收。本发明所述的中低频吸声超材料由穿孔“凹”型共振腔组成,厚度较薄,结构简单,易于制造,安装灵活,实现声波在中低频的宽带吸收。
-
公开(公告)号:CN115035904A
公开(公告)日:2022-09-09
申请号:CN202210391848.6
申请日:2022-04-14
Applicant: 南京大学 , 江苏图客机器人有限公司
Abstract: 本发明公开了一种基于生成式对抗神经网络的高质量声码器模型,该模型首先使用一个生成器模块进行从音频的Mel谱到波形形式的转换,其由含多视野融合块的Unet式沙漏形结构卷积神经网络搭建;使用一个声学特征提取器和多个鉴别器模块对生成的波形进行多重角度的优化;其中声学特征提取器使用传统信号处理方法构建,鉴别器模块由多尺度鉴别器、多周期鉴别器、多相位鉴别器三部分组成,基于卷积神经网络搭建。本发明大幅降低了神经网络的学习难度,节省训练时间和计算资源开销;利用了相位信息和时域上的自相似特征来对生成波形进行优化,获得更高音质的波形;使用了局部化训练策略,可以更自然流畅地合成任意长度的长音频序列。
-
公开(公告)号:CN114676333A
公开(公告)日:2022-06-28
申请号:CN202210347376.4
申请日:2022-04-01
Applicant: 南京大学 , 江苏图客机器人有限公司
IPC: G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种带权多兴趣类别增强的推荐系统召回方法,包括物品候选池、用户‑物品历史交互数据以及后台服务器。其工作方法是:基于用户与物品的历史交互数据,通过对用户的历史物品序列和物品类别序列建模,学习用户的带权重的多兴趣向量,基于用户的带权多兴趣从物品候选池为用户推荐物品。本发明将物品类别特征与用户的带权多兴趣建模技术应用于推荐系统召回阶段中,较大程度地提升了推荐系统召回结果的准确率与召回率。
-
公开(公告)号:CN111410930B
公开(公告)日:2021-09-17
申请号:CN201911150094.X
申请日:2019-11-21
Applicant: 南京大学 , 溧阳康达威实业有限公司
IPC: C09J183/04 , C09J11/06
Abstract: 一种快固化单组份室温硫化有机硅密封胶,它的主要成分是端羟基聚二甲基硅氧烷、无机填料、固化剂、其它添加剂等,上述各组分的重量组成比例为:端羟基聚二甲基硅氧烷100份,无机填料0‑100份,固化剂5~20份,添加剂0‑10份。所述的固化剂必须包括二氯甲基三丁酮肟基硅烷,其结构为:Cl2CHSi[ON=C(CH3)C2H5]3;这种二氯甲基三丁酮肟基硅烷固化剂可以单独使用或与其它固化剂配合使用,其用量为所有固化剂总量的20~100%。这种快固化单组份室温硫化有机硅密封胶的表干时间为1~45min,储存期超过一年。
-
公开(公告)号:CN113128650A
公开(公告)日:2021-07-16
申请号:CN202110421717.3
申请日:2021-04-20
Applicant: 南京大学 , 江苏图客机器人有限公司
IPC: G06K19/077
Abstract: 本申请提供一种撞线检测方法,该方法基于RFID技术实现撞线检测。基于RFID技术实现撞线检测的过程如下:给定一条检测界线,在所述检测界线的至少一端设置有RFID天线;通过RFID天线读取目标物体RFID标签的相位,获取所述目标物体RFID标签在整个时间内的相位‑时间图,所述相位‑时间图上的相位值为各个RFID天线读取的目标物体RFID标签相位的加和;识别所述相位‑时间图中相位值最小的拐点,所述拐点的时间戳认定对应为目标物体的撞线时间发生。与现有常见撞线检测方法如红外传感器,摄像头以及虚拟墙壁相比,可以有效检测多个目标物体同时撞线的情况,且可识别目标物体的正常撞线和异常情况。
-
公开(公告)号:CN107137801B
公开(公告)日:2020-08-21
申请号:CN201710292398.4
申请日:2017-04-28
Applicant: 南京大学
Abstract: 本发明公开了一种基于超高频RFID读取频次的输液监控系统,包括设置在输液瓶外表面的RFID标签、天线、RFID阅读器以及数据处理单元;所述天线用于向外辐射电磁波,并接收RFID标签反射回的RFID标签信号传送给RFID阅读器;所述RFID阅读器实时向数据处理单元反馈读取到的RFID标签信号;所述数据处理单元根据RFID标签信号判断输液瓶内的液面是否低于RFID标签位置,判断方法为:当调整RFID阅读器实际读取率大于RFID阅读器的最大读取率的80%以上,则判定为液面低于RFID标签位置。
-
公开(公告)号:CN110008766B
公开(公告)日:2020-04-24
申请号:CN201910231661.8
申请日:2019-03-26
Applicant: 南京大学
Abstract: 本发明公开了一种基于射频识别技术的室内人数统计方法,在室内部署若干RFID阅读器以保证读取范围恰当得覆盖室内区域,然后身上携带一定量RFID标签的人在该场景中自由活动。每一个标签会在一定时间段内被若干天线读取到,从时间维度出发,可以得到一个读取天线的集合序列。对于同一个人身上标签,它们对应时间的读取天线集合序列越相近,根据这一特性并利用一种基于密度和距离的聚类算法分析可以统计场景中的人数情况。
-
-
-
-
-
-
-
-
-