-
公开(公告)号:CN117690089A
公开(公告)日:2024-03-12
申请号:CN202311758982.6
申请日:2023-12-20
Applicant: 北京理工大学唐山研究院
IPC: G06V20/52 , G06V20/40 , G06V40/20 , G06V10/62 , G06V10/82 , G06V10/774 , G06V10/776 , G07C9/00
Abstract: 本发明涉及化学药品监管领域,具体为一种基于目标识别的化学药品双人双锁保管机制监管方法及系统,利用计算机视觉技术进行目标识别和处理,实现了对管制类化学药品拿取过程自动化和智能化的监管,解决管制类化学药品双人双锁保管监管难、人力消耗大的问题;实验室管理人员能够及时收到警示信息来应对违规情况,从而显著提高化学实验室的安全性和管理规范性。
-
公开(公告)号:CN117176890A
公开(公告)日:2023-12-05
申请号:CN202311193395.7
申请日:2023-09-15
Applicant: 北京理工大学唐山研究院
Abstract: 一种基于深度学习的轻量级高精度时空视频超分辨率方法,其特征在于,步骤:获取视频资源;通过ffmpeg软件将视频资料分解为帧序列;从帧序列的首部开始,依次取连续的两帧作为模型的输入帧;模型接收两帧图像信息,在这两帧中插值一帧;同时又将两帧和插值的一帧图像重建为指定倍数的高分辨率图像;将所得到的高分辨率图像存储在硬件中,按照视频播放的顺序排序;采用ffmpeg将高分辨率连续帧根据帧率要求编码为新的高分辨率高帧率视频;发布新的视频。本发明有效防止模型推理过程中过多的内存占用,降低对设备性能的要求,有效提升时空超分辨率的准确性;有效降低对内存的占用,有效提高处理效果。
-
公开(公告)号:CN116978402A
公开(公告)日:2023-10-31
申请号:CN202310952345.6
申请日:2023-07-31
Applicant: 北京理工大学唐山研究院
IPC: G10L25/03 , G10L25/51 , G10L25/90 , G10L15/26 , G10L15/06 , G06N3/0455 , G06N3/0442 , G06F40/30
Abstract: 一种课堂教学语音摘要提取方法,该提取方法基于重音检测和长文本压缩,包括:长文本压缩,通过关键句子筛选算法进行长文本压缩,缩小句子规模,将长文本摘要问题转化为短文本问题;重音标记,训练通用的汉语语音重音检测模型,根据音频及其标注文件,对相应的文本序列进行汉语重音标记,得到每段音频对应的词级别的重音序列;摘要生成,使用生成式摘要模型生成摘要文本。本发明提高了摘要的适应性和灵活性,避免由于文本过长影响转录准确性的问题;充分利用了语音和文本信息的特点,提取了适合下游摘要模型输入的词级别的语义特征,使得生成的摘要更具语义连贯性和准确性;可广泛应用于教育领域。
-
-