-
公开(公告)号:CN119963843A
公开(公告)日:2025-05-09
申请号:CN202510140884.9
申请日:2025-02-08
Applicant: 上海交通大学 , 上海交通大学医学院附属瑞金医院
IPC: G06V10/26 , G06V20/70 , G06V10/82 , G06V10/28 , G06T17/00 , G06N3/0455 , G06N3/0464 , G06N3/0985
Abstract: 本发明提供了一种面向腹部CT图像的语义分割及三维重建系统,包括:步骤S1:对原始腹部CT图像进行预处理,以获取模型训练所需的数据和标注;步骤S2:构建腹腔区域粗分割模块,用于对二维腹部CT图像进行腹腔区域以及脂肪组织的分割;步骤S3:构建三维重建模块,用于将二维腹部CT图像转换为三维数据;步骤S4:构建腹腔内部细分割模块,用于对三维腹部CT图像进行胰腺以及血管组织的分割;步骤S5:对分割结果进行可视化,直观展示腹腔的解剖结构。本发明融合了二维和三维分割网络的优点,通过对于腹腔区域的精细分割,帮助术者理清胰腺上缘区域的解剖结构因素,通用性强、操作便捷。
-
公开(公告)号:CN102013103B
公开(公告)日:2013-04-03
申请号:CN201010571128.5
申请日:2010-12-03
Applicant: 上海交通大学
Abstract: 一种图像处理和模式识别技术领域的方法,特别是一种实时动态嘴唇跟踪方法。包括:通过数码摄像机拍摄并获取包含嘴唇区域在内的图像序列;通过基于模糊聚类和卡尔曼预测的连续图像嘴唇分割方法,将图像中所有像素点分为嘴唇像素点或非嘴唇像素点,并输出所有像素点属于嘴唇像素点的概率;通过14点动态形状模型和卡尔曼预测,在步骤二提供的嘴唇概率分布图的基础上,获取嘴唇图像序列中每一帧中的嘴唇轮廓,本发明能够自动跟踪图像序列中嘴唇的运动,具有较高的处理速度(保证实时性)和识别准确率。
-
公开(公告)号:CN101719924A
公开(公告)日:2010-06-02
申请号:CN200910311664.9
申请日:2009-12-17
Applicant: 上海交通大学
Abstract: 一种信息技术领域的基于群件理解的不良彩信过滤方法,包括如下步骤:将每个处理组件分为四组样本,对每个处理组件分别训练形成四个分类器,得到处理组件的离线训练用样本库和决策树训练样本集,进而生成决策树;把彩信拆分成若干个单一媒体文件;进行基于内容理解的过滤处理,得到每个处理组件的反动概率、色情概率、恐怖概率和垃圾概率;将得到的概率组织成一个输入向量,输入到训练所得的决策树,得到彩信的过滤结果。本发明通过把彩信拆分成不同单一媒体文件,有效解决了彩信无法进行内容过滤的困难,提高了不良彩信过滤的实时性和客观性,过滤的效率和准确性明显提高。
-
公开(公告)号:CN1728161A
公开(公告)日:2006-02-01
申请号:CN200510028206.6
申请日:2005-07-28
Applicant: 上海交通大学
IPC: G06K9/46
Abstract: 一种模式识别领域的基于非均匀量化颜色特征矢量的敏感图像过滤方法,首先进行多种图像特征的提取,包括图像基本特征的提取和图像内容特征的提取,图像基本特征是针对敏感图像特点的非均匀量化颜色直方图特征;图像内容特征是基于纹理检测的皮肤区域分布特征;然后采用自适应提升算法,综合分析所提取的特征组合,根据其与图像样本库内敏感图像和正常图像的匹配程度,判别该图像是否为敏感图像。本发明提出了一种新型图像基本颜色特征的表达方式,能够使用尽可能低维的特征向量来描述敏感图像的颜色分布特点。因此,本发明在获得高识别率的同时,保证了较高的处理速度,具有广阔的应用前景。
-
公开(公告)号:CN117558064A
公开(公告)日:2024-02-13
申请号:CN202311629756.8
申请日:2023-11-30
Applicant: 上海交通大学
Abstract: 本发明提供了一种开集场景下防深度伪造的讲话人认证系统及方法,包括:特征提取模块:将讲话人说某个单词的唇部视频进行预处理得到滑动窗口视频组,基于滑动窗口视频组分别进行静态特征提取和动态特征提取,得到每个滑窗的静态特征和动态特征;再将静态特征和动态特征与时序融合得到视频的最终特征;其中,训练时利用静态特征提取模块中的重构损失、动态特征提取模块中的滑窗顺序预测损失和最终特征的认证损失进行监督,得到优化后的网络参数;推理时利用静态特征提取器、动态特征提取器和特征融合模块得到视频的最终特征;特征认证模块:利用用户的原型特征对视频的最终特征进行认证。
-
公开(公告)号:CN105787427B
公开(公告)日:2019-05-24
申请号:CN201610011905.8
申请日:2016-01-08
Applicant: 上海交通大学 , 上海数据分析与处理技术研究所
Abstract: 本发明提供了一种嘴唇区域定位方法,包括:步骤1:通过摄像机采集人脸正面讲话序列,并进行人脸检测和肤色过滤;步骤2:通过肤色像素点重心的计算和对鼻孔区域的检索找到嘴唇区域的上边界;步骤3:通过形态学图像处理和二值图像的逻辑运算操作“溶解”脸部的五官,滤除背景中的“伪肤色”点;步骤4:通过横向的肤色像素点比对获得嘴唇区域的下边界;步骤5:通过纵向的肤色像素点比对获得嘴唇区域的左右边界。本发明能够摆脱经验化的参数设置(具有更好的通用性和鲁棒性),准确定位嘴唇区域,并对同一个讲话者的嘴唇定位能实现较高的稳定性。
-
公开(公告)号:CN105787428A
公开(公告)日:2016-07-20
申请号:CN201610012017.8
申请日:2016-01-08
Applicant: 上海交通大学 , 上海数据分析与处理技术研究所
CPC classification number: G06K9/00335 , G06F21/32 , G06K9/00281 , G06K9/00718
Abstract: 本发明提供了一种基于稀疏编码的唇语特征身份认证方法,包括如下步骤:步骤1:依据嘴唇位置,从输入视频中提取嘴唇图像块;步骤2:建立稀疏编码特征字典群,并对嘴唇图像块进行重构,计算重构误差;步骤3:根据重构误差对讲话用户进行身份识别和认证。本发明将唇语的生理结构与行为习惯双重特征同时考虑,从唇语特征中获得较多的信息量,提高了识别的准确率;并采用稀疏编码算法较好地对抗视频采集过程中因为环境和讲话人自身因素带来的各类噪声,有较强的鲁棒性;并且使用稀疏编码的重构及重构误差作为判定依据,计算机执行效率高,速度快。
-
公开(公告)号:CN100370475C
公开(公告)日:2008-02-20
申请号:CN200510028206.6
申请日:2005-07-28
Applicant: 上海交通大学
IPC: G06K9/46
Abstract: 一种模式识别领域的基于非均匀量化颜色特征矢量的敏感图像过滤方法,首先进行多种图像特征的提取,包括图像基本特征的提取和图像内容特征的提取,图像基本特征是针对敏感图像特点的非均匀量化颜色直方图特征;图像内容特征是基于纹理检测的皮肤区域分布特征;然后采用自适应提升算法,综合分析所提取的特征组合,根据其与图像样本库内敏感图像和正常图像的匹配程度,判别该图像是否为敏感图像。本发明提出了一种新型图像基本颜色特征的表达方式,能够使用尽可能低维的特征向量来描述敏感图像的颜色分布特点。因此,本发明在获得高识别率的同时,保证了较高的处理速度,具有广阔的应用前景。
-
公开(公告)号:CN117711047A
公开(公告)日:2024-03-15
申请号:CN202311729854.9
申请日:2023-12-14
Applicant: 上海交通大学
IPC: G06V40/16 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/0499 , G06N3/084
Abstract: 本发明提供了一种中文唇语识别方法及系统,包括:对讲话视频进行预处理,得到连续的嘴唇区域图像序列;将嘴唇区域图像序列输入到唇部区域特征编码器中,得到唇部区域特征编码向量;将视频特征编码向量、拼音中间表征编码向量、视位中间表征编码向量输入到中文讲话内容解码器中,解码得到中文汉语句子的讲话内容;根据拼音中间表征序列预测损失、视位中间表征序列预测损失和中文讲话内容预测损失,按比例加权后对唇语识别模型进行优化。本发明通过采用汉语拼音和视位作为多中间表征,使唇语识别模型从多角度提取视觉特征信息和语义特征信息,解决唇语识别模型无法有效利用视频中唇部区域的视觉信息的问题,提高唇语识别模型的识别性能和泛化能力。
-
公开(公告)号:CN112595655A
公开(公告)日:2021-04-02
申请号:CN202011168499.9
申请日:2020-10-28
Applicant: 宁夏医科大学总医院 , 上海交通大学 , 宁夏数据科技股份有限公司
IPC: G01N15/10 , G01N1/28 , G01N1/30 , G06K9/32 , G06K9/62 , G06N3/04 , G06N3/08 , G06T7/00 , G06T7/11
Abstract: 基于人工智能的脑脊液细胞自动分析系统,该系统包括脑脊液细胞图像特征库的建立方法、脑脊液细胞图像特征采集方法和装置、脑脊液细胞图像自动化识别和计数方法;本发明克服了现有技术缺陷,提供了脑脊液细胞图像库建立方法、脑脊液细胞图像采集方法和装置以及脑脊液细胞图像自动化识别和计数方法。通过自动化地对脑脊液细胞图像进行特征提取,对脑脊液细胞进行像素级别的分割,对分割后的脑脊液细胞进行分类并且对整张脑脊液细胞图像的细胞进行计数。本发明大大提高了脑细胞检测工作效率,降低了人工劳动强度,对中枢神经系统感染、脑膜白血病、淋巴瘤、脑寄生虫病、脑血管病以及免疫变性等疾病的诊断提供了重要的脑脊液细胞检测手段。
-
-
-
-
-
-
-
-
-