一种网络动画中的文字定位及识别方法

    公开(公告)号:CN102147863A

    公开(公告)日:2011-08-10

    申请号:CN201010111374.2

    申请日:2010-02-10

    Inventor: 张树武 刘杰 梁伟

    Abstract: 本发明是一种网络动画中的文字定位及识别方法,该方法充分利用网络动画的结构分析技术,将网络动画中的内嵌编码文字直接提取出来,并将网络动画分解为基本形状,而基本形状是构成网络动画的主要元素。接下来针对每个基本形状,利用基于连通域的启发合并、特征聚类的两阶段文字定位方法定位基本形状中的非内嵌文字,再利用基于笔画宽度直方图的噪声过滤方法,合理地将非文字连通域过滤掉,从而将所有非内嵌文字定位出来,然后利用梯度直方图特征识别非内嵌文字。最后将识别出的非内嵌文字和内嵌文字返回给用户。

    支持海量数据自动处理的数字内容编目管理系统及方法

    公开(公告)号:CN101754056B

    公开(公告)日:2013-01-02

    申请号:CN200810240362.2

    申请日:2008-12-17

    Abstract: 本发明为一种支持海量数据自动处理的数字内容编目管理系统与方法,包括:管理服务器,负责与其它模块进行消息通信和消息响应,确定资源的存储位置,为计算任务分配计算服务器,控制业务流程;上传客户端,负责上传外部的多媒体资源;人工审核标注客户端,为元数据结果的人工审核和标注提供交互界面;计算服务器,负责管理和启动计算引擎,获取媒体资源的元数据结果;资源存储服务器,负责管理媒体资源信息;元数据服务器,负责管理元数据信息;磁盘阵列,负责存储媒体资源的物理文件,资源数据库及元数据数据库。本发明能够对海量媒体数据进行自动处理,能够自动获取多媒体数据的内容和自动编目,实现对海量多媒体数据内容的有效管理。

    数据备案方法、系统、计算机设备及存储介质

    公开(公告)号:CN118916924A

    公开(公告)日:2024-11-08

    申请号:CN202410959873.9

    申请日:2024-07-17

    Abstract: 本公开涉及计算机技术领域,公开了数据备案方法、系统、计算机设备及存储介质,该方法包括:前端系统将存储请求发送至API服务;API服务向区块链网络的多个区块链节点中每个区块链节点发送目标备案数据、目标备案数据的校验哈希值的签名信息;该每个区块链节点将目标备案数据、目标备案数据的交易哈希值存储在区块链节点中;区块链节点向API服务发送目标备案数据的交易哈希值、目标备案数据的存储时间戳;前端系统向API服务发送查询请求;区块链节点查询出查询请求中输入信息对应的备案数据;API服务接收区块链节点发送的输入信息对应的备案数据,以及将输入信息对应的备案数据发送至用户的终端。

    一种基于商标密度的个性化商标匹配识别方法

    公开(公告)号:CN104156413A

    公开(公告)日:2014-11-19

    申请号:CN201410370305.1

    申请日:2014-07-30

    Inventor: 张树武 张渊 梁伟

    CPC classification number: G06F17/30256 G06K9/6211

    Abstract: 一种基于商标密度的个性化商标匹配识别方法,包括:建立商标图片样本库,提取SIFT特征,计算商标密度,并根据该商标密度,设定个性化匹配策略;为样本库中的商标图片提取SIFT特征及GSC特征,并建立SIFT词袋模型和GSC词袋模型;对于待识别图像区域,提取SIFT特征和GSC特征,分别在SIFT词袋模型和GSC词袋模型中计算商标的相似度列表;根据个性化匹配策略,将两个商标相似度列表结合,获得该区域与所有商标的最终相似度列表,相似度最大且满足相似度阈值的商标为该区域的识别结果。本发明提高了商标识别的速度与精度,同时对于商标在受到尺度变换、视角变换、光照、遮挡、背景干扰等影响下的检测具有良好的效果。

    一种基于空间连通域预定位的商标检测方法

    公开(公告)号:CN102799653A

    公开(公告)日:2012-11-28

    申请号:CN201210225922.3

    申请日:2012-06-29

    Inventor: 张树武 张渊 梁伟

    Abstract: 本发明公开了一种基于空间连通域预定位的商标检测方法。该方法包括以下步骤:建立包含多个商标图片的商标图片样本库;为商标图片样本库中的商标图片建立空间连通域描述子SCCD特征;对于含有目标商标的测试图片,建立其CCD特征;利用商标图片样本库中商标图片的SCCD特征在测试图片中获取商标预定位区域LPRs;利用基于商标颜色及形状信息建立的特征对LPRs与所述商标图片数据库中的商标图片进行匹配,匹配成功的商标预定位区域即为最终检测得到的商标。本发明方法充分针对商标的特点,进一步提高了商标检测与定位识别的速度与精度,同时对于商标在受到尺度变换、视角变换、光照、遮挡、背景干扰等影响下的检测具有良好的效果。

    细胞分割模型的训练方法、细胞分割方法及系统

    公开(公告)号:CN118736579B

    公开(公告)日:2024-11-15

    申请号:CN202411204424.X

    申请日:2024-08-30

    Abstract: 本公开涉及人工智能领域和图像处理领域,提供一种细胞分割模型的训练方法、细胞分割方法及系统,该训练方法包括:获取训练样本集以及伪标签;基于训练样本集和伪标签,对细胞分割模型进行第一阶段训练,得到第一阶段的细胞分割模型;基于第一阶段的训练结果,通过引入噪声,进行不确定性预测,得到不确定性预测结果;根据不确定性预测结果,对伪标签中的第一标签进行校正,得到校正后的伪标签;基于训练样本集和校正后的伪标签,对第一阶段的细胞分割模型进行第二阶段训练,得到最终的细胞分割模型。本公开可以解决难以提高细胞分割的效率和准确性的问题,可以训练出能够准确分割细胞的细胞分割模型,提高细胞分割的效率和准确性。

    基于可逆扩散的语音驱动生成动作统一编辑方法及装置

    公开(公告)号:CN118737185A

    公开(公告)日:2024-10-01

    申请号:CN202410722280.0

    申请日:2024-06-05

    Abstract: 本申请提供一种基于可逆扩散的语音驱动生成动作统一编辑方法及装置。该方法包括:获取训练好的扩散模型,并将所述扩散模型可逆化,得到可逆扩散模型;所述扩散模型用于进行语音驱动动作生成任务;以原始讲话数据为条件,利用所述可逆扩散模型重建生成匹配所述原始讲话数据的生成动作数据的原始噪声;基于编辑任务和所述原始噪声对所述生成动作数据进行编辑操作,得到目标生成动作。本申请提供的基于可逆扩散的语音驱动生成动作统一编辑方法及装置,利用可逆扩散模型的逆向噪声重建过程获得原始噪声,使能够基于原始噪声自动化进行生成动作编辑,减少了人力物力资源的浪费,节省了成本。

    基于部件结构模型的目标检测与识别方法

    公开(公告)号:CN102142078A

    公开(公告)日:2011-08-03

    申请号:CN201010106757.0

    申请日:2010-02-03

    Abstract: 基于部件结构模型的目标检测与识别方法,采用积分直方图提取目标以及目标各个部件内不同模块大小的梯度方向直方图特征;分别对目标以及目标各个部件训练生成boost级联分类器,级联分类器中的弱分类器由梯度方向直方图特征向量的方向成员构成;采用半监督训练方式,由手工标注方式确定目标的位置,而目标各个部件的位置由训练目标整体级联分类器过程中所挑选出的区分能力较强的若干弱分类器所在模块的位置确定;采用星型结构训练目标以及目标各个部件之间的空间关系模型;用boost级联分类器分别检测目标以及目标各个部件得到部件检测代价图,然后利用距离变换以及目标各个部件之间的相对位置关系实现目标的检测与识别定位。

    支持海量数据自动处理的数字内容编目管理系统及方法

    公开(公告)号:CN101754056A

    公开(公告)日:2010-06-23

    申请号:CN200810240362.2

    申请日:2008-12-17

    Abstract: 本发明为一种支持海量数据自动处理的数字内容编目管理系统与方法,包括:管理服务器,负责与其它模块进行消息通信和消息响应,确定资源的存储位置,为计算任务分配计算服务器,控制业务流程;上传客户端,负责上传外部的多媒体资源;人工审核标注客户端,为元数据结果的人工审核和标注提供交互界面;计算服务器,负责管理和启动计算引擎,获取媒体资源的元数据结果;资源存储服务器,负责管理媒体资源信息;元数据服务器,负责管理元数据信息;磁盘阵列,负责存储媒体资源的物理文件,资源数据库及元数据数据库。本发明能够对海量媒体数据进行自动处理,能够自动获取多媒体数据的内容和自动编目,实现对海量多媒体数据内容的有效管理。

    音频快速搜索方法
    10.
    发明授权

    公开(公告)号:CN100424692C

    公开(公告)日:2008-10-08

    申请号:CN200510086315.3

    申请日:2005-08-31

    Inventor: 梁伟 张树武 徐波

    Abstract: 快速音频搜索方法提出了基于时-频域频谱描述的快速音频搜索方法。该方法的基本特征是利用音频信号子带能量比作为基本特征,以直方图作为建模方法,对目标音频的出现位置进行跳跃检出,最基本特征,一是选择合适的子带,使得该频带的信号在统计意义上对于噪声信号和畸变具有最佳的鲁棒性;二是根据目标音频的频谱分布,自适应的调整VQ量化边界;三是借鉴了图像识别中广泛使用的直方图匹配算法。子带能量信号作归一化后,避免了常规方法中因背景噪声干扰等畸变造成的检出错误和漏检,而且计算量很小;四是提出了建立音频搜索算法的性能评价标准,并设计分析了检索结果的客观评价参数。

Patent Agency Ranking