一种基于语义分割的关键信息提取方法及系统

    公开(公告)号:CN113963147B

    公开(公告)日:2023-09-15

    申请号:CN202111131686.4

    申请日:2021-09-26

    Abstract: 本发明公开了一种基于语义分割的关键信息提取方法及系统,采集数据形成学习样本;构建深度神经网络,使用样本集的数据对神经网络进行训练;通过终端或者其他设备获取待处理图片数据,并对图片进行增强处理;将处理后的图片输入预先训练好的深度神经网络文本检测器与文本识别器进行文本的定位与识别;利用发票与营业执照格式固定,关键信息所处位置比例等信息,对关键信息进行提取。本发明将不同种类的增值税发票与营业执照关键信息提取集于一个系统,并提高了现有识别的准确率和速率,为有效减少人工核算的工作量,降低人力成本,实现财税报销的自动化,商家资质检查等工作提供了更好的系统的服务。

    一种基于方面的情感分析方法及系统

    公开(公告)号:CN116150367A

    公开(公告)日:2023-05-23

    申请号:CN202310066627.6

    申请日:2023-01-16

    Abstract: 本发明公开了一种基于方面的情感分析方法及系统,首先进行数据准备及处理数据集;将处理好的数据集输入多任务学习模型进行特征提取;训练多任务学习模型,利用方面术语提取任务去辅助进行方面情感分类任务,并输出提取的方面术语和情感极性;多任务学习模型涉及两个典型的子任务,方面术语提取和方面极性分类,把方面术语提取任务作为一个辅助任务,辅助进行方面情感极性分类,以促进方面极性分类。并且利用多头注意力机制将依存关系序列与方面提取联系起来,使模型能够更多地关注与方面密切相关的词,大大增强了方面极性分类的性能。本发明可以应用在餐饮商品风景等评价的情感分析中,能够提供更准确更精细的情感预测服务。

    一种基于语义分割的关键信息提取方法及系统

    公开(公告)号:CN113963147A

    公开(公告)日:2022-01-21

    申请号:CN202111131686.4

    申请日:2021-09-26

    Abstract: 本发明公开了一种基于语义分割的关键信息提取方法及系统,采集数据形成学习样本;构建深度神经网络,使用样本集的数据对神经网络进行训练;通过终端或者其他设备获取待处理图片数据,并对图片进行增强处理;将处理后的图片输入预先训练好的深度神经网络文本检测器与文本识别器进行文本的定位与识别;利用发票与营业执照格式固定,关键信息所处位置比例等信息,对关键信息进行提取。本发明将不同种类的增值税发票与营业执照关键信息提取集于一个系统,并提高了现有识别的准确率和速率,为有效减少人工核算的工作量,降低人力成本,实现财税报销的自动化,商家资质检查等工作提供了更好的系统的服务。

    一种基于细粒度识别的菜品及属性信息的识别系统及方法

    公开(公告)号:CN112115966A

    公开(公告)日:2020-12-22

    申请号:CN202010779870.9

    申请日:2020-08-05

    Inventor: 钱学明 刘成旭

    Abstract: 本发明公开一种基于细粒度识别的菜品及属性信息的识别系统及方法,包括:对待识别的菜品图像进行预处理;将预处理后的图像输入训预先练好的深度神经网络菜品分类与属性识别器进行识别,输出菜品的类别属性信息;将获得获得菜品的类别属性信息与预先建立的菜品数据库进行匹配,输出识别结果。本发明拓展了除菜品种类外的相关属性信息,并提高了现有识别的准确率,为实现人们健康膳食推荐、自主烹饪与营养摄入管理等工作提供了更好的系统的服务。

    一种基于时空信息与深度网络的监控视频对象检测方法

    公开(公告)号:CN108304808A

    公开(公告)日:2018-07-20

    申请号:CN201810118845.9

    申请日:2018-02-06

    Abstract: 本发明公开了一种基于时空信息与深度网络的监控视频对象检测方法,包括收集、标注数据集,训练深度卷积神经网络;利用训练好的深度神经卷积网络提取鲁棒的多尺度深度特征;在多尺度深度特征上提取运动目标候选区域;根据视频前后帧检测结果预测下一帧目标出现的位置;针对运动目标候选区域和预测候选区域进行RoI归一化并对特征向量进行分类和回归得到初步检测结果;利用运动和预测信息,对得到的初步结果进行微调,进一步精准检测结果。本发明综合考虑了视频中所包含的丰富的时空信息,利用运动和预测大大减少了冗余的候选框,并且解决了单帧检测结果不稳定的问题,与其他基于区域的目标检测检测方法相比,在时间和检测精准度上都有了一定的提升。

    一种以图快速检索景点的方法及导游系统

    公开(公告)号:CN106776849A

    公开(公告)日:2017-05-31

    申请号:CN201611066278.4

    申请日:2016-11-28

    Inventor: 钱学明 周澎

    Abstract: 本发明公开了一种以图快速检索景点的方法及导游系统,其通过在离线系统中对大规模带有地理标签的图像数据库进行处理,从图像数据集中提取出主题相册,并通过对主题相册内容的进一步去噪,筛选,并添加文字信息最终生成离线景点数据集。并通过生成快速索引结构以提高景点检索的速度。在线系统中,通过构建查询图与景点数据之间的映射关系以及引入查询图相对于景点的相似度得分算法,并通过最终的打分排序获得检索结果。本发明构建了一个可以通过图像信息快速检索景点的方法,同时通过移动终端对景点信息的多角度展示(景点文字信息,景点相册,景点在地图上的位置标注,以及通过语音合成播报导游词等)为游客提供了完善的自助导游服务。

    基于人类视觉系统的视频编码帧间预测模式快速确定方法

    公开(公告)号:CN101783951A

    公开(公告)日:2010-07-21

    申请号:CN201010116127.1

    申请日:2010-03-02

    Abstract: 本发明公开了一种基于人类视觉系统的视频编码帧间预测模式快速确定方法,其特征在于,包括如下执行步骤:首先对输入的参考帧图像和当前帧图像进行HVS滤波,然后对滤波后的图像划分成宏块并按照HVS滤波后图像中每个MB的均值和方差确定该MB的划分方式是SKIP,16×16,16×8,8×16,8×8五种模式中的一种,如果所确定的类型为8×8,则再计算其中8×8,4×8,8×4,4×4中的均值和方差,并最终确定8×8,4×8,8×4,4×4中的具体对应模式。在帧间预测模式确定基础上进行有针对性的运动估计与运动补偿。

    可分级小波包变换的图像纹理描述方法

    公开(公告)号:CN101702239A

    公开(公告)日:2010-05-05

    申请号:CN200910024348.3

    申请日:2009-10-16

    Abstract: 本发明公开了一种可分级小波包变换的图像纹理描述方法,其特征在于,包括如下执行步骤:首先对输入的原始图像进行图像灰度化处理,将图像变换成灰度图像;接下来对灰度图像进行可分级小波包变换;最后进行纹理特征描述,在纹理特征描述步骤中,采用各个子带的均值和标准差,最后再将各个子带Wbll的纹理描述特征进行合并作为最终的纹理描述。

    一种增强网络视频中视觉重要区域清晰度的方法

    公开(公告)号:CN101527786A

    公开(公告)日:2009-09-09

    申请号:CN200910021768.6

    申请日:2009-03-31

    Abstract: 本发明公开了一种增强网络视频中视觉重要区域清晰度的方法,其特征是,包括如下执行步骤:首先并行地执行字幕区域检测单元00和进行人脸区域检测单元01;然后执行当前帧视觉重要区域确定单元02,通过对人脸以及字幕两种重要区域进行或操作,也即MAP=MAPt|MAPf,实现对该两种重要区域合并以得到当前帧中视觉重要区域MAP,其中MAPt为当前字幕在原始视频中的字幕区域;MAPf为原始图像中人脸区域所在的区域;接下来执行基于视觉重要区域的编码单元03,以对视觉重要区域和视觉非重要区域进行有差别的编码,实现增强视觉重要区域的编码清晰度;最后执行单元04形成待发送的视频码流。

    一种检测足球比赛视频精彩片段的方法

    公开(公告)号:CN100531352C

    公开(公告)日:2009-08-19

    申请号:CN200710018455.6

    申请日:2007-08-10

    Abstract: 本发明针对现有体育比赛视频检测精彩片段方法中不能判断片段所属的类型,提出了一种检测足球视频精彩片段的方法,包括如下步骤:首先对数据库中足球比赛的压缩视频通过解码器进行解码;接下来进行视频镜头边界检测,然后对镜头类型中的其它镜头进行特征提取,在相应特征提取的基础上进行足球视频镜头分类;然后根据镜头分类结果进行视频镜头片段边界检测,并提取每个片段中的观测矢量;再从一个片段中所提取的观测矢量来判断该片段所属的类型,接下来对确定的精彩片段进行划分,最后将划分后的精彩片段进行摘录并存储到数据库中。

Patent Agency Ranking