图像篡改识别模型训练方法、图像篡改识别方法及装置

    公开(公告)号:CN111368342A

    公开(公告)日:2020-07-03

    申请号:CN202010174738.5

    申请日:2020-03-13

    Abstract: 本发明公开一种图像篡改识别模型训练方法、图像篡改识别方法及装置,属于图像识别技术领域,训练方法包括:获取训练图像集以及训练图像集中每个训练图像的标签,其中,在训练图像为篡改图像时,训练图像的标签包括篡改位置信息和篡改类型;以训练图像作为输入,通过待训练的图像篡改识别模型的特征提取网络层提取训练图像的RGB特征、纹理特征以及隐写特征;将训练图像的RGB特征、纹理特征以及隐写特征输入到图像篡改识别模型的检测网络层中,获取训练图像的篡改识别结果;对篡改识别结果与标签进行差异比较,根据差异比较结果优化图像篡改识别模型的参数并继续训练,直至满足预定条件时结束训练。本发明实施例能够准确且快速地识别篡改图像。

    一种基于定位图像的智能设备屏幕提取方法和系统

    公开(公告)号:CN107491778B

    公开(公告)日:2020-07-03

    申请号:CN201710731243.6

    申请日:2017-08-23

    Abstract: 本发明公开了一种基于定位图像的智能设备屏幕提取方法,其包括步骤:100:将定位图像显示在智能设备屏幕上;200:采集智能设备屏幕图像并传输至提取服务端;300:提取服务端对定位图像进行识别,以确定定位图像的原始坐标;400:提取服务端对智能设备屏幕图像进行校正;500:提取服务端从定位图像向外寻找并提取智能设备屏幕图像中显示的智能设备屏幕内边框;600:提取服务端提取智能设备屏幕内边框范围以内的智能设备屏幕图像。此外,本发明还提供了相应的系统和用途。本发明能够自动、便捷地提取智能设备屏幕内边框范围以内的智能设备屏幕图像。进一步地还可以提取智能设备屏幕外边框范围以内的智能设备屏幕图像。

    一种基于增强现实的虚拟内容插入系统和方法

    公开(公告)号:CN107241610A

    公开(公告)日:2017-10-10

    申请号:CN201710311427.7

    申请日:2017-05-05

    Inventor: 王恒

    Abstract: 本发明公开了一种基于增强现实的虚拟内容插入系统,其包括:定位标记;摄像装置,其拍摄物理区域内的画面并捕捉定位标记;处理单元,其基于定位标记信息计算摄像装置的投影矩阵以及确定展示区域的范围,并计算表征待插入的虚拟内容的范围的像素坐标到表征展示区域的范围的物理坐标的变换矩阵;处理单元采用变换矩阵将待插入的虚拟内容进行三维变换,再采用投影矩阵对经过三维变换的虚拟内容再次进行变换,以将变换后的虚拟内容插入到画面显示的展示区域内。相应地还公开了一种虚拟内容插入方法。本发明使得可以在画面中对应物理区域的展示区域的范围内以增强现实的方式实时显示待插入的虚拟内容,从而实现非侵入式个性化直播广告插入。

    一种检索多轮对话的客服问答处理方法及其系统

    公开(公告)号:CN111046132B

    公开(公告)日:2023-06-16

    申请号:CN201911022722.6

    申请日:2019-10-25

    Inventor: 冯璠 雷画雨 王恒

    Abstract: 一种检索多轮对话的客服问答处理方法及其系统,其中客服问答处理方法包括:获取用户输入的当前信息;根据当前信息识别归属的业务领域,从业务领域中筛选多条候选回复信息,以及提取用户输入的与业务领域相关的历史信息;将每一条候选回复信息与当前信息、历史信息构成的上下文信息进行检索匹配,得到对应的匹配度得分;确定最高的匹配度得分对应的候选回复信息作为当前信息的回复内容。在依据业务领域确定当前信息的回复内容时,是将每一条候选回复信息与当前信息、历史信息构成的上下文信息进行检索匹配,可以避免仅与当前信息进行检索匹配的局限问题,能够从上下文的语境中准确理解用户的真实意图,提高检索匹配的准确度。

    一种检索多轮对话的客服问答处理方法及其系统

    公开(公告)号:CN111046132A

    公开(公告)日:2020-04-21

    申请号:CN201911022722.6

    申请日:2019-10-25

    Inventor: 冯璠 雷画雨 王恒

    Abstract: 一种检索多轮对话的客服问答处理方法及其系统,其中客服问答处理方法包括:获取用户输入的当前信息;根据当前信息识别归属的业务领域,从业务领域中筛选多条候选回复信息,以及提取用户输入的与业务领域相关的历史信息;将每一条候选回复信息与当前信息、历史信息构成的上下文信息进行检索匹配,得到对应的匹配度得分;确定最高的匹配度得分对应的候选回复信息作为当前信息的回复内容。在依据业务领域确定当前信息的回复内容时,是将每一条候选回复信息与当前信息、历史信息构成的上下文信息进行检索匹配,可以避免仅与当前信息进行检索匹配的局限问题,能够从上下文的语境中准确理解用户的真实意图,提高检索匹配的准确度。

    一种多序列图像的标注方法及系统

    公开(公告)号:CN109712176A

    公开(公告)日:2019-05-03

    申请号:CN201811469803.6

    申请日:2018-11-28

    Abstract: 本发明公开了一种多序列图像的标注方法及系统。所述方法包括:将待配准序列图像和参考序列图像进行配准,得到配准后序列图像以及图像之间的映射关系;对所述待配准序列图像和所述参考序列图像以及所述配准后序列图像中的任意一幅或多幅图像进行标注,所述标注按照所述映射关系进行变换,显示到其余未标注的图像上。本发明结合多序列图像配准技术使得用户在标注多序列图像中的任意一幅或多幅图像时,标注能在其余未标注的图像同步显示出来,避免了采用人工标注多序列图像过程中需要校准的问题,提高了标注多序列图像的标注位置准确度。

    图像校正方法、装置及计算机可读存储介质

    公开(公告)号:CN108921158A

    公开(公告)日:2018-11-30

    申请号:CN201810611500.7

    申请日:2018-06-14

    Abstract: 本发明公开了一种图像校正方法、装置及计算机可读存储介质,属于图像处理技术领域,方法包括:针对图像校正涉及的多个校正步骤的至少一个校正步骤,对应构建至少一个神经网络模型;基于多个校正步骤和至少一个神经网络模型,生成流程配置文件;在流程配置文件中对多个校正步骤之间的流转逻辑进行配置,生成图像校正流程;当接收到图像校正指令时,根据图像校正流程对目标图像进行校正,并输出校正后的所述目标图像。本发明实施例能够针对不同场景下的带有文字资料的图像信息,校正成规范的、易于检测与识别的图像信息,且采用深度学习的方式构建神经网络模型,并应用在图像校正流程的校正步骤中,使得对图像校正获得更高的准确率。

    一种自然的人机语音交互方法和系统

    公开(公告)号:CN107230476A

    公开(公告)日:2017-10-03

    申请号:CN201710311400.8

    申请日:2017-05-05

    Inventor: 王恒

    Abstract: 本发明公开了一种自然的人机语音交互方法,其包括步骤:(1)信号采集:采用麦克风阵列采集音源的声音信号,根据麦克风阵列中不同位置的麦克风采集的声音信号,判断音源的方位,采用摄像头采集音源所在方位的图像信号;(2)音源身份识别:根据采集的图像信号,识别音源的身份;(3)说话对象识别:根据采集的图像信号和声音信号,基于热词监听和视线分析算法,识别说话对象;(4)根据采集的声音信号,判断是否需要对音源作出响应。相应地,本发明还公开了一种自然的人机语音交互系统。本发明可被应用于人机语音交互,增强人机语音交互体验,使得用户在人机语音交互过程中感觉更加自然。

Patent Agency Ranking