基于表征学习的棋类局面转化模型建立、转化方法及装置

    公开(公告)号:CN114663732A

    公开(公告)日:2022-06-24

    申请号:CN202210571639.X

    申请日:2022-05-25

    Abstract: 本申请涉及基于表征学习的基于表征学习的棋类局面转化模型建立、转化方法及装置,属于图像识别技术领域。本申请包括:通过骨干网络提取预先标注好的棋局局面图片的特征,分层提取所述特征生成多尺度特征层;将所述多尺度特征层输入到目标检测特殊层中生成多个候选框,对所述多个候选框进行筛选获得标准候选框;计算所述标准候选框与预先标注之间的损失值,通过梯度下降调整模型参数使得损失值不再降低或达到预设的迭代次数,获得棋类局面转化模型;通过本申请解决现有技术中,只能匹配模板库内已有的模板,对于新的图像,无法进行准确匹配,且基于模板匹配的方法,对图像尺寸要求严苛,若图像尺寸不匹配,匹配精度也会降低的问题。

    手写表格的检测与识别方法及装置

    公开(公告)号:CN113221778B

    公开(公告)日:2022-05-10

    申请号:CN202110546506.2

    申请日:2021-05-19

    Abstract: 本申请涉及一种手写表格的检测与识别方法及装置,手写表格的检测与识别方法包括获取表格图像,在表格图像中获取白色连通域信息,根据白色连通域信息确定多个白色连通域的外接矩形框,统计各个外接矩形框的面积大小及数量,根据各个外接矩形框的面积大小及数量筛选出单元格内容的连通域,根据单元格内容的连通域检测识别表格结构。本申请对获取的表格图像质量要求低,简单易操作,并且通过各个外接矩形框的面积大小及数量筛选出单元格内容的连通域,在文字与表格框出现粘连时仍能有效识别且识别准确性高。

    手写棋谱录入方法及设备
    13.
    发明公开

    公开(公告)号:CN114299526A

    公开(公告)日:2022-04-08

    申请号:CN202111602980.9

    申请日:2021-12-24

    Abstract: 本申请涉及一种手写棋谱录入方法及设备,方法包括:获取手写棋谱图像;基于交互式区域生长算法将手写棋谱图像有序分割成多个独立表格区域,将分割得到的各独立表格区域压入第一堆栈中,依次从第一堆栈中提取独立表格区域并获取独立表格区域对应的字符信息,将各独立表格区域对应的字符信息进行标注并保存。由于各独立表格区域均对应一张手写棋谱表格,本申请中,在待识别的手写棋谱图像中包含多个手写棋谱表格时,基于交互式区域生长算法对多个手写棋谱表格进行有序分割并依次单独识别,由于手写棋谱表格是进行有序分割的,后续可以将识别出的字符信息根据其对应的手写棋谱表格进行标注后进行保存。

    基于DQN的图像增强处理方法及装置

    公开(公告)号:CN112258420A

    公开(公告)日:2021-01-22

    申请号:CN202011205932.1

    申请日:2020-11-02

    Abstract: 本申请涉及基于DQN的图像增强处理方法及装置,其方法包括,步骤1、获取待处理的图像,初始化评价总分;步骤2、基于预先构建的操作选择网络对待处理图像的每一像素点进行数值操作,得到待评价图像,其中操作选择网络基于DQN算法构建及更新;步骤3、采用预设评价方式对待评价图像进行评分,根据得到的奖励分数对评价总分进行累加更新;步骤4、将评价总分与预定阈值进行比较,当其小于等于第一阈值时,将其清零,跳转执行步骤2,当其大于第一阈值且小于第二阈值时,以待评价图像作为新的待处理图像,跳转执行步骤2,当其大于等于第二阈值时,以待评价图像作为图像增强处理后的图像。本申请消除了图像增强处理对成对数据集的依赖,大幅降低了数据搜集难度。

    基于级联网络框架的图像超分辨率方法、级联网络

    公开(公告)号:CN112116527A

    公开(公告)日:2020-12-22

    申请号:CN202010940661.8

    申请日:2020-09-09

    Abstract: 本发明涉及一种基于级联网络框架的图像超分辨率方法、级联网络,基于基础超分辨率网络,获取目标图像的初步上采样结果;基于细节精修网络,根据初步上采样结果,获取超分辨率图像结果。其两个网络级联,将面向峰值信噪比的任务和面向主观感受的任务分开,由两个模型分别处理,基础超分辨率网络首先完成初步的上采样,这个初步上采样的结果很大程度上和原始高分辨率图像保证了内容一致性,接下来将初步上采样的结果送入精修网络来进一步改善感官损失,精修网络有了初步上采样结果的输入保证了整个超分辨率结果不会过度牺牲内容一致性,并且在初步上采样结果上精修减轻了精修网络和判别器的训练难度加快了训练速度,有效地缓解了现有模型的问题。

    手写棋谱录入方法及设备
    16.
    发明授权

    公开(公告)号:CN114299526B

    公开(公告)日:2025-04-29

    申请号:CN202111602980.9

    申请日:2021-12-24

    Abstract: 本申请涉及一种手写棋谱录入方法及设备,方法包括:获取手写棋谱图像;基于交互式区域生长算法将手写棋谱图像有序分割成多个独立表格区域,将分割得到的各独立表格区域压入第一堆栈中,依次从第一堆栈中提取独立表格区域并获取独立表格区域对应的字符信息,将各独立表格区域对应的字符信息进行标注并保存。由于各独立表格区域均对应一张手写棋谱表格,本申请中,在待识别的手写棋谱图像中包含多个手写棋谱表格时,基于交互式区域生长算法对多个手写棋谱表格进行有序分割并依次单独识别,由于手写棋谱表格是进行有序分割的,后续可以将识别出的字符信息根据其对应的手写棋谱表格进行标注后进行保存。

    基于激光振镜的结构光系统的建模和标定方法和装置

    公开(公告)号:CN119887936A

    公开(公告)日:2025-04-25

    申请号:CN202411950406.6

    申请日:2024-12-27

    Abstract: 本公开的实施例公开了基于激光振镜的结构光系统的建模和标定方法和装置。该方法的一具体实施方式包括:获取第一棋盘格图像集;根据第一棋盘格图像集,确定第一初始内参信息、投影装置对应的第二初始内参信息、拍摄装置和投影装置之间的初始旋转信息和初始平移信息;获取第二棋盘格图像集;获取能量生成函数;根据第二棋盘格图像集,确定在能量生成函数对应函数值最小化的条件下的最优解,以生成第一内参信息、第二内参信息、初始旋转信息、平移信息和线性映射矩阵,作为基于激光振镜下的结构光系统的标定参数信息。该实施方式基于激光振镜,可以实现针对结构光系统进行高精准度地标定,以后续准确地确定目标物品的三维物品模型信息。

    基于多模态大模型微调的视频行为识别方法、装置和设备

    公开(公告)号:CN119495127B

    公开(公告)日:2025-04-22

    申请号:CN202510075914.2

    申请日:2025-01-17

    Abstract: 本公开的实施例涉及视频检测技术领域,具体涉及基于多模态大模型微调的视频行为识别方法、装置和设备。本公开方法的一具体实施方式包括:获取视频行为识别数据集和初始视频行为识别模型;对于每个视频行为识别数据,执行以下步骤:确定视频行为识别数据包括的视频帧序列对应的关键帧图像;将关键帧图像存储至预设图像存储位置;基于标签文本模板、关键帧图像、图像存储路径和视频行为识别数据包括的行为标签,生成训练样本,其中,训练样本包括样本图像和样本标签数据;对初始视频行为识别模型进行训练,以及确定为视频行为识别模型;将目标视频数据输入视频行为识别模型,得到视频行为文本信息。该实施方式可以提高视频行为识别模型的训练时长。

    任务导向的多模态物品推荐方法、装置、电子设备和介质

    公开(公告)号:CN119515495A

    公开(公告)日:2025-02-25

    申请号:CN202411550261.0

    申请日:2024-11-01

    Abstract: 本公开的实施例公开了任务导向的多模态物品推荐方法、装置、电子设备和介质。该方法的一具体实施方式包括:获取物品模态数据集和用户物品间交互数据集;生成初始物品模态关系图矩阵集、用户物品交互矩阵和物品间二阶交互关系矩阵;生成训练样本集,以及执行以下训练步骤:将初始交互嵌入表示集合、各个物品模态嵌入表示集合、初始物品模态关系图矩阵集和用户物品交互矩阵输入初始物品推荐模型;确定每个训练样本对应的交互预测值;生成物品推荐损失值;响应于物品推荐损失值小于预设损失阈值,将初始物品推荐模型确定为物品推荐模型;利用物品推荐模型,生成物品推荐信息。该实施方式可以提高物品推荐模型的性能,将用户感兴趣的物品推荐给用户。

Patent Agency Ranking