基于协同注意力机制多尺度目标检测网络的目标检测方法

    公开(公告)号:CN118570633A

    公开(公告)日:2024-08-30

    申请号:CN202410617173.1

    申请日:2024-05-17

    Abstract: 本发明属于智能目标检测技术领域,尤其涉及基于协同注意力机制多尺度目标检测网络的目标检测方法,包括:S1、构建目标检测模型;其主干网络包括优化后的DarkNet‑53模型,主干网络用于使用优化后的DarkNet‑53模型对输入图像提取不同层次的特征;颈部网络中嵌入有基于协同注意力机制的特征增强模块,用于使目标检测模型聚焦到目标本身;预测头用于处理颈部网络输出的特征,并生成最终的目标检测结;S2、获取图像数据并进行预处理,得到目标检测模型的训练数据集;S3、使用S2得到的训练数据集对目标检测模型进行训练;S4、使用训练好的目标检测模型,进行实际的目标检测。本方法可以提升复杂场景下目标检测的效率和精度。

    基于数据分布的分层加权抗噪深度度量学习方法

    公开(公告)号:CN114418013A

    公开(公告)日:2022-04-29

    申请号:CN202210075749.7

    申请日:2022-01-22

    Abstract: 本发明涉及互联网大数据技术领域,具体涉及基于数据分布的分层加权抗噪深度度量学习方法,包括:将随机合成的噪声样本加载到训练数据集中;基于数据间的距离关系刻画数据分布,随着训练进程推进数据分布的记录更新;基于数据分布的分布矩阵,去除每个训练batch中的噪声样本;基于数据分布自适应指导采样策略的学习并完成采样;最小化模型的损失函数以更新模型参数,并同步更新数据分布。本发明的深度度量学习方法能够提高模型的训练准确性和训练鲁棒性,从而能够保证模型的训练效果。

    一种基于多级别网络的图像文本检索方法

    公开(公告)号:CN114357148A

    公开(公告)日:2022-04-15

    申请号:CN202111619401.1

    申请日:2021-12-27

    Inventor: 冯永 杨磊 王永恒

    Abstract: 本发明涉及图像文本检索技术领域,具体涉及一种基于多级别网络的图像文本检索方法,包括:构建具有全局级别子网络、关系级别子网络和数字级别子网络的图文检索模型;构建用于训练图文检索模型的训练数据集,训练数据集中包括图像文本对;将训练数据集中的图像文本对分别输入图文检索模型的全局级别子网络、关系级别子网络和数字级别子网络,以分别生成对应的全局级别相似度、关系级别相似度和数字级别相似度并单独训练对应的子网络;基于训练完成的图文检索模型进行图像文本检索。本发明中的图像文本检索方法能够提升图像文本的检索效率和检索准确性,从而能够提升图像文本检索的效果。

    一种基于图像处理技术的产品表面瑕疵识别方法

    公开(公告)号:CN113516619A

    公开(公告)日:2021-10-19

    申请号:CN202110386182.0

    申请日:2021-04-09

    Abstract: 本发明公开了一种基于图像处理技术的产品表面瑕疵识别方法,首先在产品流水线上设置产品检测点,利用高清摄像机对监测点处的产品进行拍摄,获得产品的图像;其次,基于得到的产品图像,对图片进行灰度操作得到灰度图像;再次次针对灰度图像利用瑕疵点识别算法计算并输出瑕疵点面积和图像上的中心点坐标;最后根据输出值触发激光打标机,对产品进行激光打标签,标识出不合格字样。本发明提出的基于计算机处理的瑕疵识别方法,能够很好的识别出产品表面瑕疵点,而对达到产品质量要求表面光滑的产品不生成误判现象。可以解决工业生产中检验汽车配件是否合格问题,提高工业生产效率,节约成本,并适于推广到工厂流水线产品检测上。

    一种基于迭代决策树的电信用户分类方法

    公开(公告)号:CN108564380B

    公开(公告)日:2021-07-20

    申请号:CN201810321941.3

    申请日:2018-04-11

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于迭代决策树的电信用户分类方法,包括:S1:根据用户的基本信息、通话、短信记录构建用户社交关系网络G(V,E);S2:从G(V,E)中抽取特征,或根据已分类的用户更新其他用户的特征;S3:用迭代决策树对G(V,E)中未分类的用户分类,即判断是否满足|sFriend‑nFriend|≥L;若满足则分类,将分类的用户数记为κ;K若κ>K,回到步骤S2,否则进入步骤S4;S4:令L=L‑1;若L≥0,返回步骤S2,否则进入步骤S5;S5:输出分类结果。本发明在训练集较少的情况下能达到很低的错误率,可以克服训练集占比高导致的过拟合影响,实现用户的精准定位。

    一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法

    公开(公告)号:CN109086437B

    公开(公告)日:2021-06-01

    申请号:CN201810926656.4

    申请日:2018-08-15

    Abstract: 本发明公开一种融合Faster‑RCNN(Faster‑Regions with Convolutional Neural Network,快速区域卷积神经网络)和Wasserstein自编码器的图像检索方法。本发明搭建深度学习框架,采用Faster‑RCNN模型提取图像特征;对Faster‑RCNN模型进行训练,微调网络权重;提取图像的全局特征,构建图像的全局特征图库;构建Wasserstein自编码器,并对Wasserstein自编码器进行训练;采用Wasserstein自编码器对全局特征进行降维,计算欧几里得距离得出第一相似度,并进行第一次排序,完成图像的粗粒度检索;提取图像中候选区域的特征作为局部特征,构建图像的局部特征图库;采用Wasserstein自编码器对局部特征进行降维,计算第二相似度并进行第二次排序,完成图像的细粒度检索。该方法能加快图像的检索速度以及提高图像检索的准确率。

    一种融合隐马尔可夫模型和数据投影切分的轨迹修正方法

    公开(公告)号:CN110363300A

    公开(公告)日:2019-10-22

    申请号:CN201910666946.4

    申请日:2019-07-23

    Applicant: 重庆大学

    Abstract: 本发明公开了一种融合隐马尔可夫模型和数据投影切分的轨迹修正方法,包括获取飞机降落之后的轨迹数据,将所述轨迹数据投影到跑道中心,得到多个观测位置;沿跑道长度方向将跑道进行分段切分,得到多个可能实际位置;计算隐马尔可夫模型的输出观测概率;计算隐马尔可夫模型的状态转移概率;采用维比特算法计算轨迹修正后跑道路径的概率;对轨迹修正后跑道路径的概率进行回溯,将每个时刻实际位置概率最大的可能实际位置作为实际位置,从而得到修正后的飞机轨迹。本发明通过对机场跑道中心直线进行切割,用切割点构造隐马尔可夫模型,并用维比特算法计算最大概率真实轨迹位置,提高了飞机在跑道上滑行的轨迹位置的精确性和真实性。

    一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法

    公开(公告)号:CN108921670A

    公开(公告)日:2018-11-30

    申请号:CN201810724191.4

    申请日:2018-07-04

    Abstract: 本发明公开了一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法,包括从电商平台的数据集中获取用户购买药品的购买记录数据,并对购买记录数据进行整理得到用户-药品评分矩阵;基于购买记录数据中相似用户的购买记录建立用户潜在兴趣模型,并基于用户潜在兴趣模型获取用户潜在兴趣数据;将用户潜在兴趣数据合并到用户-药品评分矩阵;基于购买记录数据中用户购买过的药品所属类别的流行度和用户对该类别的偏爱建立类别相关模型;对合并了用户潜在兴趣数据的用户-药品评分矩阵进行矩阵分解,并将分解得到的用户偏好预测矩阵和类别相关模型进行线性融合生成推荐列表。本发明有效解决了现有技术中评分矩阵稀疏性对推荐效率造成影响的问题。

Patent Agency Ranking