一种模型推理时的模型自适应更新方法及装置

    公开(公告)号:CN119360125A

    公开(公告)日:2025-01-24

    申请号:CN202411768569.2

    申请日:2024-12-04

    Abstract: 本发明提出一种模型推理时的模型自适应更新方法和装置,包括:数据库存储图像分类模型推理时得到的数据样本,数据样本包括:数据特征及其对应的类别概率;通过将当前数据样本的数据特征和其余数据样本的数据特征间的余弦距离检索得到当前数据样本的邻居,通过对所有邻居的各类别概率进行平均,得到各类别的平均概率,取平均概率最高的类别作为当前数据样本的伪标签;根据数据样本及其对应的伪标签,构建损失函数,以对图像分类模型进行更新训练,使用更新训练后的图像分类模型对待分类图像进行图像分类,得到待分类图像的图像分类结果。与现有模型推理时自适应技术相比,模型调整更精准有效,极大提高了模型在不同场景的推理准确率。

    一种支持多种硬件的深度学习模型编译方法及编译器

    公开(公告)号:CN119045823A

    公开(公告)日:2024-11-29

    申请号:CN202410642450.4

    申请日:2024-05-23

    Abstract: 本发明提供了一种支持多硬件的深度学习模型编译方法和编译器,包括:获取需要编译的深度学习模型的计算图与目标设备信息;将目标设备信息基于预设的硬件模型转换为硬件属性中间形式,基于深度学习模型的基本操作获取线性操作中间形式,基于深度学习模型的张量,获取张量形状中间形式;基于张量与张量形状中间形式,获取内存中间形式,并采用异构内存传输折叠方法优化内存拷贝行为;基于获取的线性操作中间形式获取循环中间形式,采用融合、堆叠、向量化的方法,优化循环中间形式中的循环,并转化为向量中间形式,基于预设的计算模型获取异构设备数据操作规则中间形式;基于前面获取的多个中间形式,获取可在目标设备进行推理的可执行代码。

    一种基于事件聚合的网络舆情专报自动生成方法与系统

    公开(公告)号:CN118364163A

    公开(公告)日:2024-07-19

    申请号:CN202310072620.5

    申请日:2023-01-16

    Abstract: 本发明提出一种基于事件聚合的网络舆情专报自动生成方法和系统,包括:获取待舆情监测的全量媒体新闻,分类该全量媒体新闻,得到该全量新闻中属于目标类别的目标文本;提取该目标文本的关键词,将该关键词与该目标文本中每篇文章组成特征文本,经文本向量化处理,得到每篇文章的特征向量,聚类该特征向量,将该目标文本中属于同一事件的文章聚类成事件集合,将每个事件集合内所有文章的特征词合并,作为每个事件的标签;结合用户关注的关键词以及各事件的媒体报道量,量化所有事件的标签,得到每个该事件集合的重要度,展示重要度大于预设值的事件及其标签。

    一种无中心的分布式存储方法及系统

    公开(公告)号:CN117440003A

    公开(公告)日:2024-01-23

    申请号:CN202310644427.4

    申请日:2023-06-01

    Abstract: 本发明提出一种无中心的分布式存储方法和系统,包括:获取包括n个存储节点的分布式存储系统,根据一致性哈希所有存储节点和键值K映射并以数轴的形式排列到哈希空间σ;n个节点将数轴划分为n+1个区间,根据数轴上n个节点之间的距离可以将数轴划分为n个节点对应的近邻空间;键值K对应的数据存储至距键值K哈希距离最短的存储节点。本发明的方法对于无中心分布式系统负载不均和查询性能低下的缺陷做出一定适应场景的优化,其意义不仅在于促进关于分布式存储的研究,为研究者们解决上述问题提供了新的思路,还有助于大数据计算、大数据分析等与分布式存储密切相关的实际场景应用的发展。

    一种小样本命名实体识别模型训练方法及识别方法

    公开(公告)号:CN115759103A

    公开(公告)日:2023-03-07

    申请号:CN202211527749.2

    申请日:2022-11-30

    Abstract: 本发明提供一种小样本命名实体识别模型训练方法,包括:S1、获取训练集、训练集类型描述集合以及支持集、支持集类型描述集合;S2、分别在训练集和支持集上挖掘每个样本中的线索词并进行线索词标注以分别获得包含命名实体标签和线索词标签的训练集和支持集;S3、采用经步骤S2处理后的训练集和训练集类型描述集合对基础命名实体识别模型进行多轮迭代训练至收敛;S4、采用经步骤S2处理后的支持集和支持集类型描述集合对经步骤S3训练后的基础命名实体识别模型进行迁移训练直至收敛,获得由编码器和最近邻分类器组成的小样本命名实体识别模型。

    一种网站识别方法及网站识别系统

    公开(公告)号:CN109617864A

    公开(公告)日:2019-04-12

    申请号:CN201811427628.4

    申请日:2018-11-27

    Abstract: 本发明涉及一种网站识别方法及网站识别系统,其方法包括以下步骤:分别获取与多个第一网站一一对应的多个第一特征矩阵;基于原网络分类模型对所有第一特征矩阵进行深度学习训练,得到深度学习网站分类模型;获取第二特征矩阵;基于深度学习网站分类模型对第二特征矩阵进行分类概率计算,得到分类概率向量;根据分类概率向量中的分类概率值识别第二网站为仿冒网站或者正常网站。本发明提供的网站识别方法及系统,减少了人工干预,降低了正常网站被误判为仿冒网站的概率,提高了仿冒网站识别的准确率。

    一种肝脏影像分割方法及系统

    公开(公告)号:CN109584260A

    公开(公告)日:2019-04-05

    申请号:CN201811427619.5

    申请日:2018-11-27

    Abstract: 本发明涉及一种肝脏影像分割方法及系统,其方法包括S1,获取原始图像,并进行脊波变换后得到粗尺度图像;S2,将粗尺度图像经过模糊聚类算法处理后得到初始分割影像;S3,对初始分割影像进行影像重构,得到重构图像,并计算出重构图像的聚类中心;S4,调节每个细尺度像素点到各个聚类中心的距离和细尺度像素点的隶属度;S5,根据细尺度像素点计算得出像素相关性;S6,根据像素相关性、隶属度和距离计算出目标函数,并建立约束条件,且将约束条件代入目标函数以得到改善目标函数;S7,判断改善目标函数是否满足收敛条件,若满足,则完成重构图像的影像分割。该方法具有抗噪声能力强,复杂度低等特点,能准确输出肝脏影像分割结果。

    可动态适应的LSM树合并方法及系统

    公开(公告)号:CN105159915B

    公开(公告)日:2018-07-10

    申请号:CN201510419480.X

    申请日:2015-07-16

    Abstract: 本发明适用于文件处理技术领域,提供了一种可动态适应的LSM树合并方法,所述方法包括:将键值区间划分为若干节点,将所述节点组织为树形结构,每个所述节点对应一键值区间,每个所述键值区间包含对应该键值区间范围的文件;根据当前数据的分布动态调整树的形状;当有新写入的文件时,遍历树寻找最适节点放入;对文件进行处理时,对节点内部进行Minor Compact处理,并且只通过叶节点执行Major Compact。本发明还相应的提供一种实现上述方法的可动态适应的LSM树合并系统。借此,本发明可以实现动态适应数据的分布,提高数据合并效率。

    一种查询纠错方法和系统

    公开(公告)号:CN103198149B

    公开(公告)日:2017-02-08

    申请号:CN201310142075.9

    申请日:2013-04-23

    Abstract: 本发明提供一种查询纠错方法和系统。所述方法包括:将查询语句转换为字符序列,判断字符序列的长度是否大于预定阈值δ;对长度大于δ的字符序列同时进行正向和反向查询纠错处理,直到重合处理的字符个数达到阈值M,得到正向和反向的候选语句项集合。所述方法还包括将正向的候选语句项集合中后M个字符与反向候选语句项集合中前M个字符相同的候选语句项进行拼接,拼接后的候选语句项构成纠错候选项集合。所述方法支持中、英文混杂的查询语句,并且可对长查询采用正反向并行的查询纠错处理,这种并行的处理方式在保证正确率的同时节省了查询纠错的处理时间。

    可动态适应的LSM树合并方法及系统

    公开(公告)号:CN105159915A

    公开(公告)日:2015-12-16

    申请号:CN201510419480.X

    申请日:2015-07-16

    CPC classification number: G06F17/30327 G06F17/30483

    Abstract: 本发明适用于文件处理技术领域,提供了一种可动态适应的LSM树合并方法,所述方法包括:将键值区间划分为若干节点,将所述节点组织为树形结构,每个所述节点对应一键值区间,每个所述键值区间包含对应该键值区间范围的文件;根据当前数据的分布动态调整树的形状;当有新写入的文件时,遍历树寻找最适节点放入;对文件进行处理时,对节点内部进行Minor Compact处理,并且只通过叶节点执行Major Compact。本发明还相应的提供一种实现上述方法的可动态适应的LSM树合并系统。借此,本发明可以实现动态适应数据的分布,提高数据合并效率。

Patent Agency Ranking