一种图像数据集分类划分方法

    公开(公告)号:CN111881312A

    公开(公告)日:2020-11-03

    申请号:CN202010722578.3

    申请日:2020-07-24

    Abstract: 本发明公开了一种图像数据集分类划分方法,包括:搭建预训练模型,生成一个投影矩阵组R,对图片图像数据进行缩放,并导入到预训练模型中;通过预训练模型对图片图像数据进行特征提取,生成一定维度的特征向量x;对每一个生成的特征向量x,对其进行L2正则化,将特征向量缩放为高维球形空间中的单位向量;对每一个投影矩阵Ri,对矩阵进行计算并得到其结果向量,取结果向量中最大数值所对应的索引作为该特征向量的哈希值hi;将计算出的所有矩阵哈希值hi进行组合,得到一组哈希值并将其作为图像特征量的哈希,将具有相同哈希值的图像划分为一类。通过本方案可以有效的对图像特征进行提取,精确对图像数据集进行划分,减少了哈希碰撞的概率。

    一类纠删码的译码方法
    72.
    发明授权

    公开(公告)号:CN107665152B

    公开(公告)日:2020-10-16

    申请号:CN201710973448.5

    申请日:2017-10-18

    Abstract: 本发明属于计算机信息存储技术领域,具体是一种纠删码的译码方法。目前对基于二进制异或运算的纠删码,解码方法几乎都采用了循环迭代法,即不断循环遍历,这造成了解码的算法时间复杂度高,解码的速度低下;并且在没有解码前,难以对是否完全解码成功进行预判。本发明所述的一种纠删码的译码方法与传统循环迭代译码方法相比,解码的时间复杂度降低、速度提高;且适用于任何基于二进制异或运算的纠删码,包括EVENODD码、X码、STAR码、RDP码、斜率码等,应用范围广。

    一种利用风场数据自动识别高空横槽的方法

    公开(公告)号:CN111239852A

    公开(公告)日:2020-06-05

    申请号:CN202010032949.5

    申请日:2020-01-13

    Abstract: 本发明提供了一种利用风场数据自动识别高空横槽的方法,读取风场格点数据;选择分析点:取某一格点为分析点,其相邻的西南、正南以及东南的格点分别设为第一辅助分析点、第二辅助分析点以及第三辅助分析点;根据确定的分析点的三种情况进行分析,得到节点;设置阈值,遍历所有节点,根据所述阈值判定并标记为槽点;对比相邻槽点的位势高度;依次连接所述保留的槽点,从而完成横槽的自动识别。本发明解决了现有气象业务中的横槽分析依然通过人机交互的方式,由预报人员根据自身经验进行手工操作,存在一系列相关弊端的问题。本发明实现了在高空水平风场中自动分析横槽,为实现自动化分析预报打下坚实基础。

    一种基于贝叶斯统计学习的医学古汉语句子切分方法

    公开(公告)号:CN107491439B

    公开(公告)日:2020-05-19

    申请号:CN201710800571.7

    申请日:2017-09-07

    Abstract: 本发明属于语言处理领域,公开了一种基于贝叶斯统计学习的医学古汉语句子切分方法,在所述的基于贝叶斯统计学习的医学古汉语句子切分方法对句子识别的朴素贝叶斯方法的基础之上,对于特征属性再添加二元组与三元组或者进行一元组、二元组、三元组多样特征属性组合得到多组实验数据结果,最后得出最佳模型;进而实现医学古汉语句子切分任务。本发明与实际处理文本内容相结合,通过本实验方法将现有技术各项特征的F值可提高至少25个百分点,本发明中系统地分析与归纳了医学古汉语文本句子识别规则,实现了可以应用于实际中医医学领域的处理方法,建立了医学古汉语文本的句子识别语料库,进一步让科研成果发挥出更大的作用。

    一种中医细粒度证候名分割的远程监督方法

    公开(公告)号:CN109408831B

    公开(公告)日:2020-02-21

    申请号:CN201811186683.9

    申请日:2018-10-11

    Abstract: 本发明是一种实现中医细粒度证候名分割的远程监督方法,其使用中医证候的命名和翻译惯例来训练基于中医细粒度证候名分割的条件随机场模型,首先利用汉英平行语料库中医证候的汉英字词关系,采用概率对准方法构建带噪声的标记训练数据,该概率对准方法可以启发式地结合正向对准和反向检查来推断出中医证候中的细粒度段,然后使用这些细粒度段训练条件随机场模型。本发明构思合理、简单,用于训练中医药领域中的基于中医细粒度证候名分割的条件随机场模型,几乎不依赖甚至不需要手工标记训练数据。

    一种基于半马尔可夫的联合识别和规范化中医症状名的方法

    公开(公告)号:CN110020428A

    公开(公告)日:2019-07-16

    申请号:CN201910132720.6

    申请日:2019-02-22

    Abstract: 本发明公开了一种基于半马尔可夫的联合识别和规范化中医症状名的方法,该模型通过识别和规范化过程分别采用半马尔可夫条件随机场和最大熵模型建模,采用L-BFGS优化算法完成参数训练,并利用动态规划算法完成序列预测,最终通过对两个过程地互相约束和补充达到全局优化的目的,使其能更准确的识别较好的组合型临床症状名,最后通过实验验证了模型的效果。

    一种从中文临床记录学习高质量词嵌入的方法

    公开(公告)号:CN109376356A

    公开(公告)日:2019-02-22

    申请号:CN201811176401.7

    申请日:2018-10-09

    Abstract: 本发明涉及一种从中文临床记录学习高质量词嵌入的方法,其包括(1)通过skip-gram模型从中文临床记录学习词向量;(2)使用领域外数据;(3)嵌入中医临床记录学习词的通用框架,提出从中医临床记录学习词嵌入的通用框架;(4)对学习到的新嵌入进行评价,提出对学得词嵌入的评价方法。本发明构思合理,在仅仅拥有有限的中文临床记录的情况下,可以结合领域内以及领域外的数据并且通过skip-gram模型从中文临床记录中学得更好的词嵌入。

    一种在线观点挖掘方法及系统

    公开(公告)号:CN109299256A

    公开(公告)日:2019-02-01

    申请号:CN201811071285.2

    申请日:2018-09-14

    CPC classification number: G06F2216/03

    Abstract: 本发明涉及一种在线观点挖掘方法及系统,该方法包括:(1)构建一个定向网络爬虫,以实现自动抓取针对电商的商品属性和商品评论信息数据;(2)对爬取的文本数据采用分词算法进行预处理,以转换成计算机方便处理的格式;(3)对商品细粒度属性和情感进行倾向性分析和观点挖掘;(4)采用启发式规则方法,在大量文本中总结出需要寻找的“属性-观点”这种特定关系的规律,并基于“短评论包含的评价对象应是单一的”基本假设,实现从评论句中获取商品细粒度属性和情感描述信息。该系统包括网络爬虫模块、数据处理模块和观点挖掘模块。本发明能提升用户获取关于商品多粒度的质量信息的速度,能极大提高人们获取商品观点的效率。

    一种通用字符串相似性度量框架的构建方法

    公开(公告)号:CN109284422A

    公开(公告)日:2019-01-29

    申请号:CN201811010804.4

    申请日:2018-08-31

    Abstract: 本发明涉及一种通用字符串相似性度量框架的构建方法,其具体是先设定需要比较的两个字符串群,再将匹配或相似的集合与不匹配集合组成的一组字符串,接着基于匹配或相似的集合和不匹配集合,为每个字符串相似性度量定义一个比较标准的集合,得到后验概率即字符串相似性度量的准确结果后,再基于最大似然估计方法,来估计后验概率;最后得到一个结合附加特征的字符串相似性度量框架。本发明基于Fellegi-Sunter模型,构思合理、简单,将对需要快速和灵活地纳入大量语义特征的字符串相似度测量系统的设计提供指导。

    一种基于弦切法的天气槽脊线提取方法

    公开(公告)号:CN109239809A

    公开(公告)日:2019-01-18

    申请号:CN201810868025.1

    申请日:2018-08-02

    Abstract: 本发明公开了一种基于弦切法的天气槽脊线提取方法,其包括以下步骤:S1、根据气象的格点数据计算等值线;S2、判断每条等值线是否为闭合等值线,若是则进入步骤S3,否则进入步骤S4;S3、获取该闭合等值线上的脊点和槽点并进入步骤S6;S4、获取每条非闭合等值线上的弦切点;S5、从非闭合等值线上的弦切点中选取脊点或槽点;S6、根据槽线连接规则和脊线连接规则分别将槽点和脊点连接为槽线和脊线,完成天气槽脊线的提取。本发明合理采用数据源,根据气象的格点数据计算等值线,并自动从等值线中提取出槽脊线,有效提高槽脊线的提取效率,便于相关人员分析天气形势和天气系统,进行天气预报。

Patent Agency Ranking