云存储系统中一种基于气候季节的细粒度能耗感知框架

    公开(公告)号:CN115357187A

    公开(公告)日:2022-11-18

    申请号:CN202210950209.9

    申请日:2022-08-15

    Abstract: 本发明涉及存储系统领域中的绿色存储技术以及自然语言处理领域中的数据语义挖掘技术,针对存储系统中数据语义的挖掘,采用多特征融合方法,提升了现有基于单一特征在数据布局策略上的不足,包括以下步骤:(一)、设定实验所需200个访问关键词;(二)、将中国34个省级行政区,按标准划分为四季分明区、夏长冬短区、冬长夏短区和其他区;(三)、获取每个气候区中200个关键词3年每日的访问记录;(四)、利用K‑means聚类,确定关键词在不同气候区的季节属性;(五)、构建存储系统能耗和成本模型,得到不同粒度框架下的能耗和成本。本发明融合“季节+地域”特征,充分提取关键词的季节属性,能够更为有效地降低存储能耗和成本。

    模板图像匹配矫正方法
    13.
    发明公开

    公开(公告)号:CN112785529A

    公开(公告)日:2021-05-11

    申请号:CN202110157624.4

    申请日:2021-02-05

    Abstract: 本申请公开了一种模板图像匹配矫正方法,包括:矫正模板图像制作;特征点检测与特征点描述;特征点匹配;单应矩阵估计;文档图像矫正。所述矫正模板图像制作,包括:选取一张领域内的透视倾斜文档图像,通过交互式选取其四个顶点,通过透视变换将其矫正得到文档图像的正向平行视图图像。本申请实施例提供的模板图像匹配矫正方法,使用简单便捷、矫正速度快、矫正效果好、抗干扰性强且能够有效避免当文档图像倾斜角较大时引起的矫正文档图像侧立或倒立的情况,可以有效胜任领域性的文档图像矫正任务。

    中文文档抽取式摘要方法
    14.
    发明公开

    公开(公告)号:CN112417854A

    公开(公告)日:2021-02-26

    申请号:CN202011470330.9

    申请日:2020-12-15

    Abstract: 本申请公开了一种中文文档抽取式摘要方法,包括:文本向量化;识别基本篇章单元;抽取摘要句,所述文本向量化,包括:对输入文本进行分句、分词、标识符插入操作,使用中文Bert预处理模型,对文本进行向量化。本申请实施例提供的中文文档抽取式摘要方法,利用Bert模型进行文本向量化,更好地捕捉长文本上下文的语义,提升信息抽取的准确性;在识别中文长文本的基本篇章单元的基础上,以基本篇章单元为抽取对象,降低摘要抽取的冗余度;最后利用Transformer神经网络抽取模型,实现基本篇章单元的抽取,提升了摘要句抽取的准确率。

    一种体育新闻自动写作模板库构建方法

    公开(公告)号:CN110516216A

    公开(公告)日:2019-11-29

    申请号:CN201910404549.X

    申请日:2019-05-15

    Abstract: 本发明涉及一种体育新闻自动写作模板库构建方法包括写作模板计算、触发条件构建,首先根据已分好的类别对模板数据进行相似度计算找到相同的模板,其次是利用CRF对模板进行触发条件识别,最终形成触发条件-模板;写作模板计算包括基于余弦相似度的写作模板计算、基于Word2Vec的写作模板计算。本发明提供的体育新闻自动写作模板库构建方法,取得了极佳的正确率、召回率和F值,能够通过计算向量空间上的相似度来表示文本语义上的相似度来实现相关词扩展,为体育新闻自动写作提供强有力的支持,从而为实现准确高效地体育新闻自动写作提供极佳的条件,可以很好地满足实际应用的需要。

Patent Agency Ranking