一种面向科技大数据的项目查重方法

    公开(公告)号:CN105446954A

    公开(公告)日:2016-03-30

    申请号:CN201510797445.1

    申请日:2015-11-18

    CPC classification number: G06F17/2775 G06F17/2785

    Abstract: 本发明是一种面向科技大数据的项目查重方法,该方法根据历年的科技项目立项信息构建领域本体,然后对新申报的项目信息跟已有的项目信息进行相似度比较,进行中文分词、去停用词等一系列操作后,提取出关键特征词汇,对每个文本的关键特征词分别构建最长公共序列并计算特征词的词序因子,将词序因子引入领域本体的概念相似度计算,可得出每个特征词的相似度值进而进行相似度评价从而得出查重结论,本发明方法在现有的中文文本词序相似度计算方法上结合了领域本体处理即语义相似度和时序因子相结合,相似度计算效果将更佳。

    一种科学数据集的元数据自动更新方法、装置、电子设备及存储介质

    公开(公告)号:CN119396768A

    公开(公告)日:2025-02-07

    申请号:CN202411344053.5

    申请日:2024-09-25

    Abstract: 本发明公开了一种科学数据集的元数据自动更新方法、装置、电子设备及存储介质。方法包括:根据数据生产者提交的信息构建科学数据集画像,根据科学数据集关联的用户数据交互行为记录提取用户行为群像特征,根据科学数据集共享使用记录提取科学数据集共享使用特征;基于用户行为群像特征和共享使用特征生成特征变化指数,基于特征变化指数和其对应的科学数据集画像进行变量差异分析,生成元数据更新需求指数并生成元数据更新触发条件,满足元数据更新触发条件时,对元数据进行自动更新。通过自动化的元数据更新机制,结合科学数据集画像构建、用户行为群像特征提取和共享使用特征分析,提高了数据管理的智能化水平和使用效率。

    科学数据集命名规范检查自动更新模型训练方法和系统

    公开(公告)号:CN119204016A

    公开(公告)日:2024-12-27

    申请号:CN202411326898.1

    申请日:2024-09-23

    Abstract: 本申请涉及数据处理技术领域,更具体地,涉及科学数据集命名规范检查自动更新模型训练方法和系统,所述方法包括:根据命名需求制定命名规则,建立命名规范检查任务树;提取科学数据集每个命名实例附带的审核意见、对应的配套信息载体和命名特征,并基于每个命名实例的配套信息载体、命名特征生成训练样本,对审核意见的规范性进行分类,得到分类后的训练样本;基于命名规范检查任务树对分类后的训练样本进行分析,得到科学数据集命名规范检查模型。所述方法能够自动化地对科学数据集的命名进行检查更新与优化,从而减少了人为操作带来的错误几率,提高了科学数据集命名的一致性和准确性,确保科学数据集具有良好的可读性和易用性。

    一种数据中心的安全监测及管理方法及系统

    公开(公告)号:CN118468343A

    公开(公告)日:2024-08-09

    申请号:CN202410911584.1

    申请日:2024-07-09

    Abstract: 本发明提供一种数据中心的安全监测及管理方法及系统,涉及大数据分析技术领域。该方法包括获取数据上传请求信息,进行基于安全验证的数据上传分析,并根据分析结果采集待存储数据的处理;对待存储数据进行基于安全监测的存储处理,完成存储数据库的更新;获取数据提取请求信息,进行基于访问大数据的访问安全分析,并根据分析结果进行访问安全处理。该方法通过对数据中心进行合理的数据分类存储和对外数据通信的安全监测控制,有效的保证了数据中心的数据存储的合理性和高效性,也进一步提升了数据中心进行数据交互的安全性。

    平台生命周期的评估方法、装置、计算机设备和存储介质

    公开(公告)号:CN109086984B

    公开(公告)日:2021-02-19

    申请号:CN201810801245.2

    申请日:2018-07-20

    Abstract: 本发明涉及平台生命周期的评估方法、装置、计算机设备和存储介质,属于数据处理技术领域。所述方法包括:获取平台的第一评估数据;所述第一评估数据包括多个年份和多个领域的数据;获取所述第一评估数据的变化量;所述变化量根据所述多个年份和多个领域的数据确定;根据所述变化量对所述第一评估数据进行处理,得到第二评估数据;获取所述第二评估数据的变化特征值,根据所述变化特征值评估所述平台的生命周期。上述技术方案,解决了对平台生命周期的评估不够准确的技术问题。能准确地对平台的生命周期进行评估。

    一种基于数据感知的动态科技资源语义分析方法

    公开(公告)号:CN110059316A

    公开(公告)日:2019-07-26

    申请号:CN201910304667.3

    申请日:2019-04-16

    Abstract: 本发明涉及一种基于数据感知的动态科技资源语义分析方法,包括以下步骤:面向数据存储层,构造基于资源组合框架的感知节点;面向用户层,根据用户信息和用户的输入,基于感知节点部署感知采集网络;面向用户资源交互层,通过感知采集网络读取用户行为数据,根据用户行为数据部署感知决策计算网络;面向资源层,根据感知决策计算网络构造资源语义生成树。本发明通过部署面向数据存储层、用户层、用户资源交互层、资源层的分级感知网络,以形成自学习、自主优化的语义分析方法,可以实现资源与资源间、用户与资源间、用户与用户间、存储节点间的实时感知与反馈系统优化,有效解决现有科技资源管理平台的缺陷。

    一种科技资源供需对接方法

    公开(公告)号:CN105825415A

    公开(公告)日:2016-08-03

    申请号:CN201610146144.7

    申请日:2016-03-15

    Abstract: 本发明提供一种科技资源供需对接方法,该方法对需方的需求进行重定义,需方选择是否采用重定义后的需求;分别将需方采用后需求和供方提供资源进行信息抓取,保存为相应的文本文件并生成文本词向量;将需求的文本词向量与供方资源的文本词向量进行相似度比较,为需方推荐相似度较高的供方资源,从而实现供需对接。

Patent Agency Ranking