一种基于图分析的大数据挖掘方法

    公开(公告)号:CN112287020A

    公开(公告)日:2021-01-29

    申请号:CN202011609872.X

    申请日:2020-12-31

    Abstract: 本发明公开了一种基于图分析的大数据挖掘方法,所述方法首先对用户的多源数据统一建模与表征,对上述多源数据进行融合和分类;其中,所述用户的多源数据融合和分类,是通过对用户的数据进行聚类,以执行对不同的用户类型和行为分类;对用户行为的多源数据进行融合和分类之后,建立数据源集合与决策需求集合之间的关联关系,通过将数据挖掘检测分为,数据级和决策级两个层级,实现了用户行为的融合检测。

    一种基于区块链的可信数据空间管理系统及方法

    公开(公告)号:CN119402191B

    公开(公告)日:2025-05-13

    申请号:CN202411658625.7

    申请日:2024-11-19

    Abstract: 本发明涉及数据安全技术领域,重新定义了一种基于区块链的可信数据空间的管理系统及方法,包括:根据区块链智能分析得出初始信用结果在可信数据空间创建初始数据信用模块,再对初始数据信用模块内的需加密数据进行安全分级,根据安全分级对需加密数据执行不同的加密策略进行加密;存储模块,用于根据边缘计算节点的计算能力将加密后的需上链数据存储至区块链;访问模块,用于对用户访问、应用需访问数据及策略的权限进行管理并释放相应访问、应用权限;匹配模块,用于对用户释放匹配加密数据的访问权限。本发明的可信数据空间的架构基于可信计算3.0建立,且初始数据信用模块是基于区块链技术的分布式,保证了加密数据的安全性与可信度。

    数据处理方法及装置
    24.
    发明公开

    公开(公告)号:CN116467427A

    公开(公告)日:2023-07-21

    申请号:CN202310323580.7

    申请日:2023-03-29

    Abstract: 本申请提供一种数据处理方法及装置,所述方法包括:得到原始医学知识数据集对应的各类簇;对所述各类簇进行离群检测处理,如果类簇中数据点的总数小于设定阈值或类簇中不包含标签为医学教材的医学数据,则将类簇中的所有医学数据放入离群点候选集中;根据离群点候选集中数据点的标签对所述离群点候选集进行剪枝处理;对剪枝后的离群点候选集中的数据点进行离群处理。本发明实施例提供的数据处理方法及装置,通过专门适用于该应用场景的改进聚类和离群算法,对原始医学知识数据中的离群数据进行筛选处理,还通过专门适用于该应用场景数据特点的剪枝算法,既保证离群处理的计算效率,也最大限度地保留了可用的医学知识数据。

    一种基于联邦学习的公文智能推荐方法

    公开(公告)号:CN115238065B

    公开(公告)日:2022-12-20

    申请号:CN202211154292.5

    申请日:2022-09-22

    Abstract: 本申请提供一种基于联邦学习的公文智能推荐方法,所述方法包括:确定目标公文文本的公文类型以及各公文子数据库对应的公文类型;确定各公文子数据库对应的联邦学习架构;将所述联邦学习架构由联邦学习聚合服务器广播给所述各公文子数据库;进行联邦学习训练后输出所述目标公文文本对应的公文推荐结果。本发明提供的公文智能推荐方法,采用联邦学习的架构训练得到公文推荐模型,克服了各公文子数据库数据不互通导致的训练语料缺失的问题;同时基于各公文子数据库语料数据的特点,使得公文推荐模型对公文文本共通的语法结构特征和各类公文文本各自的特定语法结构特征均兼顾了学习,进而使得公文推荐模型的推荐结果准确率较高。

    数据处理方法及装置
    26.
    发明公开

    公开(公告)号:CN115292303A

    公开(公告)日:2022-11-04

    申请号:CN202211221664.1

    申请日:2022-10-08

    Abstract: 本发明公开了一种数据处理方法及装置,该方法包括:对数据集中的数据进行聚类,得到各类簇;对各类簇进行离群检测处理,所述离群检测处理包括:如果所述类簇中数据点的总数小于设定阈值,则将所述类簇中的所有数据点放入离群点候选集中;否则,依次计算所述类簇中各数据点到类簇中心的距离,并将所述距离大于等于半径的数据点放入离群点候选集中;对所述离群点候选集进行剪枝处理,得到剪枝后的离群点候选集;对剪枝后的离群点候选集中的数据点进行离群处理,确定数据点是否为离群点。利用本发明方案,可以有效提升大数据的数据质量。

    一种文本搜索方法及装置
    28.
    发明公开

    公开(公告)号:CN114996439A

    公开(公告)日:2022-09-02

    申请号:CN202210913444.9

    申请日:2022-08-01

    Abstract: 本发明涉及一种文本搜索方法及装置,属于数据检索技术领域,通过分词处理得到较为全面的分词文本集;根据预设语料库的标准向量,将待检索文本的分词文本集进行向量转换和编码,得到分词文本集的向量;获取与最高余弦相似度向量对应的待检测文本地址,从而根据待检测文本的地址,获取目标文本。其中,无需限定连续重复字符,无论词语置换或者字段调整,在全面分词后,均可以得到较为全面的分词,余弦相似度根据向量坐标计算,在获取到全面分词后,在进行向量转换和编码时,以固定的预设语料库的标准向量为基准,转换编码得到的向量更加准确,在向量确定后,对应的余弦相似度为唯一,计算过程简单、方便且准确,提升了相似性计算的准确性。

    一种图片搜索系统
    29.
    发明授权

    公开(公告)号:CN112364199B

    公开(公告)日:2021-04-13

    申请号:CN202110039182.3

    申请日:2021-01-13

    Inventor: 黄海峰

    Abstract: 本发明公开了一种图片搜索系统,所述搜索系统,通过在搜索时,设定预搜索的人员照片轮廓信息,所述待搜索照片信息中已经包括人员的位置信息和特征信息,所述待搜索照片信息是一个轮廓信息图片;匹配过程中采用轮廓匹配,能够仅仅借助于轮廓信息即可执行比对,提高了信息的处理速度,同时位置信息的人员轮廓中包括特征信息,对于个人的智能存储设备而言,能够快速地获取到对应的图片信息,从而将对应的图片信息推送到智能终端的设备端面。

    一种基于微服务架构的服务系统

    公开(公告)号:CN112363704A

    公开(公告)日:2021-02-12

    申请号:CN202110035181.1

    申请日:2021-01-12

    Abstract: 本发明公开了一种基于微服务架构的服务系统,设置前后端分离,支持前端的独立开发和测试;同时在后端系统中设置详细的测试用例,通过构造虚拟测试对象以简化测试环境并保证API的可用性,降低集成风险,前后端之间通过HTTP请求进行交互,前端获取到数据后,进行页面的组装和渲染,最终返回给浏览器,实现交互阶段的前后端处理。

Patent Agency Ranking