大规模数据的作者消歧方法、装置及可读存储介质

    公开(公告)号:CN117610541A

    公开(公告)日:2024-02-27

    申请号:CN202410067264.2

    申请日:2024-01-17

    Abstract: 本申请涉及一种大规模数据的作者消歧方法、装置及可读存储介质,所述方法包括:基于所述大规模数据和预先定义的谓词,生成对应的谓词实例数据;其中,所述大规模数据包括结构化存储的文献信息和对应的作者信息;所述谓词实例数据包括文献作者对;将所述谓词实例数据切分为多个初始数据块;基于预先确定的一阶逻辑规则,对所述多个初始数据块中具有相同作者的文献作者对进行合并,生成最终数据块;基于所述最终数据块中的文献作者对,生成所述大规模数据对应的作者标识信息,解决了相关技术中存在的对大规模学术文献数据的作者消歧效率较低的问题。

    视频合并方法、装置、计算机设备以及存储介质

    公开(公告)号:CN117544821A

    公开(公告)日:2024-02-09

    申请号:CN202311462639.7

    申请日:2023-11-03

    Abstract: 本申请涉及一种视频合并方法、装置、计算机设备以及存储介质。所述方法包括:采集候选视频,并确定候选视频的视频名称;根据候选视频的视频名称将候选视频存入存储系统的视频文件夹中;确定候选视频的视频元数据,并根据视频元数据对视频文件夹中的候选视频进行更新,确定视频文件夹对应的目标视频;根据关键词从视频文件夹中确定目标文件夹,并从目标文件夹对应的目标视频中确定期望视频;根据预设的目标视频尺寸和目标视频分辨率确定期望视频的排列方式,基于排列方式对期望视频进行合并,确定组合视频,并对组合视频进行可视化展示。提高了组合视频播放的流畅度,并且提高了组合视频的视频播放质量。

    面向多模态文献数据的分布式存储方法、装置和设备

    公开(公告)号:CN117076495A

    公开(公告)日:2023-11-17

    申请号:CN202311336096.4

    申请日:2023-10-16

    Abstract: 本申请涉及数据处理领域,特别是涉及一种面向多模态文献数据的分布式存储方法、装置和设备。所述方法包括:采集文献全文数据,并存储至分布式文件系统中;提取所述文献全文数据的文献元数据,并存储至结构化数据库中;提取所述文献全文数据中的图像数据,及提取所述图像数据的图像元数据,并将所述图像数据存储至分布式文件系统,将所述图像元数据存储至结构化数据库中;基于所述文献元数据及图像元数据,构建知识图谱,并存储至分布式图数据库中;基于所述分布式文件系统、所述结构化数据库及所述分布式图数据库,构建得到分布式存储系统。本发明能够整合文献全文数据,有利于文献全文数据的利用和管理,同时方便各模态文献数据的检索查询。

    离线多模态文献数据的更新方法、装置、设备和介质

    公开(公告)号:CN117076474A

    公开(公告)日:2023-11-17

    申请号:CN202311336095.X

    申请日:2023-10-16

    Abstract: 本申请涉及数据处理领域,特别是涉及一种离线多模态文献数据的更新方法、装置、设备和介质。所述方法包括:采集新文献全文数据,并提取所述新文献全文数据的第二文献元数据;对所述结构化数据库进行检索以判断所述结构化数据库中是否存在该第二文献元数据、判断所述分布式文件系统中是否存在该新文献全文数据及判断所述第二文献元数据是否和所述第一文献元数据存在不同,并生成文献更新表;基于所述文献更新表,将所述新文献全文数据以及所述新文献全文数据的第二图像数据更新至所述分布式文件系统,和/或将所述第二文献元数据以及所述第二图像数据的第二图像元数据更新至所述结构化数据库。本发明实现分布式存储系统的多模态文献数据的更新。

Patent Agency Ranking