一种基于自适应知识蒸馏的数据源自动扩充方法

    公开(公告)号:CN115858957A

    公开(公告)日:2023-03-28

    申请号:CN202211564418.6

    申请日:2022-12-07

    Abstract: 本发明提出了一种基于自适应知识蒸馏的数据源自动扩充方法,运用通用爬虫技术,抓取已知类别的网页文本信息;对网页文本信息进行预处理,将其转化为对应的词列表,将词列表及其所属类别作为训练与测试数据,构建训练与测试数据集;构建Attention‑BiLSTM作为数据源分类模型,通过自适应知识蒸馏算法实现模型压缩,并改善模型的收敛速度和识别能力;对采集的未知类别数据源下的文本信息进行预处理,输入构建的模型预测相应类别,根据分类结果,记录并存储各数据源的url及其对应的标签,实现数据源的自动积累与扩充。本发明能够配合通用爬虫技术自动扩充各类数据源。

    一种基于时序卷积的知识表示方法及系统

    公开(公告)号:CN116542326A

    公开(公告)日:2023-08-04

    申请号:CN202310035450.3

    申请日:2023-01-10

    Abstract: 本发明提出一种基于时序卷积的知识表示方法,构建实体、关系和时间的语义向量对照表,并在语义空间中随机初始化对应的语义向量;根据时间信息及其对应的时间语义向量,动态构造时序卷积核;利用时序卷积核与实体和关系对应的语义向量进行卷积,得到时序知识图谱中的动态特征信息;利用随机初始化的卷积核与实体和关系对应的语义向量进行卷积,得到时序知识图谱中的静态特征信息;通过多层神经网络融合提取的动态特征信息和静态特征信息,得到综合的特征信息;基于提取的综合特征信息,计算该特征信息下全部实体的概率值,取概率最高的实体作为预测结果,从而完成知识表示学习的预测任务。本发明可用于下游知识推理或融合,且提高了模拟预测精度。

    一种基于短语增强的开放域关系联合抽取方法及系统

    公开(公告)号:CN115358227A

    公开(公告)日:2022-11-18

    申请号:CN202210385209.9

    申请日:2022-04-13

    Abstract: 本发明提出一种基于短语增强的开放域关系联合抽取方法及系统,通过BERT预训练语言模型对句子中的字符进行编码,提取句子特征向量表示;根据首实体短语标注模型,解码句子特征向量表示,抽取所有可能构成关系三元组的首实体短语;构建除首实体短语外的关系短语词汇增强词典,并将外部关系短语词汇表所包含的短语信息融合到句子特征向量表示中;根据关系短语和尾实体序列标注模型,抽取出首实体短语对应的所有关系短语和尾实体短语,构建该首实体的候选开放域关系三元组集合;根据开放域关系三元组的置信度,从候选开放域关系三元组集合中,选择置信度高于设定阈值的开放域关系三元组,作为该首实体的开放域关系三元组。本发明能够更好地整合关系短语和实体对短语之间的信息。

    一种基于张量分解的动态个性化推荐方法及系统

    公开(公告)号:CN115357794A

    公开(公告)日:2022-11-18

    申请号:CN202211019358.X

    申请日:2022-08-24

    Abstract: 本发明提出了一种基于张量分解的动态个性化推荐方法,对反映用户兴趣特征的用户‑物品‑时间关联网络数据进行统计,得到用户、物品和时间戳构成的集合,并对集合中的元素进行ID编号;将用户集合、物品集合和时间戳集合中的元素随机映射至语义向量空间中,建立用户、物品和时间戳到兴趣语义空间的初步映射关系;构建语义空间下用户、物品和时间之间的语义关联关系,使用户、物品和时间能够正确映射到语义空间中;根据用户、物品和时间到语义空间的语义关联关系,训练最优动态个性化推荐模型,预测用户的兴趣点,完成个性化推荐任务。本发明能有效学习用户随时间动态变化的兴趣,提升了个性化推荐的效果。

    图数据存储方法、装置、设备及存储介质

    公开(公告)号:CN116910312A

    公开(公告)日:2023-10-20

    申请号:CN202310822727.7

    申请日:2023-07-06

    Abstract: 本公开提供了一种图数据存储方法、装置、设备及存储介质,可以应用于数据库技术领域。该方法应用于目标存储设备,包括:响应于接收到目标图存储请求,基于目标图,得到多个节点索引项和多个边索引项,其中,目标图包括多个节点和多个边,节点索引项包括直接存储组和间接存储列表;对于多个边中的每个边,基于目标图中的多个节点各自与边之间的连接关系,确定与边相连的目标节点;将与边对应的边索引项插入至与目标节点对应的目标节点索引项的直接存储组或间接存储列表中。

Patent Agency Ranking