知识表示学习方法和装置
    31.
    发明授权

    公开(公告)号:CN113204652B

    公开(公告)日:2021-09-07

    申请号:CN202110757753.7

    申请日:2021-07-05

    Abstract: 本申请提供了一种知识表示学习方法和装置,其中,该方法包括:获取负样本候选实体集合;通过对抗生成网络,以基于语义匹配的模型作为生成器,对所述负样本候选实体集合进行抽样;以基于翻译距离的模型作为判别器,对抽样结果进行判别,得到被选定的负样本三元组;将被选定的负样本三元组对应的第一个和最后一个实体的描述和关系转化为文本序列,并利用BERT的下一句预选任务将文本序列转化为二元分类问题,以实现知识表示学习。通过上述方案解决了现有的知识表示学习过程中生成的负样本质量较差,无法得到丰富的外部语义的技术问题,达到了提升负样本的质量,且在知识图生成的过程中使得文本数据得到充分利用的技术效果。

    面向知识产权的科技资源画像构建方法、装置和存储介质

    公开(公告)号:CN113254601A

    公开(公告)日:2021-08-13

    申请号:CN202110763158.4

    申请日:2021-07-06

    Abstract: 本发明提供一种面向知识产权的科技资源画像构建方法、装置和存储介质,所述方法包括:获取结构化的知识产权科技资源数据;对获得的知识产权科技资源数据进行数据预处理,得到专利文本特征数据;基于专利文本特征数据得到分词向量和字符向量,将其作为原始输入文本输入双向长短时循环网络模型,并将其输出向量进一步输入至与分词词性注意力模型相结合的字符级别的注意力模型,以得到知识产权科技资源数据的实体识别结果;利用结构化的知识产权科技资源数据和实体识别结果构建实体间关系;基于得到的实体识别结果和实体间的关系,利用数据统计进行知识产权科技资源数据知识图谱的构建,并基于构建的知识图谱得到面向知识产权的科技资源画像。

    自然灾害舆情分析方法和装置

    公开(公告)号:CN112559844A

    公开(公告)日:2021-03-26

    申请号:CN202011494854.1

    申请日:2020-12-17

    Abstract: 本发明提供一种自然灾害舆情分析方法和装置,所述方法包括:创建爬虫实时收集自然灾害相关的社交消息数据;对收集到的数据进行社交媒体消息的属性信息与自然灾害描述信息的抽取,基于抽取结果得到各社交消息对应的自然灾害实体数据;设置自然灾害信息表和社交消息缓存表分别记录各自然灾害和各社交消息,根据所述自然灾害实体数据按照各自然灾害事件对社交消息进行聚类,以生成聚类结果,并基于聚类结果进行自然灾害舆情分析。本发明实施例的自然灾害舆情分析方法和装置,能够大大提高多源社交媒体的自然灾害舆情分析效率。

    基于自适应增广的图对比学习方法、装置、设备及存储介质

    公开(公告)号:CN119862936A

    公开(公告)日:2025-04-22

    申请号:CN202411842500.X

    申请日:2024-12-13

    Abstract: 本申请提供基于自适应增广的图对比学习方法、装置、设备及存储介质,方法包括:采用各个原始图数据对图对比学习模型进行预训练,使得其中的连续视图增广器基于多样性约束和一致性约束进行自监督训练,以在正交连续空间中对拓扑结构和节点特征信息进行自适应增广;共享信息编码器基于充分性约束进行自监督训练,以分别提取原始图数据和该增广视图数据的嵌入向量,并以神经网络梯度反向传播的方式对嵌入向量对应的增广视图数据进行调整。本申请能够实现对图数据的拓扑结构和节点特征信息的自适应增广,能够提高增广视图的应用质量,能够提高图对比学习模型的泛化能力以及可靠性并能够降低图对比学习模型预训练过程的实验开销。

    用于流处理系统的算子并发度调优方法及装置

    公开(公告)号:CN116225696B

    公开(公告)日:2024-06-07

    申请号:CN202310068747.X

    申请日:2023-02-06

    Abstract: 本申请提供一种用于流处理系统的算子并发度调优方法及装置,所述方法包括:对处于背压状态的流处理任务进行超量扩容调优处理,以使各个所述流处理任务当前均处于待缩容状态并作为目标流处理任务;根据历史调优信息对所述流处理系统中的抽象算子进行训练以生成GP模型,根据所述GP模型中的历史估计负载和所述目标流处理任务的当前工作负载计算得到工作负载适应性得分和自设计WOP采集函数;根据所述GP模型和所述自设计WOP采集函数确定所述抽象算子的最优并发度。本申请能够不依赖调优内置规则,充分利用过往调优经验,同时通过超量分配计算资源以解除数据堆积再缩容的策略有效地提升了资源重部署的效率,从而能够在生产环境中真正地落地实现。

    一种基于图卷积网络和信息融合的实体对齐方法及装置

    公开(公告)号:CN116561346B

    公开(公告)日:2023-10-31

    申请号:CN202310819919.2

    申请日:2023-07-06

    Abstract: 本发明提供一种基于图卷积网络和信息融合的实体对齐方法及装置,所述方法的步骤包括:获取文献基础数据,文献基础数据包括文献中的实体之间的关系、实体对应的属性和实体在文献中的描述语句;基于文献中的实体之间的关系构建第一输入矩阵,将第一输入矩阵输入到预设的第一模型中,第一模型输出第一嵌入矩阵;基于实体对应的属性构建第二输入矩阵,将第二输入矩阵输入到预设的第二模型中,第二模型输出第二嵌入矩阵;将实体在文献中的描述语句输入到第三模型中,第三模型输出第三嵌入矩阵;基于第一嵌入矩阵、第二嵌入矩阵和第三嵌入矩阵构建联合矩阵;将联合矩阵中的每一行构建为对应一个实体的实体向量,基于实体向量之间的距离进行实体对齐。

    公共安全事件预测模型的强化联邦学习方法及装置

    公开(公告)号:CN116957067A

    公开(公告)日:2023-10-27

    申请号:CN202310777807.5

    申请日:2023-06-28

    Abstract: 本申请提供一种公共安全事件预测模型的强化联邦学习方法及装置,方法包括:针对各个节点各自本地的公共安全事件预测子模型的特征向量进行马尔科夫决策以得到当前的目标聚类参数,并基于OPTICS聚类算法对各个特征向量进行聚类以将节点划分至不同的聚簇并生成全局模型参数;若当前的迭代轮次为最后轮次,则将全局模型参数作为目标公共安全事件预测模型来对公共网络平台实时发布的文本数据进行公共安全事件预测。本申请能够在模型训练阶段实现高效的数据记录、学习和更新,同时可以在保护用户隐私的前提下实现数据的共享和聚合,能够实现针对文本数据进行公共安全事件发生及类型的自动化预测,能够有效提高公共安全事件预测的准确性及可靠性。

    专家学者科技资源信息的文本语义检索方法及装置

    公开(公告)号:CN114840645A

    公开(公告)日:2022-08-02

    申请号:CN202210776673.0

    申请日:2022-07-04

    Abstract: 本申请提供一种专家学者科技资源信息的文本语义检索方法及装置,方法包括:对BERT输出的包含有专家学者科技资源信息的目标文本对应的各个句子语义特征向量和检索关键词对应的词语义特征向量进行线性变换,得到标准正交基下的文本语义向量集和关键词语义向量;基于针对专家学者科技资源信息的多维相似度计算方式,对关键词语义向量与文本语义向量集进行余弦相似度计算,以确定文本语义检索结果。本申请能够有效提高针对专家学者科技资源信息进行文本语义检索的准确性及可靠性;并能够在提高语义检索结果的有效性及可用性的基础上,满足余弦相似度所适用场景,还能够有效提高专家学者科技资源文本语义检索结果的多样性及全面性。

    科技论文数据文本语义特征提取方法、系统及存储介质

    公开(公告)号:CN114818737A

    公开(公告)日:2022-07-29

    申请号:CN202210745539.4

    申请日:2022-06-29

    Abstract: 本发明提供一种科技论文数据文本语义特征提取方法、系统及存储介质,所述方法包括:获取科技论文的文本信息,并基于获取到的科技论文的文本信息构建实体关系图,所述文本信息包括论文标题以及关键词,实体关系图中的节点为论文标题或关键词,实体关系图中的边为节点之间的关联关系;基于获取到的科技论文的文本信息提取语义特征,得到语义特征矩阵;基于实体关系图确定原始邻接矩阵,将语义特征矩阵及所述原始邻接矩阵输入至图网络模型,得到空间特征矩阵;将语义特征矩阵与空间特征矩阵进行特征融合,得到科技论文的最终语义特征。该特征提取方法在提取科技论文语料的语义特征的基础上,利用知识图谱的空间关联,可较好的提取到科技论文的语义特征。

Patent Agency Ranking