一种化学分子结构的图神经网络表征方法及装置

    公开(公告)号:CN113314189A

    公开(公告)日:2021-08-27

    申请号:CN202110589957.4

    申请日:2021-05-28

    Abstract: 本发明通过机器学习领域的方法,实现了一种化学分子结构的图神经网络表征方法及装置。包括三个步骤,步骤一为子图采样和编码步骤,进行子图采样并使用图神经网络对子图进行编码;步骤二为显著性子图选择步骤,引入强化学习筛选显著子图机制构建有限的马尔可夫过程解决显著子图选择中先验知识不足的问题;步骤三为子图骨架图构建和层次化聚合步骤,构造子图骨架图并进行子图内和子图间的层次化信息聚合,并通过自监督互信息增强机制,实现一个图神经网络表征新框架,最终实现自动高精度获得子图表征、自适应地捕捉化学分子结构的重要局部结构、可明确指出导致化学分子结构性质预测结果的具体局部结构的方法。

    一种基于节点相似度的流行病传播网络重构方法和系统

    公开(公告)号:CN112669980A

    公开(公告)日:2021-04-16

    申请号:CN202011579617.5

    申请日:2020-12-28

    Abstract: 本发明涉及一种基于节点相似度的流行病传播网络重构方法和系统,属于流行病数据重构分析领域,首先整合流调报告初步建立局部流行病传播网络,接着基于网络结构和节点属性定义了三类流行病传播网络的节点相似性指标,然后通过计算节点对的相似性指标向局部流行病传播网络中添加可能的缺失边来重构流行病传播网络,最后对比了不同指标下的网络重构准确度,本发明解决了现有流行病分析中传播链难挖掘、传播特征难以准确分析、大量流调报告利用率低等问题,构建出了能够如实反映病毒传播途径的流行病传播网络,可以基于构建的流行病传播网络有效挖掘流行病传播链,分析病毒传播速度,预测病毒的时空传播范围。

    一种多节点蜜罐系统及其数据分析方法

    公开(公告)号:CN107360145B

    公开(公告)日:2020-12-25

    申请号:CN201710521614.8

    申请日:2017-06-30

    Abstract: 本发明公开了一种多节点蜜罐系统及其数据分析方法,所述多节点蜜罐系统包括多个单节点蜜罐系统,所述多个单节点蜜罐系统互联形成网络拓扑结构;所述方法包括:获取各个单节点蜜罐系统的原始数据;利用主成分分析法对所述原始数据进行特征筛选,得到中间数据;对所述中间数据进行聚类分析以及监督学习,得到多个簇,其中,每个簇包括多个实例;在各个所述簇内针对恶意攻击命令进行关联规则提取;将提取出的关联规则作为攻击特征存储至特征标注集中。

    一种基于查询机制的抽取式文档摘要自动生成方法、装置及系统

    公开(公告)号:CN111177366A

    公开(公告)日:2020-05-19

    申请号:CN201911396046.9

    申请日:2019-12-30

    Abstract: 本发明通过深度学习的方法,构建训练数据与数据预处理;基于BERT模型预训练语言模型进行文档与查询内容编码;基于BERT模型的查询内容进行词编码;建立基于句子级别的层级结构(Hierarchical结构)模型,实现查询内容与文档关系语义建模;模型训练后封装,通过接口输出抽取式摘要五个步骤,使BERT模型学习词级别的特征向量表示,抽取代表文档的句子和查询的句子,并将上述特征导入Transformer模型进行句子级别的语义关系特征学习,结合查询模型的思想,学习查询内容与文档的关系,通过分类函数判定最终得到文本的摘要。

    基于HTTP压缩数据流的有害代码检测方法和装置

    公开(公告)号:CN106850507B

    公开(公告)日:2020-01-14

    申请号:CN201510885909.4

    申请日:2015-12-04

    Abstract: 本发明提供一种基于HTTP压缩数据流的有害代码检测方法和装置,方法包括:获取互联网服务器发送客户端待接受的gzip压缩数据流,对其进行霍夫曼解码,得到经过LZ77压缩的第一压缩数据流;触发多模式匹配窗口滑动,以推动LZ77解压滑动窗口在第一压缩数据流上的滑动;其中,针对第一压缩数据流中的长指针,只做边界匹配,并判断临时栈是否存有位于指针所指向的参考字符串中的索引位置,若有,确定指针所在的目标位置中的索引位置并存储至临时栈中,且LZ77解压滑动窗口和多模式匹配窗口之间的距离小于预设距离阈值,从而实现边进行LZ77解压,边进行跳跃性的多模匹配检测,缩短了压缩数据流的入侵或有害代码检测时间,提高了客户端用户上网体验的速度。

    一种多粒度实时热点聚合方法

    公开(公告)号:CN106874419B

    公开(公告)日:2019-09-10

    申请号:CN201710054225.9

    申请日:2017-01-22

    Abstract: 本发明提供一种多粒度实时热点聚合方法,包括:对输入的流式数据进行数据清洗处理,并将处理后的流式数据表示为结构化数据;对第一预设时间片内的结构化数据进行分词,并计算各分词在所有结构化数据中的权重;根据各分词的权重计算当前时间片内各事件的权重;对事件进行聚合,并根据各事件的权重计算聚合后的每个事件簇的权重;根据各事件簇的权重生成排序后的事件列表。本发明提供的技术方案,提升了最终事件显示结果的粒度、事件的完整性和准确性,方便了用户快速准确地获取热点信息。

    一种融合文本和标签网络的社交内容表征方法和系统

    公开(公告)号:CN110019653A

    公开(公告)日:2019-07-16

    申请号:CN201910277671.5

    申请日:2019-04-08

    Abstract: 本申请公开了一种融合文本和标签网络的社交内容表征方法和系统,所述方法包括:对文本数据进行处理,得到该文本数据的图表示,并对得到的子图中节点按照BFS进行排序;对所述图表示进行数据结构化处理;建立标签网络,并根据元路径在标签网络中随机游走得到标签的向量表示;将处理得到的结构化数据输入神经网络中,基于标签网络和元路径得到标签的向量表示对所述神经网络进行LSTM+RNN训练。

Patent Agency Ranking