ICT供应链网络关键节点识别属性提取方法

    公开(公告)号:CN112101414A

    公开(公告)日:2020-12-18

    申请号:CN202010811145.5

    申请日:2020-08-13

    Abstract: 本发明涉及ICT供应链网络关键节点的识别和关键节点识别属性提取方法,属于计算机与信息科学技术领域。本发明首先结合ICT供应链的拓扑信息、商业信息进行关键节点识别;然后使用boruta算法分析待选属性的重要性,提取出影响关键节点的重要属性;再使用待选属性构建逻辑回归模型,得到对关键节点有显著影响属性;对于两种方法筛选得到关键属性,采用交集归类的方法进行属性融合,得到最终的关键属性。本发明使用两个不同方法对影响关键节点的属性进行选择,算法之间差异明显,避免单一方法带来的局限性,提高关键属性的泛化性。

    基于规则生命周期检测的防火墙自适应能力提升方法

    公开(公告)号:CN108566382B

    公开(公告)日:2020-12-08

    申请号:CN201810233995.4

    申请日:2018-03-21

    Abstract: 本发明涉及基于规则生命周期检测的防火墙自适应能力提升方法,属于计算机与信息科学技术领域。本发明首先对防火墙日志中的匹配缺省规则的次数较多的数据包信息进行提取,根据数据包信息生成新的防火墙规则,将新生成的规则进行合并,把满足条件的新规则添加到规则集中;然后抓取到达防火墙的数据包,对合法的数据包进行入侵行为检测,若有入侵行为则生成警告信息,根据信息生成新规则添加到规则集中;最后,对新规则定期进行生命周期检测,及时删除生命周期结束的规则。本发明在不影响防火墙策略的情况下,分别采用日志分析和入侵检测两种方法生成防火墙规则,并加入了规则周期检测机制,解决了新规则过多造成的规则集臃肿问题,降低了数据包的平均匹配次数,提高了防火墙的过滤效率,有效的实现了防火墙的自适应能力。

    基于生成式对抗网络的开放式实体关系抽取方法

    公开(公告)号:CN111651528A

    公开(公告)日:2020-09-11

    申请号:CN202010396741.1

    申请日:2020-05-11

    Abstract: 本发明涉及基于生成式对抗网络的开放式实体关系抽取方法,属于自然语言处理与机器学习领域。针对微博数据短小杂乱的特点,以及现有方法未考虑句子间语义相似性导致抽取的实体关系对准确率低且冗余的问题,提出一种基于生成式对抗网络的开放式实体关系抽取方法。该方法首先通过关系词和论元抽取规则得到实体三元组,通过语法分析树筛选三元组得到候选实体关系对。其次利用生成式对抗网络计算句子相似度,根据相似度阈值,划分相似句子组,并结合组内句子包含的实体关系对与其对应的置信度,合并组内实体关系对。本发明在NLP&&CC微博语料上进行实验,结果表明通过计算实体关系对置信度和划分相似句子组,合并组内实体关系对,提高了准确率和召回率,达到了去冗余的效果。

    ICT供应链招投标项目与企业产品实体匹配方法

    公开(公告)号:CN111597820A

    公开(公告)日:2020-08-28

    申请号:CN202010393829.8

    申请日:2020-05-11

    Abstract: 本发明涉及ICT供应链招投标项目与企业产品实体匹配方法,属于自然语言处理与机器学习领域。主要为了解决ICT领域招投标项目和企业产品之间由于描述角度不同而造成的匹配困难问题。本发明首先根据维基百科预训练所得的词向量表,查表获得目标实体词嵌入向量表示;将由词嵌入向量序列表示的待匹配的实体对分别传递至LSTM孪生网络,由模型最终隐藏状态编码得到实体对最终语义向量表示;后使用基于曼哈顿距离的度量函数计算待匹配实体对的空间相似度,根据阈值得到匹配结果。在ICT招投标项目知识库与企业官网产品知识库构建的数据集上对本技术方案及经典方案进行对比实验,结果表明该方法进一步提升了正确率和F1值,获得了更好的实体匹配效果。

    融合市场布局特征的ICT供应链网络节点可用性评估方法

    公开(公告)号:CN111489066A

    公开(公告)日:2020-08-04

    申请号:CN202010227387.X

    申请日:2020-03-27

    Abstract: 本发明涉及融合市场布局特征的ICT供应链网络节点可用性评估方法,属于计算机与信息科学技术领域。主要针对目前ICT供应链网络节点可用性评估指标体系不完善以及评估方法不完备的问题。本发明首先通过量化企业类型、注册资本、成立日期、登记状态、企业住所、分支机构等信息,获取供应商节点商业特征,通过doc2vec算法将企业经营范围的文本描述表征为文本向量,获取供应商节点产品特征,通过量化其个体影响边际、产品布局和行业布局,获取其市场布局特征;最后通过融合这三类特征并构建blending集成学习的供应链节点可用性量化评估模型,输出节点可用性评级(3级:强、较强、一般)。在项目获取的ICT招投标项目数据集上实验,供应商可用性评级任务准确率达77.07%。

    虚拟化平台操作系统内核数据攻击行为检测方法

    公开(公告)号:CN110737888A

    公开(公告)日:2020-01-31

    申请号:CN201910864463.5

    申请日:2019-09-12

    Abstract: 本发明涉及操作系统内核数据攻击行为的检测方法,属于计算机与信息科学技术领域。本发明目的是解决现有操作系统内核数据攻击行为检测方法存在的检测全面性不足、无法拦截攻击行为、依赖内核源代码等问题。本发明首先利用同步检测机制和语义重构技术定位并劫持特定内核函数,从而准确获取内核运行状态,计算当前内核进程的合法数据访问范围;然后利用虚拟化影子页表权限管理机制设置内存页的读写访问权限,将合法访问范围外的内核数据设置为只读或不可读写,对内核进程的数据访问范围进行强约束;最后使用“内存页异常”机制实现对攻击行为的同步检测从而对抗瞬态攻击,并利用虚拟机监视器拦截检测到的内核数据攻击行为。

    结合混合随机森林的关键信息基础设施资产识别方法

    公开(公告)号:CN110245693A

    公开(公告)日:2019-09-17

    申请号:CN201910459868.0

    申请日:2019-05-30

    Abstract: 本发明公开了一种结合混合随机森林的关键信息基础设施资产识别方法,属于计算机与信息科学技术领域。该方法包括:对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量;结合德尔菲专家咨询法和主成分分析法,进行资产设施的关键影响因素分析,提取关键特征向量;将多个随机森林判别模型与一个门控函数相结合,获得混合随机森林判决模型;基于构建的混合随机森林模型实现对流量是否为关键资产基础设施的识别。由于本发明提供的关键信息基础设施资产识别方法,在大数据下通过结合机器学习方法实现资产的特征构建和关键因素提取,通过分区构建各自的专家模型,提升识别的准确性和效率,并提高了模型的泛化能力和可扩展性。

    融合样本损失及优化速度约束的数据采样方法

    公开(公告)号:CN110070184A

    公开(公告)日:2019-07-30

    申请号:CN201910225742.7

    申请日:2019-03-25

    Abstract: 本发明提出了一种融合样本损失及优化速度约束的数据采样方法,属于计算机与信息科学技术领域。该方法包括:初始化模型参数并且预定义样本训练比例;计算每次迭代过程中每个样本的损失并排序,以此来更新步速参数;同时考虑样本损失和优化速度,来更新自步参数,继而更新模型参数。由于本发明提供的数据采样方法融合了样本损失和优化速度约束,既可以将噪声数据剔除,又能将开始表现不好但是优化速度快的数据选择出来,提高了模型的鲁棒性。

    一种基于多类型深度特征的中文命名实体识别方法

    公开(公告)号:CN110032634A

    公开(公告)日:2019-07-19

    申请号:CN201910310766.2

    申请日:2019-04-17

    Abstract: 本发明涉及一种基于多类型深度特征的中文命名实体识别方法,属于计算机与信息科学技术领域。本发明首先依据公开且已训练好的字符向量表,将非结构化文本中的字符替换为数值向量;其次分别提取字符级数值向量序列中的文本序列特征、字符重要度特征和上下文重要度特征;然后将每个字符对应的三个特征向量串联成一个特征向量,用线性链式条件随机场对其进行标注;最后将非结构化文本和标签序列对齐,使字符和标签按顺序一一对应,根据标签获得命名实体,表示为“实体——类别”对。本发明在Microsoft Research Asia中文命名实体识别语料上进行实验,结果表明通过引入软注意力模型和上下文注意力模型,实现了对字符重要度特征和上下文重要度特征的利用,提高了F1值。

    基于词属性注意力机制的关键短语识别方法

    公开(公告)号:CN109992774A

    公开(公告)日:2019-07-09

    申请号:CN201910225532.8

    申请日:2019-03-25

    Abstract: 本发明涉及基于词属性注意力机制的关键短语识别方法,属于自然语言处理与机器学习领域。主要为了解决现有关键短语识别方法无法识别文本中未出现的关键短语的问题。本发明首先利用词嵌入学习将输入文本的词和词性标签转化为向量;其次利用RNN编码器对单词序列和词性标签序列进行编码,获得单词序列和词性标签序列的隐藏状态;然后基于词属性注意力机制对单词序列的隐藏状态进行权值分配,并计算上下文向量;随后通过RNN解码器解码上下文向量并逐字生成可变长度序列;最后通过beam search算法生成关键短语。在567,830篇科研文章和新闻刊物上进行实验,结果表明本发明能达到较好的关键短语识别效果,进一步提升了识别的正确率。

Patent Agency Ranking