ICT供应链招投标项目与企业产品实体匹配方法

    公开(公告)号:CN111597820A

    公开(公告)日:2020-08-28

    申请号:CN202010393829.8

    申请日:2020-05-11

    Abstract: 本发明涉及ICT供应链招投标项目与企业产品实体匹配方法,属于自然语言处理与机器学习领域。主要为了解决ICT领域招投标项目和企业产品之间由于描述角度不同而造成的匹配困难问题。本发明首先根据维基百科预训练所得的词向量表,查表获得目标实体词嵌入向量表示;将由词嵌入向量序列表示的待匹配的实体对分别传递至LSTM孪生网络,由模型最终隐藏状态编码得到实体对最终语义向量表示;后使用基于曼哈顿距离的度量函数计算待匹配实体对的空间相似度,根据阈值得到匹配结果。在ICT招投标项目知识库与企业官网产品知识库构建的数据集上对本技术方案及经典方案进行对比实验,结果表明该方法进一步提升了正确率和F1值,获得了更好的实体匹配效果。

    融合市场布局特征的ICT供应链网络节点可用性评估方法

    公开(公告)号:CN111489066A

    公开(公告)日:2020-08-04

    申请号:CN202010227387.X

    申请日:2020-03-27

    Abstract: 本发明涉及融合市场布局特征的ICT供应链网络节点可用性评估方法,属于计算机与信息科学技术领域。主要针对目前ICT供应链网络节点可用性评估指标体系不完善以及评估方法不完备的问题。本发明首先通过量化企业类型、注册资本、成立日期、登记状态、企业住所、分支机构等信息,获取供应商节点商业特征,通过doc2vec算法将企业经营范围的文本描述表征为文本向量,获取供应商节点产品特征,通过量化其个体影响边际、产品布局和行业布局,获取其市场布局特征;最后通过融合这三类特征并构建blending集成学习的供应链节点可用性量化评估模型,输出节点可用性评级(3级:强、较强、一般)。在项目获取的ICT招投标项目数据集上实验,供应商可用性评级任务准确率达77.07%。

    虚拟化平台操作系统内核数据攻击行为检测方法

    公开(公告)号:CN110737888A

    公开(公告)日:2020-01-31

    申请号:CN201910864463.5

    申请日:2019-09-12

    Abstract: 本发明涉及操作系统内核数据攻击行为的检测方法,属于计算机与信息科学技术领域。本发明目的是解决现有操作系统内核数据攻击行为检测方法存在的检测全面性不足、无法拦截攻击行为、依赖内核源代码等问题。本发明首先利用同步检测机制和语义重构技术定位并劫持特定内核函数,从而准确获取内核运行状态,计算当前内核进程的合法数据访问范围;然后利用虚拟化影子页表权限管理机制设置内存页的读写访问权限,将合法访问范围外的内核数据设置为只读或不可读写,对内核进程的数据访问范围进行强约束;最后使用“内存页异常”机制实现对攻击行为的同步检测从而对抗瞬态攻击,并利用虚拟机监视器拦截检测到的内核数据攻击行为。

    结合混合随机森林的关键信息基础设施资产识别方法

    公开(公告)号:CN110245693A

    公开(公告)日:2019-09-17

    申请号:CN201910459868.0

    申请日:2019-05-30

    Abstract: 本发明公开了一种结合混合随机森林的关键信息基础设施资产识别方法,属于计算机与信息科学技术领域。该方法包括:对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量;结合德尔菲专家咨询法和主成分分析法,进行资产设施的关键影响因素分析,提取关键特征向量;将多个随机森林判别模型与一个门控函数相结合,获得混合随机森林判决模型;基于构建的混合随机森林模型实现对流量是否为关键资产基础设施的识别。由于本发明提供的关键信息基础设施资产识别方法,在大数据下通过结合机器学习方法实现资产的特征构建和关键因素提取,通过分区构建各自的专家模型,提升识别的准确性和效率,并提高了模型的泛化能力和可扩展性。

    融合样本损失及优化速度约束的数据采样方法

    公开(公告)号:CN110070184A

    公开(公告)日:2019-07-30

    申请号:CN201910225742.7

    申请日:2019-03-25

    Abstract: 本发明提出了一种融合样本损失及优化速度约束的数据采样方法,属于计算机与信息科学技术领域。该方法包括:初始化模型参数并且预定义样本训练比例;计算每次迭代过程中每个样本的损失并排序,以此来更新步速参数;同时考虑样本损失和优化速度,来更新自步参数,继而更新模型参数。由于本发明提供的数据采样方法融合了样本损失和优化速度约束,既可以将噪声数据剔除,又能将开始表现不好但是优化速度快的数据选择出来,提高了模型的鲁棒性。

    一种基于多类型深度特征的中文命名实体识别方法

    公开(公告)号:CN110032634A

    公开(公告)日:2019-07-19

    申请号:CN201910310766.2

    申请日:2019-04-17

    Abstract: 本发明涉及一种基于多类型深度特征的中文命名实体识别方法,属于计算机与信息科学技术领域。本发明首先依据公开且已训练好的字符向量表,将非结构化文本中的字符替换为数值向量;其次分别提取字符级数值向量序列中的文本序列特征、字符重要度特征和上下文重要度特征;然后将每个字符对应的三个特征向量串联成一个特征向量,用线性链式条件随机场对其进行标注;最后将非结构化文本和标签序列对齐,使字符和标签按顺序一一对应,根据标签获得命名实体,表示为“实体——类别”对。本发明在Microsoft Research Asia中文命名实体识别语料上进行实验,结果表明通过引入软注意力模型和上下文注意力模型,实现了对字符重要度特征和上下文重要度特征的利用,提高了F1值。

    基于词属性注意力机制的关键短语识别方法

    公开(公告)号:CN109992774A

    公开(公告)日:2019-07-09

    申请号:CN201910225532.8

    申请日:2019-03-25

    Abstract: 本发明涉及基于词属性注意力机制的关键短语识别方法,属于自然语言处理与机器学习领域。主要为了解决现有关键短语识别方法无法识别文本中未出现的关键短语的问题。本发明首先利用词嵌入学习将输入文本的词和词性标签转化为向量;其次利用RNN编码器对单词序列和词性标签序列进行编码,获得单词序列和词性标签序列的隐藏状态;然后基于词属性注意力机制对单词序列的隐藏状态进行权值分配,并计算上下文向量;随后通过RNN解码器解码上下文向量并逐字生成可变长度序列;最后通过beam search算法生成关键短语。在567,830篇科研文章和新闻刊物上进行实验,结果表明本发明能达到较好的关键短语识别效果,进一步提升了识别的正确率。

    基于长短期记忆网络的V2ray流量识别方法

    公开(公告)号:CN109981485A

    公开(公告)日:2019-07-05

    申请号:CN201910225762.4

    申请日:2019-03-25

    Abstract: 本发明涉及基于长短期记忆网络的V2ray流量识别方法,属于计算机网络安全领域。主要为了解决基于卷积神经网络的方法将数据转化为图片后训练出模型的可解释性较差,且未利用到加密流量在时间序列特征的问题。本发明首先从交换机获取V2ray流量和普通流量的数据链路层数据包并对数据包进行标注,其次去除不包含有用信息和冗余的数据包;然后将可能对模型训练造成影响的字节置零,对数据包的长度进行调整;最后使用这些预处理过的数据训练长短期记忆网络。该方法无需进行特征提取和选择,对V2ray流量的时间序列关系进行了学习,具有较好的识别效果。

    个体网络安全意识分级量化评价方法

    公开(公告)号:CN108446848A

    公开(公告)日:2018-08-24

    申请号:CN201810233382.0

    申请日:2018-03-21

    CPC classification number: G06Q10/06393 G06Q50/26

    Abstract: 针对当前网络安全意识定义模糊,缺少有效评估体系和方法的问题,本发明提出个体网络安全意识分级量化评价方法。该方法包括三个部分,主观意识评估、行为本体评估和评估决策。主观意识评估部分通过问卷调查获取个体信息,通过层次分析法对各信息安全认知、信息法律伦理、信息安全知识、信息安全能力4个维度打分,获取个体用户在这4个维度的得分。行为本体评估部分,扫描电脑和手机用户行为,计算与最优的用户行为直接的距离,通过随机森林算法判别用户行为安全等级。融合主观意识评估和行为本体评估,评估个体网络空间安全意识水平。实验结果表明,该方法能够结合机器学习方法实现个体网络安全意识分级量化,粒度从强到弱不小于4级,其分级准确率在95%以上。该方法可以用于提高个体网络安全意识分级量化模型的全面性和普适性,具有一定的实用价值。

    结合路径标签数据变异的模糊测试关键数据定位方法

    公开(公告)号:CN108446235A

    公开(公告)日:2018-08-24

    申请号:CN201810235294.4

    申请日:2018-03-21

    Abstract: 针对现有的二进制程序模糊测试中关键数据定位方法资源消耗大、误报率较高等问题,提出结合路径标签数据变异的模糊测试关键数据定位方法。该方法首先通过静态分析定位二进制程序中的危险操作;然后使用动态插桩跟踪程序的执行过程,获取危险操作的路径标签和参数;最后通过分析测试数据变异前后跟踪结果的异同从而定位关键数据。实验结果表明,该方法能够在较低的资源消耗下有效定位测试数据中的关键数据,误报率小于0.4%,同时查全率大于80%,精确率大于60%。该方法可以用于提高二进制程序模糊测试的漏洞挖掘能力,具有一定的实用价值。

Patent Agency Ranking