一种基于代工模式的动态网页爬虫方法及系统

    公开(公告)号:CN111651656B

    公开(公告)日:2023-02-24

    申请号:CN202010488720.2

    申请日:2020-06-02

    Abstract: 本发明公开了一种基于代工模式的动态网页爬虫方法及系统,包括:接收业务信息,配置爬虫参数,业务评估,做准备工作;分配系统资源,发起多个独立进程的业务爬虫;采用模拟浏览器模式,对动态网页原始URL进行爬取,并返回目标静态数据内容的URL;审查URL的有效性和非重复性,并审查后的爬取任务,构造生产任务消息列表,发起多个线程的生产爬虫;采用自动化程序模式,对静态的URL页面进行爬取,并返回目标数据和附件文件;对返回内容处理并存储;导出数据。本发明分别构造了业务爬虫和生产爬虫,基于代工模式对动态网页和静态内容采取不同的爬取策略,最大限度地利用系统资源,实现对动态网页数据进行大规模、快速爬取。

    一种基于ATT&CK矩阵映射的物联网终端威胁检测方法

    公开(公告)号:CN113726803B

    公开(公告)日:2023-02-07

    申请号:CN202111027517.6

    申请日:2021-09-02

    Abstract: 本发明涉及物联网终端威胁检测技术领域,特别涉及一种基于ATT&CK矩阵映射的轻量级物联网入侵检测方法,包括对嗅探的物联网原始数据进行数据清洗,并自动识别攻击数据;实时筛选物联网协议头部和数据部分字节作为有效特征;量化物联网协议头部和数据部分字节形成流量初始特征矩阵;量化物联网通信数据的逻辑通信关系形成行为初始特征矩阵;通过矩阵线性运算将流量和行为初始特征进行线性加权,并将加权之后得到的综合特征矩阵映射到ATT&CK矩阵;通过ATT&CK检测物联网威胁类型;本发明能够以较高的效率和准确率判别针对物联网终端的威胁,达到对物联网终端威胁进行快速检测的目的。

    一种针对密码算法的混合去噪功耗分析方法及终端

    公开(公告)号:CN112564884B

    公开(公告)日:2022-08-30

    申请号:CN202011336636.5

    申请日:2020-11-25

    Inventor: 程克非 宋子言

    Abstract: 本发明涉及一种针对密码算法的混合去噪功耗分析方法及终端,属于信息安全与边信道攻击领域;所述方法包括选择实际中间值攻击点,并确定出所需的实际中间值,向运行密码算法的加密设备输入明文,采集加密时的功耗信号数据;对所获得的功耗信号数据使用低通滤波和经验模态阈值混合的去噪方法进行预处理,得到降噪之后的功耗信号数据;使用预处理之后的功耗信号数据构建实际功耗矩阵,并计算假设中间值,得到假设的功耗矩阵;计算实际功耗矩阵与假设功耗矩阵之间的相关系数,并得到正确的密钥。本发明减少了功耗信号中的噪声,提高了信噪比,同时提高了密码攻击的效率和准确度。

    一种基于残差编码器神经网络的硬件木马电路检测方法

    公开(公告)号:CN112749524B

    公开(公告)日:2022-07-12

    申请号:CN202110064374.X

    申请日:2021-01-18

    Abstract: 本发明涉及硬件木马电路检测技术领域,具体涉及一种基于残差编码器神经网络的硬件木马电路检测方法,包括:获取电路设计阶段的Verilog文件,根据Verilog文件进行有效特征提取,得到硬件木马电路的有效特征集合;基于有效特征对木马电路相关性,采用关键特征选择方法从硬件木马电路的有效特征集合中选择强相关特征;将强相关特征输入残差卷积编码器网络,残差卷积编码器网络根据输入的特征识别木马电路。本发明提出一种残差编码器神经网络模型,该模型结合了残差神经网络(ResNet)和编码器(Encoder),能够防止网络退化问题,相比于传统机器学习算法,错误率更低、准确率更高。

    一种基于极大无关多元逻辑回归的文本情感分类方法

    公开(公告)号:CN108595568B

    公开(公告)日:2022-05-17

    申请号:CN201810332338.5

    申请日:2018-04-13

    Abstract: 本发明提供了一种基于极大无关多元逻辑回归的文本情感分类方法,所述方法包括:获取文本数据,并对所述文本数据进行预处理;在第一模型的代价函数基础上,通过引入相关参数惩罚项,获取第二模型的代价函数;将预处理得到的训练数据输入第二模型的代价函数的导函数,并进行求解得到第二模型;所述第一模型为多元逻辑回归模型,所述第二模型为极大无关多元逻辑回归模型;将预处理得到的待预测数据输入所述第二模型,得到待预测数据中每个文本条目所属的情感类别。通过添加不相关约束项使得针对冗余数据具有较高的鲁棒性;降低了传统的多元逻辑回归模型的复杂度,具有更强的泛化能力;进而能够对获取的目标文本数据中文本条目进行精确分类。

    针对车载CAN总线模糊测试方法、终端以及计算机设备

    公开(公告)号:CN113872985A

    公开(公告)日:2021-12-31

    申请号:CN202111195978.4

    申请日:2021-10-14

    Abstract: 本发明属于车联网安全和模糊测试技术领域,尤其涉及针对车载CAN总线模糊测试方法、终端以及计算机设备;所述方法包括获取车辆行驶过程中的CAN总线报文数据;对所述CAN总线报文数据进行预处理;计算出每个CAN总线报文数据的比特反转率,按照所述比特反转率划分出信号边界;基于所述信号边界构建出边界矩阵,将所述边界矩阵输入到遗传算法模型中产生测试用例;将所述测试用例输入到CAN总线中对车辆的电子控制单元进行模糊测试。本发明可以有效地帮助生产者以及使用者了解车辆潜在的安全性以及安全漏洞的情况,能帮助使用者规避被攻击的风险,帮助生产者改善车辆的安全性。

    Spark框架下的稀疏多元逻辑回归模型对文本情感分类的方法

    公开(公告)号:CN108549692B

    公开(公告)日:2021-05-11

    申请号:CN201810331615.0

    申请日:2018-04-13

    Abstract: 本发明提供了一种Spark框架下的稀疏多元逻辑回归模型对文本情感分类的方法,包括:将训练样本数据集存储于HDFS中;Spark平台从HDFS中读取数据生成RDD;Spark平台将数据的预处理任务分为多个任务组,对每个任务组中存储有读取数据的RDD进行预处理,将预处理的结果存入HDFS中;训练稀疏多元逻辑回归模型,经过求解得到稀疏多元逻辑回归分类器;将所述稀疏多元逻辑回归分类器输出到HDFS中;从HDFS中读取经过预处理的待预测文本的数据和训练得到的稀疏多元逻辑回归分类器;获取所述待预测文本的情感分类。本发明在Spark计算框架下使用ADMM并行方法求解优化问题,使得模型训练更加快速,更适合大数据场景下的文本情感分类;有效提升了分类的效率与精度。

    一种基于单向分光的无状态端到端连接的内外网数据实时交换系统

    公开(公告)号:CN109245982B

    公开(公告)日:2020-11-24

    申请号:CN201710558284.X

    申请日:2017-07-10

    Abstract: 一种基于单向分光和无状态端到端连接的内外网数据实时交换系统,包括用户请求连接模块、客户端节点模块、服务端节点模块与用户访问内部网络中的目的服务系统模块。其中客户端节点模块包括加解密模块、上下行数据分离模块、单向分光隔离模块和互联网连接模块。其中服务端节点同样包括互联网连接模块、单向分光隔离模块、上下行数据汇聚分派模块与加解密模块。其中用户访问内部网络中的目的服务系统模块,实现用户最初的请求与目的服务系统的逻辑连接建立。本系统利用陷阱设备承受所有互联网攻击,保护内网安全,可防止ARP攻击、DNS欺骗等,除此之外,非认证互联网连接事务隔离在DMZ区,提高了内外网数据实时传输交换的安全防护性能。

    一种基于移动网络信令数据的动态人流量预警方法

    公开(公告)号:CN105512772B

    公开(公告)日:2020-09-15

    申请号:CN201510970428.3

    申请日:2015-12-22

    Abstract: 本发明提供了一种基于移动网络信令数据的动态人流量预警方法。方法包括:(1)划分人流量预警目标区域以及人流量预警观察区域;(2)从移动用户历史信令数据中,统计得到各观察区域随出行时长分布的人流量转移概率,同时统计目标区域各时间段人流量离去比例;(4)根据观察区域实时人流量,以及随出行时长分布的人流量转移概率,预计统计时刻从各观察区域进入目标区域的总用户数,同时根据目标区域实时人流量,以及该区域时间段人流量离去概率,预计统计时刻前目标区域离开的用户数,从而预计统计时刻监测区域人流量大小,并判定预警等级。本发明充分利用现有的移动网络信息,引入目标区域和观察区域,依据目标区域以及观察区域人流的流动情况,实现对目标区域人流量的统计,并根据预警等级的划定标准,完成对目标区域人流量预警。

    一种基于多特征的微博用户属性分析方法

    公开(公告)号:CN111125486A

    公开(公告)日:2020-05-08

    申请号:CN201911340531.4

    申请日:2019-12-23

    Inventor: 程克非 单凤池

    Abstract: 本发明涉及一种基于多特征的微博用户属性分析方法,属于智能媒体计算和大数据分析技术领域。该方法包括:S1利用爬虫软件爬取用户微博博文信息并清洗、打标;S2通过word2vec模型构造微博博文信息的词向量,在此基础上根据集成学习的组合策略,得出用户微博文本特征;S3从用户微博数据中构造出用于微博属性分析的多特征体系,并通过基础特征构造出符合用户属性分析的复合特征;S4采用Stacking模型融合技术将多个基分类器进行融合,构造微博用户属性分析模型,输入待检测数据,得到最终的微博用户属性分析结果。本发明提高了微博用户属性分类的准确率,为商家给用户提供更高效的个性化推荐提供技术支持。

Patent Agency Ranking