关键词提取方法、系统、设备及存储介质

    公开(公告)号:CN116701667A

    公开(公告)日:2023-09-05

    申请号:CN202310596224.2

    申请日:2023-05-24

    Inventor: 刘畅 刘鑫 曹勇

    Abstract: 本发明公开一种关键词提取方法、系统、设备及存储介质,所述方法包括获取敏感词组列表并去除每个敏感词组中的停用词和拼接词,得到预处理后的文本;基于预处理后的文本,构建词向量,并建立预处理后的文本中的词组与所述拼接词的映射关系;在词向量中选取初始簇中心向量,计算剩余词向量与初始簇中心向量之间的汉明距离,根据汉明距离对词向量进行簇划分,得到初步划分的关键词簇;基于所述词向量和所述初步划分的关键词簇,采用自适应聚类算法,得到相似词向量簇;按照所述映射关系,将所述相似词向量簇与所述拼接词进行拼接,生成关键词列表;以确保得到的关键词能够准确反映文本内容的特征。

    一种基于目录检索的组件识别方法及系统

    公开(公告)号:CN116303419A

    公开(公告)日:2023-06-23

    申请号:CN202211682418.6

    申请日:2022-12-26

    Abstract: 本发明提供一种基于目录检索的组件识别方法及系统,方法包括:对差异组件进行目录建模,据以确定并提取差异组件的组件识别特征,以得到组件特征文件,据以确定组件主目录层级结构特征;根据组件主目录层级结构特征,对每一组件进行目录建模,以生成每一组件的组件专属特征印记,据以作为唯一性验证信息,根据唯一性验证信息对组件专属特征印记进行入库操作,以根据主目录层级结构特征建立目录特征库;对待识别组件进行目录索引,提取待识别组件的目录特征,据以与目录特征库中的组件专属特征印记进行可信程度匹配,据以得到可信度概率,以识别待识别组件。本发明解决了特殊服务识别存在制约、特定场景下识别方法的识别能力欠缺的技术问题。

    数据采集方法、装置、存储介质及计算机设备

    公开(公告)号:CN116089681A

    公开(公告)日:2023-05-09

    申请号:CN202211624151.5

    申请日:2022-12-15

    Inventor: 刘畅 刘鑫

    Abstract: 本发明涉及电子信息技术领域,并公开了一种数据采集方法、装置、存储介质及计算机设备。其中方法包括构建任务列表,在任务列表中确定目标站点,并获取目标站点中每个网页的请求参数,然后根据请求参数在目标站点中提取目标网页,并计算目标网页的优先级,基于优先级生成任务执行队列,再将任务执行队列发送到至少两个主机设备中,以基于任务执行队列执行数据采集任务,得到目标网页的采集数据,最终对采集数据进行解析和清洗优化,得到数据采集结果,并将数据采集结果存储至数据库中。上述方法通过至少两个主机设备高并发的对多目标网页进行数据采集,并对多目标网页的数据采集顺序按照优先级进行针对性排序,数据采集方式灵活且高效。

    一种智能获取工具的方法、系统及计算机存储介质

    公开(公告)号:CN114238697A

    公开(公告)日:2022-03-25

    申请号:CN202111497190.9

    申请日:2021-12-09

    Abstract: 本发明公开一种智能获取工具的方法、系统及计算机存储介质,该方法包括:当监测到用户登录web界面平台时:根据用户的身份以及输入的搜索条件,从平台的图谱库中显示出所有满足搜索条件的工具;对该用户在所有工具中选择的单个工具进行数据输入,以使选择的单个工具向能力调度中心发送能力请求;根据能力请求以及选择的单个工具与其他工具的依赖关系从数据池中调出其他工具;将选择的单个工具输出的数据进行格式转换;将转换后的数据在web界面平台显示。本发明将所有的工具进行集成,加强工具之间的依赖关系,可以智能向用户推荐用户所需的工具,通过对输出的数据进行格式转换,以使所有输出的数据格式统一,从而可以对输出的数据进行二次利用。

    DNS劫持监测方法及装置
    5.
    发明公开

    公开(公告)号:CN114244590A

    公开(公告)日:2022-03-25

    申请号:CN202111485567.9

    申请日:2021-12-07

    Inventor: 刘鑫 夏玉明

    Abstract: 本发明公开一种DNS劫持监测方法及装置,所述方法包括获取DNS清单信息,DNS清单信息包括正常DNS清单和异常DNS清单;将待监测的目标资产与DNS清单信息进行对比,反向查询得到DNS线路结果;对于DNS线路结果中需要对同一网站域名解析监测的DNS线路进行解析,得到解析结果;对解析结果进行聚类分析,确定异常的DNS线路。通过反向查询DNS线路结果,并进行域名解析,将解析结果进行聚类分析,确定异常的DNS线路,通过在反向查询之后,对查询结果进行解析并聚类分析,最终确定异常结果,可以保持原信息的完整性,比如异常DNS信息等不会发生变化,以此提高监测准确度、效率和性能。

    一种AD日志分析方法及系统
    6.
    发明公开

    公开(公告)号:CN117194151A

    公开(公告)日:2023-12-08

    申请号:CN202311120240.0

    申请日:2023-08-31

    Inventor: 刘鑫 朱敏

    Abstract: 本发明公开了一种AD日志分析方法及系统,包括以下步骤:数据预处理,构建数据集;基于循环神经网络RNN以及长短记忆网络LSTM构建日志分析模型,并训练日志分析模型,得到训练好的日志分析模型;将实时采集的日志数据输入训练好的日志分析模型,得出分析结果,安全人员根据该分析结果进行研判,若是误报,则反馈给日志分析模型并且调整参数重新优化该模型,若不是误报,则进入后续安全处置流程;本发明的优点在于:减少安全分析人员的工作量,及时发现潜在威胁。

    基于SQL语言的数据库漏洞检测方法及系统

    公开(公告)号:CN116975872A

    公开(公告)日:2023-10-31

    申请号:CN202310781023.X

    申请日:2023-06-28

    Inventor: 曹勇 刘鑫 刘畅

    Abstract: 本发明提供基于SQL语言的数据库漏洞检测方法及系统,方法包括:在版本提取中心,通过JDBC协议获取数据库原始详细版本信息;利用策略中心管理数据库漏洞扫描策略,利用漏洞扫描引擎根据扫描策略,依次扫描策略中心下各策略中的漏洞条目;收集漏洞数据库中的已知漏洞,进行数据改造,对每个漏洞编写SQL解析引擎版本校验语句,在SQL语句中嵌入条件判断语句,以解析得到并返回漏洞是否存在;进行SQL语句清洗,从变量池中获取SQL语句中变量名对应的变量值并替换为常数;利用NOSQL转换器,将漏洞条目中的SQL语句转换为各非关系型数据库厂商对应的数据库语句。本发明解决了漏洞扫描准确性较低、可扩展性较差的技术问题。

    一种针对大数据平台的脆弱性检测方法

    公开(公告)号:CN110955900A

    公开(公告)日:2020-04-03

    申请号:CN201911302348.5

    申请日:2019-12-17

    Inventor: 刘鑫 王银龙

    Abstract: 本发明公开了一种针对大数据平台的脆弱性检测方法,具体步骤如下:首先准备好基础环境,然后在基础环境中部署调试;通过此工具对大数据平台进行自动化的节点发现与无人值守扫描任务的下发,扫描结果最后报告中存在的问题,通过邮件方式把扫描报告推送相关人员,本发明针能够提高大数据平台安全性:对大数据/云平台进行深入基线和漏洞检测扫描,根据企业存在的安全问题,能够提供专业的整改防护建议,保障组件安全及合规性,从而提高大数据平台本身的安全性。

Patent Agency Ranking