-
公开(公告)号:CN112905186A
公开(公告)日:2021-06-04
申请号:CN202110168454.X
申请日:2021-02-07
Applicant: 中国科学院软件研究所
Abstract: 本发明公开了一种适用于开源软件供应链的高信噪比代码分类方法及装置,包括:将待预测代码转化为PE‑AST、将各节点数值化、抽取PE‑AST中的PE‑AST路径、将PE‑AST路径转化为可以进行运算的元组、计算关联系数WS、更新路径表示及根据PE‑AST特征向量进行预测。本发明可以提高代码表示过程中的信噪比,从而提高机器分类代码的准确度;依据对代码的分类,提高了编程者在代码理解、代码维护方面的工作效率。
-
公开(公告)号:CN115659974A
公开(公告)日:2023-01-31
申请号:CN202211210974.3
申请日:2022-09-30
Applicant: 中国科学院软件研究所
IPC: G06F40/295 , G06F16/35 , G06N3/045 , G06N3/0464 , G06N3/088 , G06F18/2321
Abstract: 本发明涉及一种基于开源软件供应链的软件安全舆情事件抽取方法与装置。该方法包括:1)利用网络爬虫大规模获取新闻/资讯文本。2)构建TextCNN+动态多池化文本分类模型,用于快速过滤掉其他领域的非目标数据。3)利用LDA模型对领域内数据进行主题聚类,并在此基础上构建事件schema。4)对LDA模型的聚类结果数据进行少量人工修正,以此训练BERT‑DGCNN事件分类模型。5)使用采用span标注策略和负采样策略的深度学习模型对事件论元值进行识别。本发明提供了完整的舆情事件抽取方案,它根据领域文本数据的特点,充分避免对高质量标注数据的依赖,且能够处理事件论元实体嵌套等复杂情况,有效地提升了进行信息安全领域舆情事件抽取的效果。
-
公开(公告)号:CN115658846A
公开(公告)日:2023-01-31
申请号:CN202211218084.7
申请日:2022-09-30
Applicant: 中国科学院软件研究所
IPC: G06F16/33 , G06F16/31 , G06F16/36 , G06F16/901
Abstract: 本发明涉及一种适用于开源软件供应链的智能搜索方法及装置。其步骤包括:1)接受用户发送的自然语言查询问句,使用多种方法对查询问句进行关键要素识别,具体识别的要素包括:实体、概念、关系名、属性名、数值型属性;2)依据识别到关键要素的情况,生成候选路径;3)对候选路径进行转换并使用匹配排序模型进行路径匹配排序,从而得到搜索结果。本发明提供一个基于开源软件供应链知识图谱数据的自然语言搜索算法,为用户搜索图谱数据提供了高性能的接口。本发明综合利用多种方法提高关键要素识别从而确保结果召回率,并分条件进行候选路径生成从而降低路径匹配排序范围,有效地提升了利用自然语言对知识图谱数据进行搜索的效果。
-
公开(公告)号:CN117149839A
公开(公告)日:2023-12-01
申请号:CN202311187931.2
申请日:2023-09-14
Applicant: 中国科学院软件研究所
IPC: G06F16/2457 , G06F16/901 , G06F16/903 , G06F8/71 , G06F18/22 , G06N3/042 , G06N3/045 , G06N3/047 , G06N3/048 , G06N3/09
Abstract: 本发明提供了一种面向开源软件供应链的跨生态软件检测方法及装置。其步骤包括:1)构建跨生态软件对齐种子集;2)抽使用图神经网络进行预训练嵌入;3)对软件节点的邻域子图进行采样;4)进行跨图邻域信息匹配;5)构建损失函数进行模型训练;6)计算邻域子图的相似度。本发明为了解决当前基于规则方法无法充分检测跨生态软件的问题,提出了基于图匹配神经网络的软件实体对齐方法,并通过该方法检测跨生态软件。本发明可以有效提升跨生态软件对匹配的准确度,促进跨生态软件库的发现,提升开发者在不熟悉的编程语言生态中查找目标软件库的效率。
-
公开(公告)号:CN116049830A
公开(公告)日:2023-05-02
申请号:CN202211642886.0
申请日:2022-12-20
Applicant: 中国科学院软件研究所
IPC: G06F21/57 , G06F8/41 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本公开涉及一种面向开源软件供应链的无CVE漏洞智能预警方法及电子设备。所述方法包括:获取用于修复软件漏洞的相关安全代码的日志文本和代码信息;基于所述代码信息中的添加代码内容和删除代码内容,得到修改向量表示,并根据所述修改向量表示,计算所述相关安全代码为无CVE漏洞代码的第一概率;通过对所述日志文本进行分类,得到所述相关安全代码为无CVE漏洞代码的第二概率;基于所述第一概率和所述第二概率,计算所述相关安全代码的无CVE漏洞预警结果。本发明实现了可持续收集和标注漏洞。
-
公开(公告)号:CN117195233A
公开(公告)日:2023-12-08
申请号:CN202311201774.6
申请日:2023-09-18
Applicant: 中国科学院软件研究所
Abstract: 本发明公开一种面向开源软件供应链的物料清单SBOM+分析方法及装置,所述方法包括:对目标软件进行软件信息采集以及结构化解析,得到SBOM基本信息、源代码、二进制码和许可证框架;计算二进制码的基础特征以及二进制码中每一函数对应的函数特征后,通过基础特征以及函数特征进行候选组件的检索,以得到目标软件包含的候选组件以及版本;基于源代码进行目标软件的漏洞识别,以得到目标软件对应的漏洞识别结果;根据许可证框架计算目标软件对应的许可证冲突检测结果;基于目标软件包含的候选组件以及对应的版本、漏洞识别结果、许可证冲突检测结果,生成物料清单SBOM+分析结果。本发明能解决当前开源软件供应链中SBOM解析不充分以及SCA识别组件准确率不足问题。
-
公开(公告)号:CN115658845A
公开(公告)日:2023-01-31
申请号:CN202211212061.5
申请日:2022-09-30
Applicant: 中国科学院软件研究所
IPC: G06F16/33 , G06F16/36 , G06F16/332 , G06F16/31 , G06F40/35
Abstract: 本发明提出一种适用于开源软件供应链的智能问答方法及装置。该方法包括以下步骤:1)问句相似度度量:计算用户输入的问题与预定义的FAQ库中的问题的相似度,如果相似度超过一定的阈值,则将FAQ库中对应问题的答案直接返回给用户;2)问句解析:对用户提问进行语义解析,获取其所属类型、包含的实体对象等信息;3)答案生成:根据问句语义解析结果生成候选路径子图,并对候选子图进行打分排序,并将对应信息返回给用户;4)提示用户对解答结果进行评价,如果正确解决问题则更新FAQ库。本发明可以提升开源软件供应链知识图谱中智能问答性能的准确性。
-
公开(公告)号:CN117149839B
公开(公告)日:2024-04-16
申请号:CN202311187931.2
申请日:2023-09-14
Applicant: 中国科学院软件研究所
IPC: G06F16/2457 , G06F16/901 , G06F16/903 , G06F8/71 , G06F18/22 , G06N3/042 , G06N3/045 , G06N3/047 , G06N3/048 , G06N3/09
Abstract: 本发明提供了一种面向开源软件供应链的跨生态软件检测方法及装置。其步骤包括:1)构建跨生态软件对齐种子集;2)抽使用图神经网络进行预训练嵌入;3)对软件节点的邻域子图进行采样;4)进行跨图邻域信息匹配;5)构建损失函数进行模型训练;6)计算邻域子图的相似度。本发明为了解决当前基于规则方法无法充分检测跨生态软件的问题,提出了基于图匹配神经网络的软件实体对齐方法,并通过该方法检测跨生态软件。本发明可以有效提升跨生态软件对匹配的准确度,促进跨生态软件库的发现,提升开发者在不熟悉的编程语言生态中查找目标软件库的效率。
-
公开(公告)号:CN112905186B
公开(公告)日:2023-04-07
申请号:CN202110168454.X
申请日:2021-02-07
Applicant: 中国科学院软件研究所
IPC: G06F8/41 , G06N3/047 , G06N3/048 , G06N3/08 , G06F18/241
Abstract: 本发明公开了一种适用于开源软件供应链的高信噪比代码分类方法及装置,包括:将待预测代码转化为PE‑AST、将各节点数值化、抽取PE‑AST中的PE‑AST路径、将PE‑AST路径转化为可以进行运算的元组、计算关联系数WS、更新路径表示及根据PE‑AST特征向量进行预测。本发明可以提高代码表示过程中的信噪比,从而提高机器分类代码的准确度;依据对代码的分类,提高了编程者在代码理解、代码维护方面的工作效率。
-
-
-
-
-
-
-
-