数据融合方法及终端
    41.
    发明授权

    公开(公告)号:CN111858732B

    公开(公告)日:2024-04-05

    申请号:CN202010672743.9

    申请日:2020-07-14

    Abstract: 本申请涉及数据融合方法及终端,属于数据融合技术领域。本申请包括:接收输入的数据,基于数据的元数据进行数据理解处理,包括:根据数据的数据值进行属性分类,以及为各属性建立对应的有效性判断和数据转换解析器;确定数据的数据值分布情况,并利用有效性判断和数据转换解析器进行有效性判断;对判断为有效的数据,利用对应的有效性判断和数据转换解析器,进行数据转换,输出融合数据进行存储。通过本申请,有助于实现形成元数据规范,数据标准统一,数据格式整齐的数据融合。

    基于分块的大规模代码静态分析方法和系统

    公开(公告)号:CN115080985B

    公开(公告)日:2022-11-11

    申请号:CN202210887831.X

    申请日:2022-07-27

    Abstract: 本发明涉及一种基于分块的大规模代码静态分析方法和系统。其中方法包括:将大规模工程程序按照工程粒度需求进行分块;针对各块,构建值依赖模型,将块对应的值依赖子图存储到数据库中作持久化保存;分析各块的值依赖子图中的程序漏洞,构建块漏洞表;遍历各块漏洞表,将漏洞表内的漏洞分类为可信漏洞和不可信漏洞;分析不可信漏洞,根据当前值依赖子图中的漏洞与数据库中其他值依赖子图之间的关联性对子图进行拓展,获得根据漏洞完整化的拓展子图;分析所有拓展子图,验证已发现漏洞并检测是否包含新漏洞,将获取的结果与可信漏洞合并后输出。本发明适用于上亿行代码的静态代码分析,可以实现准确有效的分析。

    代码相似性检测方法、装置以及存储介质

    公开(公告)号:CN112579155B

    公开(公告)日:2021-05-18

    申请号:CN202110198641.2

    申请日:2021-02-23

    Abstract: 本发明实施例涉及软件检测领域,公开了一种代码相似性检测方法,主要分为三个阶段,预处理阶段对海量源代码文件进行预处理和特征提取工作,输出相似哈希指纹值;指纹索引阶段则根据上一阶段的结果,采用分段索引策略将指纹切分并重组后存入相似哈希指纹库,建立分段索引便于快速匹配;相似匹配阶段则在对待测工程文件进行处理后生成相似哈希值,根据所述待测工程文件的相似哈希值从所述相似哈希指纹库中分段检索出溯源检测的结果;本发明能够从不同语言常见行的消除这一角度出发来降低行覆盖问题对结果的影响。

    一种篇章级关系抽取方法
    46.
    发明公开

    公开(公告)号:CN111831783A

    公开(公告)日:2020-10-27

    申请号:CN202010644404.X

    申请日:2020-07-07

    Abstract: 本发明提供了一种篇章级关系抽取方法,涉及自然语言处理技术领域,主要解决了针对篇章级文档,计算资源耗费问题和目标实体与非目标实体之间的逻辑推理的技术问题。该发明包括:输入待处理文档,所述文档为篇章级文档;基于双向注意力约束对所述文档进行处理,得到实体与句子的抽象语义表示,所述抽象语义表示具有全局信息和逻辑推理信息;基于所述抽象语义表示判断所述文档中的目标实体对的关系类型。开发者可以使用本发明所述的方法高效准确地进行篇章级的关系抽取,同时解决篇章级关系抽取的两个主要问题,即遍历所有实体对生成备选样本造成的计算成本问题,以及目标实体与非目标实体之间的逻辑推理问题。

    基于强化学习的事件论元抽取方法及装置

    公开(公告)号:CN111797241A

    公开(公告)日:2020-10-20

    申请号:CN202010552821.1

    申请日:2020-06-17

    Abstract: 本发明涉及一种基于强化学习的事件论元抽取方法及装置,包括构建事件检测模型,构建论元检测模型,构建实体选择模型,将实体选择模型选择的待检测实体输入到论元检测模型进行检测,采集预测结果的损失,根据预测结果的损失更新论元检测模型的参数;根据待检测实体更新实体选择模型;通过更新后的论元检测模型和更新后的实体选择模型对句子中的实体进行检测,并将检测结果引入更新后的论元检测模型和更新后的实体选择模型进行更新,循环直至遍历所有实体。本发明能够在检测当前论元的时候,引入已知论元的信息,通过引入已知论元信息和强化学习技术,能够有效利用论元间交互关系,提高论元检测效果。

    法律数据的知识图谱构建方法及装置

    公开(公告)号:CN111666419A

    公开(公告)日:2020-09-15

    申请号:CN202010462778.X

    申请日:2020-05-27

    Abstract: 本申请涉及法律数据的知识图谱构建方法及装置,属于知识图谱技术领域。本申请包括:步骤S101、对法律数据进行知识抽取,以提取用于知识图谱构建的实体、属性以及关系,其中,法律数据包括:案件和法律法规数据;步骤S102、对提取的实体以及关系采取不同的知识表示方式进行建模;步骤S103、利用gStore作为存储系统,生成能够进行多跳关系查询的法律垂直领域知识图谱。通过本申请,有助于使知识表示更加全面,提高查询准确率以及提高应用效率。

    基于强化学习的事件论元抽取方法及装置

    公开(公告)号:CN111797241B

    公开(公告)日:2023-08-22

    申请号:CN202010552821.1

    申请日:2020-06-17

    Abstract: 本发明涉及一种基于强化学习的事件论元抽取方法及装置,包括构建事件检测模型,构建论元检测模型,构建实体选择模型,将实体选择模型选择的待检测实体输入到论元检测模型进行检测,采集预测结果的损失,根据预测结果的损失更新论元检测模型的参数;根据待检测实体更新实体选择模型;通过更新后的论元检测模型和更新后的实体选择模型对句子中的实体进行检测,并将检测结果引入更新后的论元检测模型和更新后的实体选择模型进行更新,循环直至遍历所有实体。本发明能够在检测当前论元的时候,引入已知论元的信息,通过引入已知论元信息和强化学习技术,能够有效利用论元间交互关系,提高论元检测效果。

    一种文本摘要生成方法和装置

    公开(公告)号:CN111797225B

    公开(公告)日:2023-08-22

    申请号:CN202010550450.3

    申请日:2020-06-16

    Abstract: 本发明公开了一种文本摘要生成方法和装置,涉及自然语言文本的自动摘要技术;在获取输入文本之后,通过采用编码器对文本进行处理得到编码器的环境向量;然后再根据根据编码器的环境向量采用解码器解码生成摘要。在编码器对整个文本信息编码过程中加入具有感知关键词注意力机制网络的合并层,调整最终得到的编码器的环境向量。使编码器的环境向量既考虑文本的整体性,又关注文本中的关键词。最终通过解码器解码后得到的摘要更加精确,更加符合输入文本。

Patent Agency Ranking