一种基于MapReduce的分布式XSLT处理方法及处理系统

    公开(公告)号:CN113407782A

    公开(公告)日:2021-09-17

    申请号:CN202110837126.4

    申请日:2021-07-23

    Abstract: 本发明公开了一种基于MapReduce的分布式XSLT处理方法及处理系统,其先分解提取出XML数据文件中各个数据节点并归类,以及提取出XSLT规则样式表文件中各类型的转换模板规则,然后借助MapReduce框架先批量的匹配确定每一类的XML数据节点与XSLT转换模板规则之间的匹配关系,然后再分别对每个数据节点子集N‑XML中的各个XML数据节点按照相匹配的模板规则文件N‑XSLT所指示的转换模板规则进行批量的XSLT转换处理,完成对批量XML数据文件的分布式XSLT转换处理,减少了对处理系统的数据内存空间和处理资源的消耗,提高了对大批量XML数据文件的XSLT处理效率,有效避免了对处理系统的数据内存空间、系统处理资源的占用严重的问题,有利于提高XML数据文件进行批量XSLT转换处理成功率。

    一种相干斑模式起伏稳健的SAR图像分类方法

    公开(公告)号:CN112926448A

    公开(公告)日:2021-06-08

    申请号:CN202110209645.6

    申请日:2021-02-24

    Abstract: 本发明公开了一种相干斑模式起伏稳健的SAR图像分类方法,包括:获取待分类SAR图像;将待分类SAR图像输入训练后的SAR图像分类网络得到待分类SAR图像的分类结果,所述训练后的SAR图像分类网络对无相干斑噪声SAR图像以及对应的相干斑噪声SAR图像提取的特征描述矢量相似且分类结果相同。本发明通过正则约束对特征提取部分和分类器部分都做了约束,增强了对于相干斑噪声的鲁棒性。并且,与现有技术相比,无需进行数据增强,也无需设计特定的相干斑滤波方法。

    面向桥梁检测领域文本的少样本关系分类装置及分类方法

    公开(公告)号:CN115391535B

    公开(公告)日:2025-05-23

    申请号:CN202211034115.3

    申请日:2022-08-26

    Abstract: 本发明涉及关系分类技术领域,具体涉及面向桥梁检测领域文本的少样本关系分类装置及分类方法,该装置包括上下文特征提取模块、实体特征提取模块和关系分类模块;上下文特征提取模块包括样本编码器和双向编码网络,样本编码器用于将桥梁检测的句子编码为向量形式,得到句子编码向量;双向编码网络用于对句子进行前向和后向的编码,将两个方向的编码结果进行拼接得到句子的上下文特征信息;实体特征提取模块用于从句子编码向量中抽取实体编码向量,并将其转化为实体特征向量。相比于当前神经网络少样本关系分类方法,本发明能够在少样本的前提下更好地对桥梁检测领域文本包含的不同关系类型进行分类。

    一种面向桥梁检测文本的少样本机器阅读理解方法

    公开(公告)号:CN115392255A

    公开(公告)日:2022-11-25

    申请号:CN202211035572.4

    申请日:2022-08-26

    Abstract: 本发明涉及桥梁文本信息检索技术领域,具体涉及一种面向桥梁检测文本的少样本机器阅读理解方法。本方法中,即使获取到的样本数据并不多,但每一个样本,既可以通过问题分类模型及答案预测模型构建模拟预测数据,同时也可以通过人工标注的方式得到实际训练数据,每一个样本数据均可以得到充分的使用。与现有技术相比,本方法对收集到的文本数据进行了充分的开发使用,通过模拟训练数据及待标注的文本数据,可以让答案抽取模型在预训练Pre‑Training后,得到预微调Pre‑Tuning和微调Fine‑Tuning两次训练,与使用预训练+微调的现有训练方式相比,在只能收集到相同数据的文本数据时,同样可以大幅度提升答案抽取模型的训练效果。

    桥梁结构健康监测数据驱动模型的对抗样本攻击方法及系统

    公开(公告)号:CN114863210A

    公开(公告)日:2022-08-05

    申请号:CN202210443055.4

    申请日:2022-04-25

    Abstract: 本发明公开了一种桥梁结构健康监测数据驱动模型的对抗样本攻击方法及系统,该方法包括:步骤1)获取原始数据;步骤2)获取目标模型的信息;步骤3)根据步骤2)中获取的目标模型的信息选择对抗样本的生成方式,并设置扰动值;步骤4)根据步骤3)中选择的对抗样本的生成方式和扰动值生成与原始数据对应的对抗样本;步骤5)将步骤4)中生成的对抗样本作为目标模型的输入以对目标模型进行攻击;步骤6)对步骤5)中对抗样本的攻击效果进行评价;步骤7)结束。本发明提出的攻击方法攻击成功率高且极具隐蔽性,可以用于评估桥梁结构健康监测数据驱动模型的鲁棒性,具有较高的实用价值。

    基于实体相关注意力机制的实体关系联合抽取方法

    公开(公告)号:CN113221571A

    公开(公告)日:2021-08-06

    申请号:CN202110600808.3

    申请日:2021-05-31

    Abstract: 本发明涉及互联网络人工智能技术和自然语言处理技术领域,具体涉及基于实体相关注意力机制的实体关系联合抽取方法,其包括:获取待处理文本;将待处理文本输入经过预先训练的实体关系联合抽取神经网络模型中;实体关系联合抽取神经网络模型首先识别所述待处理文本中的所有实体;然后将各个实体分别作为目标头实体去识别对应的目标尾实体;最后识别各个目标头实体与对应目标尾实体之间的关系,并根据目标头实体、目标尾实体和相应关系构建对应的三元组;输出所有的三元组。本发明中的实体关系联合抽取方法能够保证实体关系联合抽取关联性并解决重叠关系问题,从而能够提升实体关系联合抽取的效果。

    一种面向中文短文本的实体链接方法

    公开(公告)号:CN116737948A

    公开(公告)日:2023-09-12

    申请号:CN202310578312.X

    申请日:2023-05-22

    Abstract: 本发明属于自然语言处理技术领域,尤其涉及一种面向中文短文本的实体链接方法,包括以下步骤:S1、对知识库进行处理,构建候选实体字典和知识库实体字典;S2、构建候选实体集,用于为待消歧文本中的实体指称过滤掉知识库中的不相关实体;S3、使用预设的候选实体排序的底层模型,对候选实体集中的候选实体依次进行训练;S4、通过预设的阈值判断不可链接的实体指称。本发明可以提高中文短文本实体链接的准确率,推进实体链接任务的实际应用。

    一种用于交通基础设施检测文本的机器阅读理解方法

    公开(公告)号:CN113312912B

    公开(公告)日:2023-03-31

    申请号:CN202110711212.0

    申请日:2021-06-25

    Abstract: 本发明涉及人工智能技术领域,具体涉及一种用于交通基础设施检测文本的机器阅读理解方法,包括:获取问题文本和待检测的段落文本;阅读理解模型首先对问题文本和段落文本进行编码得到对应的待检测字符向量;然后将待检测字符向量和设置的交通基础设施检测领域词向量进行融合得到对应的嵌入融合表示,并对嵌入融合表示进行语义特征捕捉;最后根据嵌入融合表示和捕捉的语义特征计算对应答案在段落文本中的字符位置,并将对应答案的字符位置作为段落文本的机器阅读理解结果;输出段落文本对应的机器阅读理解结果。本发明中的机器阅读理解方法能够兼顾理解全面性和理解准确性,从而能够提升交通基础设施检测领域中文文本的理解效果。

    基于层级交叉注意力机制的桥梁检测知识图谱问答方法

    公开(公告)号:CN115577086A

    公开(公告)日:2023-01-06

    申请号:CN202211275276.1

    申请日:2022-10-18

    Abstract: 本发明具体涉及基于层级交叉注意力机制的桥梁检测知识图谱问答方法,包括:获取桥梁检测领域的问题文本;将问题文本输入经过训练的深度网络问答模型中,输出对应的预测答案;首先通过神经网络提取问题文本的主题实体;然后根据问题文本的主题实体生成对应的结构化查询语句,并在桥梁检测知识图谱中进行查询操作;再将查询得到的所有知识三元组中的关系谓词和实体宾语作为候选答案,并通过层级交叉注意力机制计算得到候选答案和问题文本的相似度;最后将相似度最高的候选答案作为预测答案;将深度网络问答模型输出的预测答案作为对应问题文本的最终答案。本发明能够充分考虑桥梁检测领域问题文本和候选答案之间的语义特征和语义关联。

    面向桥梁检测领域文本的少样本关系分类装置及分类方法

    公开(公告)号:CN115391535A

    公开(公告)日:2022-11-25

    申请号:CN202211034115.3

    申请日:2022-08-26

    Abstract: 本发明涉及关系分类技术领域,具体涉及面向桥梁检测领域文本的少样本关系分类装置及分类方法,该装置包括上下文特征提取模块、实体特征提取模块和关系分类模块;上下文特征提取模块包括样本编码器和双向编码网络,样本编码器用于将桥梁检测的句子编码为向量形式,得到句子编码向量;双向编码网络用于对句子进行前向和后向的编码,将两个方向的编码结果进行拼接得到句子的上下文特征信息;实体特征提取模块用于从句子编码向量中抽取实体编码向量,并将其转化为实体特征向量。相比于当前神经网络少样本关系分类方法,本发明能够在少样本的前提下更好地对桥梁检测领域文本包含的不同关系类型进行分类。

Patent Agency Ranking