一种基于预训练模型的网络安全命名实体识别数据增广方法

    公开(公告)号:CN119204011A

    公开(公告)日:2024-12-27

    申请号:CN202411190945.4

    申请日:2024-08-28

    Abstract: 本发明公开了一种基于预训练模型的网络安全命名实体识别数据增广方法,属于网络数据安全技术领域。解决了现有技术中传统的网络安全命名实体识别数据增广方法易导致识别文本语义错误的问题;本发明给定标注集合和输入序列,根据标注规则生成标注序列,对输入序列进行分句处理;对输入序列的文本片段的长度进行替换,得到片段集合;根据标注集合,对片段集合进行掩码操作,得到新片段集合,利用BERT模型对新片段集合进行预测,得到增广后的数据集;使用BERT模型计算得到连续概率并搜索相邻句子概率矩阵打乱句子顺序,得到最终增广后的数据集。本发明有效提升了所生成增广数据的质量,减少了过拟合现象,可以应用于数据增广。

    一种基于规范化张量分解的司法案例建模方法、装置及存储介质

    公开(公告)号:CN112883938B

    公开(公告)日:2024-08-23

    申请号:CN202110379085.9

    申请日:2021-04-08

    Abstract: 本发明提出了一种基于规范化张量分解的司法案例建模方法,涉及一种司法案例建模方法,尤其涉及一种基于规范化张量分解的司法案例建模方法,属于数据处理技术领域。包括以下步骤:步骤一.将司法案例进行模块分割;步骤二.将司法案例模块中的词汇过滤;步骤三.将司法案例模块矩阵化及张量生成;步骤四.将司法案例的原始张量分解为核张量,完成司法案例建模。解决了现有技术中存在的天然缺陷,不利于提高后续预测算法的准确率的技术问题,实现了无需大量的法律专业知识和人工标注工作,对数据库中词汇和语法信息的依赖性不强,能从各个层面描述司法案例,捕捉不同案例模块间的潜在关联,提高后续案例相关预测算法准确率。

    一种基于多任务迁移的众包命名实体识别个性化提示微调方法及系统

    公开(公告)号:CN117540746B

    公开(公告)日:2024-07-19

    申请号:CN202311709913.6

    申请日:2023-12-13

    Abstract: 一种基于多任务迁移的众包命名实体识别个性化提示微调方法及系统,属于众包命名实体识别技术领域。本发明为了解决使用现有的提示方法在众包场景下进行提示微调时识别准确率低、识别效果差的问题而提出的。技术要点:先构建个性化提示生成器:个性化提示生成器针对每个标注者构建私有提示,针对所有标注者构建公有提示,初始化后经过训练过程得到用于预测的私有提示、公有提示,二者再生成最终软提示,最终软提示再通过提示生成网络生成三种注意力机制对应的K、V;再将K、V输入给基于软提示微调的Transformer构架下的模型,得到参数改变后的预训练模型。实验证明,我们提出的PPG能够显著提升已有基于预训练模型的软提示微调命名实体识别方法在众包数据上的效果。

    一种低功耗蓝牙加密通信的流量分析方法、系统、计算机及存储介质

    公开(公告)号:CN114158039B

    公开(公告)日:2024-04-12

    申请号:CN202111531017.6

    申请日:2021-12-14

    Abstract: 一种低功耗蓝牙加密通信的流量分析方法、系统、计算机及存储介质,属于蓝牙加密通信技术领域。利用无线电平台在BLE主从设备加密会话正式建立前获得connect_req数据包和配置信息,进而捕获破解密文数据获得明文数据。对照明文数据与密文数据,根据BLE芯片在接收指令变化时数据包传输过程时间间隔会产生抖动,提取多个操作改变导致抖动按时序进行组合形成抖动组合,将抖动组合进行均一化处理构建矩阵,通过特征工程确定流量分析模型的输入,构造基于集成方法的机器学习模型,完成对BLE加密通信的操作或指令的判别,实现对BLE加密通信的流量分析。解决无法对BLE加密通信过程中捕获特征单一的加密数据进行流量分析的问题。

    一种基于行为指纹的数据归属权鉴别系统及方法

    公开(公告)号:CN117171720B

    公开(公告)日:2024-03-22

    申请号:CN202311039943.0

    申请日:2023-08-17

    Abstract: 一种基于行为指纹的数据归属权鉴别系统及方法,涉及金融行业信息安全技术领域。本发明为为了实现金融机构的数据归属权证明,金融机构数据泄露后信息不易被恶意篡改、抹除,提高数据的不可预测性而提出的。本发明使用虚拟主键用于标识交易记录,通过可控账户的变频交易行为向数据集中嵌入水印,利用混沌函数的不可预测性提高了系统安全性。本发明采用水印嵌入技术,对可控账户的交易金额、交易时间进行分析,控制可控账户在指定的交易时间进行指定的交易金额的交易行为,完成水印嵌入。本发明采用水印提取技术,将当前数据集进行切片,遍历数据切片,通过不同机构标识号所分析得到的可控账户集合判断数据归属,完成数据归属权的证明。

    一种基于多任务迁移的众包命名实体识别个性化提示微调方法及系统

    公开(公告)号:CN117540746A

    公开(公告)日:2024-02-09

    申请号:CN202311709913.6

    申请日:2023-12-13

    Abstract: 一种基于多任务迁移的众包命名实体识别个性化提示微调方法及系统,属于众包命名实体识别技术领域。本发明为了解决使用现有的提示方法在众包场景下进行提示微调时识别准确率低、识别效果差的问题而提出的。技术要点:先构建个性化提示生成器:个性化提示生成器针对每个标注者构建私有提示,针对所有标注者构建公有提示,初始化后经过训练过程得到用于预测的私有提示、公有提示,二者再生成最终软提示,最终软提示再通过提示生成网络生成三种注意力机制对应的K、V;再将K、V输入给基于软提示微调的Transformer构架下的模型,得到参数改变后的预训练模型。实验证明,我们提出的PPG能够显著提升已有基于预训练模型的软提示微调命名实体识别方法在众包数据上的效果。

    一种基于DNS系统的通用网络标识解析方法及系统

    公开(公告)号:CN114285823B

    公开(公告)日:2024-02-02

    申请号:CN202111654983.7

    申请日:2021-12-30

    Abstract: 一种基于DNS系统的通用网络标识解析方法及系统,涉及网络标识解析技术领域,用以解决现有的多标识体系由于不能实现体系间标识数据交换而导致协同工作困难的问题。本发明的技术要点包括:获取用户输入的带有网络标识的解析请求,其中,所述解析请求为符合预定义格式的解析请求,其包括两种类型:HTTP模型和标识协议模型;对所述解析请求进行转换,获得可解析URL;基于预先部署的DNS权威服务器,根据可解析URL进行DNS解析,获取对应标识权威服务器的IP地址;基于预先部署的标识权威服务器,访问DNS解析获得的标识权威服务器的IP地址,根据可解析URL进行标识解析,获取网络标识对应的数据。本发明方便了各种标识体系的协同解析功能,降低了部署成本。

    一种基于协议无感知转发的NDN模态实现方法

    公开(公告)号:CN114244919B

    公开(公告)日:2024-01-26

    申请号:CN202111549823.6

    申请日:2021-12-17

    Abstract: 一种基于协议无感知转发的NDN模态实现方法及NDN控制器应用程序,涉及NDN模态实现技术领域,用以解决现有POF不能直接支撑NDN的有状态转发需求且不能对TLV结构报文进行字段检查和操作的问题。本发明的技术要点包括:一个主机将NDN报文转换为NDN模态报文,NDN模态报文为NDN报文附加NDN前置头后形成的报文;多模态网络转发NDN模态报文,转发过程经过一个或多个POF交换机,在每个POF交换机中由流表流水线和有状态转发模块协同对NDN模态报文进行处理并向多模态网络发出,直至到达另一个主机;另一个主机将NDN模态报文转换为NDN报文。本发明提高了多模态网络的通用性、NDN转发的效率和NDN路由与转发策略管理的便捷性。本发明可应用于在多模态网络中运行NDN。

Patent Agency Ranking