网络数据延迟控制方法
    51.
    发明公开

    公开(公告)号:CN109787861A

    公开(公告)日:2019-05-21

    申请号:CN201910038264.9

    申请日:2016-08-01

    Applicant: 北京大学

    Abstract: 本发明公布了一种网络数据延迟控制方法,涉及网络化数据控制技术。本发明提供的技术方案通过设置大小数据包对来检测网络的延迟差异,分析得到延迟与数据包大小无关分量和与数据包相关分量,能够检测出延迟和数据包大小的关系,从而实现通过设置数据包大小来控制网络延迟。

    一种基于注释的仿真代码同步生成方法

    公开(公告)号:CN104199664A

    公开(公告)日:2014-12-10

    申请号:CN201410445887.5

    申请日:2014-09-03

    Applicant: 北京大学

    Abstract: 一种基于注释的仿真代码同步生成方法,包括:设计一个仿真描述模型;将该仿真描述模型导出为底层仿真代码;将导出的仿真代码放入实际仿真机中进行执行,并根据执行结果对仿真代码进行修改,然后将修改结果同步到仿真描述模型。通过上述方法,就能完成仿真描述模型与仿真代码之间的同步生成。利用本发明,可充分利用软件仿真的优势,将仿真软件应用到实时仿真领域中,能够缩短仿真模型设计周期、减少人为失误、减少重复工作量、降低对仿真人员编程知识的要求。

    基于数据增强的事件抽取大模型构建方法

    公开(公告)号:CN119398030A

    公开(公告)日:2025-02-07

    申请号:CN202411185299.2

    申请日:2024-08-27

    Applicant: 北京大学

    Inventor: 张世琨 叶蔚 谢睿

    Abstract: 本发明提供一种基于数据增强的事件抽取大模型构建方法,涉及数据处理技术领域,包括确定事件数据集对应的事件标注体系及第一提示词,第一提示词包括事件抽取任务定义、事件抽取任务指令及样本标注数据;根据事件标注体系及第一提示词,调用大语言模型对事件数据集进行事件抽取,得到第一标注数据;基于第二提示词,调用大语言模型对第一标注数据进行多次迭代更新,得到目标标注数据,第二提示词包括用于进行事件抽取错误反馈的反馈提示词及用于基于所生成的事件抽取错误反馈进行数据完善的完善提示词;基于目标标注数据及样本标注数据,得到数据增强的训练数据集,应用于大语言模型,得到训练好的事件抽取大模型。

    大型语言模型评估方法及装置
    54.
    发明公开

    公开(公告)号:CN119397536A

    公开(公告)日:2025-02-07

    申请号:CN202411185875.3

    申请日:2024-08-27

    Applicant: 北京大学

    Abstract: 本发明提供一种大型语言模型评估方法及装置。涉及数据处理技术领域,包括:获取完成训练的目标大语言模型;基于目标攻击算法对所述目标大语言模型进行攻击评估,得到攻击评估特征;基于目标统计算法或者目标评估模型,对所述攻击评估特征进行评估,得到所述目标大语言模型的风险评估等级。

    大模型预训练语料构建方法及装置

    公开(公告)号:CN119397267A

    公开(公告)日:2025-02-07

    申请号:CN202411185872.X

    申请日:2024-08-27

    Applicant: 北京大学

    Inventor: 叶蔚 谢睿 张世琨

    Abstract: 本发明提供一种大模型预训练语料构建方法及装置,涉及数据处理技术领域,包括:将多个语料样本输入到目标大语言模型,输出各个所述语料样本对应的文本标量分数;将所述语料样本与所述语料样本对应的文本标量分数作为一个训练样本,获取多个训练样本;基于所述多个训练样本对分类器进行训练,得到训练好的目标分类器;其中,所述分类器所需的计算资源小于所述目标大语言模型;基于所述目标分类器对预设语料库中的各个语料样本进行筛选,得到高质量训练语料。

    增量代码的静态检测方法及检测系统

    公开(公告)号:CN114510722B

    公开(公告)日:2023-01-06

    申请号:CN202210147761.4

    申请日:2022-02-17

    Applicant: 北京大学

    Abstract: 本发明涉及计算机科学技术领域,尤其涉及一种增量代码的静态检测方法及检测系统。静态检测方法具体包含以下步骤:识别所述待测代码的增量部分,构建抽象语法树,合成待测代码的函数调用图,构建增量部分的值依赖图和待测代码的值依赖图,对待测代码值依赖图进行漏洞检测得增量代码的静态检测结果;还包含步骤:将原代码进行静态分析和将原代码和增量代码的静态检测结果结合得到待测代码的静态检测结果。本发明解决了现有技术中静态检测方法精度差容易漏报或误报及代码更新后全检测周期长、资源消耗大、经济性差的问题,具有以下优点:大幅减少分析时间和内存,效率高,成本低和精度高的特点。

    细粒度情感分析模型训练方法及装置

    公开(公告)号:CN111666761B

    公开(公告)日:2022-12-09

    申请号:CN202010404188.1

    申请日:2020-05-13

    Applicant: 北京大学

    Abstract: 本发明实施例提供一种细粒度情感分析模型训练方法及装置,所述方法包括:获取带有情感标记以及方面词的文本信息;对文本信息中的每条语句进行分词处理,获取每条语句中每个词的上下文词向量,根据每个词的上下文词向量以及方面词的词向量得到文本信息中每条语句对应的语句向量;根据每条语句对应的语句向量获取每条语句的上下文语句向量,并获取每条语句基于方面词的语句权重,根据上下文语句向量与语句权重得到文本信息的文本向量;将文本向量、情感标记、以及方面词输入到循环神经网络,训练得到神经网络模型。采用本方法能够对文本数据的细粒度的各种方面情感类型进行识别,进而也提高了情感识别的准确率。

    基于可回溯序列生成方法的事件检测方法和系统

    公开(公告)号:CN114548101A

    公开(公告)日:2022-05-27

    申请号:CN202210436226.0

    申请日:2022-04-25

    Applicant: 北京大学

    Abstract: 本发明涉及软件检测技术领域,提出一种基于可回溯序列生成方法的事件检测方法和系统,其中方法包括:对作为训练文本的输入句子进行编码;对编码后的输入句子计算Luong注意力,并根据计算出的注意力权重定位出输入句子中权重最大的单词;对计算Luong注意力后的输入句子计算其中上下文向量;根据所述上下文向量,对输入句子进行解码,每时刻解码出一个事件类型的名称;根据解码结果、输入句子中包含的事件触发词、触发词触发的事件类型和预先定义的目标函数训练模型,得到事件监测模型;将作为待测文本的输入句子输入所述事件监测模型得到事件检测结果。根据本发明的方案,事件检测效率高,准确度高。

    基于自适应图神经网络的敏感文本检测方法及系统

    公开(公告)号:CN113946682A

    公开(公告)日:2022-01-18

    申请号:CN202111565272.2

    申请日:2021-12-21

    Applicant: 北京大学

    Abstract: 本发明涉及一种基于自适应图神经网络的敏感文本检测方法及系统,方法包括:采集网络敏感文本,将敏感文本以及敏感文本的类型保存至数据库;解析敏感文本,过滤解析后的敏感文本,得到高质量敏感文本语料库;对语料库进行预处理,得到模型训练需要的敏感语句输入序列以及目标敏感类型序列;将敏感语句输入序列和目标敏感类型序列输入模型进行训练,训练后经过验证得到分类模型;将数据库中用于测试的文本信息输入分类模型,输出分类结果。本发明提出基于采用强化学习的自适应图神经网络,改模型基于图神经网络,能够很好的从敏感文本中提取有用特征,用强化学习来生成图,并输入图神经网络,提升文本分类的准确率。

Patent Agency Ranking