事件检测方法
    31.
    发明公开

    公开(公告)号:CN109739982A

    公开(公告)日:2019-05-10

    申请号:CN201811563503.4

    申请日:2018-12-20

    Abstract: 本发明提供一种事件检测方法。所述方法包括:使用F值评价指标对正确预测的正例样本数量和正确预测的负例样本数量求偏导数,以计算所述F值评价指标对正例样本和负例样本的边际效用;计算负例样本在事件检测模型训练中的权重以对负例样本在事件检测模型训练中的权重进行缩放处理直至事件检测模型收敛。本发明通过动态缩放负例样本的训练权重,能够解决现有事件检测模型中的类别不平等问题,且不需要引入任何额外的模型参数。

    指令数据自动标注方法、语言模型指令遵循增强方法及系统

    公开(公告)号:CN118485061A

    公开(公告)日:2024-08-13

    申请号:CN202410548511.0

    申请日:2024-05-06

    Abstract: 本发明公开了指令数据自动标注方法、语言模型指令遵循增强方法及系统,属于自然语言处理技术领域。本发明从无监督纯文本语料中采样包含指令跟随监督信号的纯文本;使用人工标注的指令数据反向微调一预训练语言模型,微调完成后作为反向标注模型;利用反向标注模型对纯文本进行反向指令标注,得到反向标注指令数据;将部分纯文本及反向标注指令数据输入到闭源大语言模型进行数据改写,得到输出改写数据;使用输出改写数据微调一预训练语言模型,微调完成后作为输出改写模型;利用输出改写模型改写反向标注指令数据,得到自动标注的指令数据。本发明可以从无监督的文本语料中自动构建指令数据,以及增强预训练语言模型的指令遵循能力。

    一种生成语言模型的测试实例的方法及装置

    公开(公告)号:CN118227487A

    公开(公告)日:2024-06-21

    申请号:CN202410362163.8

    申请日:2024-03-27

    Abstract: 本申请公开了一种生成语言模型的测试实例的方法,包括:获取对待评估语言模型进行评估的第一测试实例,并确定所述第一测试实例的关键信息,该关键信息可以包括所述第一测试实例的测试目标和/或所述测试实例中的关键实体。根据所述关键信息,生成多个第二测试实例,所所述多个第二测试用于对所述待评估语言模型进行评估。由此可见,利用本申请实施例的方案,可以基于第一测试实例所确定的关键信息,对用于对待评估语言模型进行评估的测试实例进行扩充,扩充得到对待评估语言模型进行评估的多个第二测试实例。因此,利用本方案,对待评估语言模型进行评估的测试实例的更多,从而提升了对待评估语言模型进行评估所得到的评估结果的准确性。

    基于可信度感知和检索增强语言模型的问答方法及系统

    公开(公告)号:CN118153690A

    公开(公告)日:2024-06-07

    申请号:CN202410386568.5

    申请日:2024-04-01

    Abstract: 本发明公开了基于可信度感知和检索增强语言模型的问答方法及系统,属于自然语言处理技术领域,旨在解决在传统检索增强生成过程中所引入的缺陷信息问题。针对用户输入的问题所检索的系列文档进行可信度等级划分,生成可信度标注文档;根据输入的问题、可信度标注文档和答案构建增强输入,输入到大语言模型,生成可信度指导的解释;由可信度标注文档和可信度指导的解释构建训练数据集,将该训练数据集和输入的问题输入到待训练的语言模型中进行监督微调训练;利用训练好的语言模型来处理用户新输入的问题,基于指定的文档生成答案。本发明通过引入可信度因素,增强语言模型对可信度的感知能力,进而增强问答能力,提升对问题回答的精准性。

    基于对比学习远距离监督的机器阅读理解模型训练方法

    公开(公告)号:CN117634460A

    公开(公告)日:2024-03-01

    申请号:CN202210963096.6

    申请日:2022-08-11

    Abstract: 本发明公开了基于对比学习远距离监督的机器阅读理解模型训练方法。本方法为:1)对于每一给定的 对,首先从文本语料中检索包含该 对的文本段落,并在所述文本段落中查找并定位答案字符串,作为答案位置的标注,得到针对该 对的训练实例袋;将不包含该 对中答案的文本段落作为负样例文本段落;2)将训练实例中的问题、文本段落输入机器阅读理解模型,根据预测输出得到训练实例的答案位置;并根据答案开始和结束位置概率分布更新训练实例的置信度;3)基于置信度更新后的所述训练实例对所述机器阅读理解模型进行训练。本发明能避免由错误标注实例带来的预测捷径和语义漂移问题。

    一种基于全局变换原型网络的小样本关系分类方法和装置

    公开(公告)号:CN115563269A

    公开(公告)日:2023-01-03

    申请号:CN202110742816.1

    申请日:2021-07-01

    Abstract: 本发明公开了一种基于全局变换原型网络的小样本关系分类方法和装置,属于自然语言处理技术领域。该方法主要包含:(一)基于预训练语言模型和实体标记的关系实例表示抽取机制;(二)基于关系实例表示的全局变换原型网络;(三)基于上述网络得到的全局原型表示,进行的小样本关系分类方法。本发明的基于预训练语言模型和实体标记的关系实例表示抽取机制能够对关系实例包括的实体对和相关上下文进行充分编码;基于全局变换的原型网络能够充分通过支撑集,获得新任务的全局特征,基于此对新关系原型表示进行变换,从而更好地进行领域泛化。

Patent Agency Ranking