-
公开(公告)号:CN117910475A
公开(公告)日:2024-04-19
申请号:CN202211234538.X
申请日:2022-10-10
Applicant: 复旦大学 , 上海高德威智能交通系统有限公司
IPC: G06F40/30 , G06F40/289 , G06F40/211 , G06F18/22 , G06F18/241 , G06F18/213
Abstract: 本发明提供一种基于细粒度匹配的零样本关系抽取方法,首先人工设计关系描述,标注对应的头尾实体类别,针对关系描述中多实体类别的情况,提出了基于相关词扩充融合模版句子生成方法,丰富关系描述中的实体类别信息,且拉近编码器与孤立实体类别间的间隔,获得了更好的实体类别表示,提升匹配精度。其次,通过带有梯度反转的分类器和基于自注意力机制的特征提取方法,利用投影蒸馏的去除原始语句中关系无关的冗余信息,获得纯净的关系语义表示,进一步提升匹配精度。最后基于双塔结构的思路,利用cos相似度作为度量指标,对关系描述和原始语句进行细粒度结构化匹配,使实体与实体进行匹配,句子与句子匹配,避免双塔结构预编码特性带来的精度损失。
-
公开(公告)号:CN117909766A
公开(公告)日:2024-04-19
申请号:CN202211235248.7
申请日:2022-10-10
Applicant: 复旦大学 , 上海高德威智能交通系统有限公司
IPC: G06F18/23 , G06F18/214
Abstract: 本发明提供一种基于人工引导的开放信息抽取聚类方法,首先对于预定义关系的标注数据,在聚类空间中拉近相同关系的表示;对于未标注数据,设计了一种针对聚类的标签策略,选择若干点进行标注。然后在聚类空间中将所有点分配给最近的标注点并得到伪标签,基于该伪标签和未标注样本对BERT模型进行关系抽取训练。本发明的基于人工引导的开放信息抽取聚类方法将原来的OpenRE两阶段过程相统一,从而提高模型性能。同时可以有效减轻对未标注样本估计偏差造成较坏影响,可以广泛应用于各种分布的未标注数据。此外,本发明提出的OpenRE两阶段统一框架在该领域内并未采用过,为后续信息抽取聚类具有启发性。
-
公开(公告)号:CN113947692A
公开(公告)日:2022-01-18
申请号:CN202110053388.1
申请日:2021-01-15
Applicant: 复旦大学
IPC: G06V10/762 , G06V10/764 , G06V10/774 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种通过k‑means聚类进行多任务增强的分类系统及方法,用于对待分类图像进行预测得到分类结果,其特征在于,包括:聚类辅助模块利用k‑means聚类方法对小样本训练数据聚类得到多个辅助标签,并构建辅助任务;主任务构建模块针对真实标签构建主任务;特征提取模块进行特征提取得到特征参数;信息交互模块为辅助任务以及主任务构建信息交互通道,并通过预定的参数共享机制将特征参数分为共享层以及私有层;元学习优化模块利用元学习策略学习辅助任务,并在共享层上根据原标签更新主任务,直到达到预定的收敛条件从而得到训练好的图像分类模型;分类预测模块利用图像分类模型对待分类图像分类预测得到分类结果。
-
公开(公告)号:CN118095432A
公开(公告)日:2024-05-28
申请号:CN202410178013.1
申请日:2024-02-08
Applicant: 北京有竹居网络技术有限公司 , 复旦大学
Abstract: 本公开的实施例涉及信息处理的方法、装置、设备和存储介质。在此提出的方法包括:获取样本问题和用于求解样本问题的策略信息;通过拆分策略信息,确定与样本问题的至少一个中间求解状态对应的推理过程;通过组合样本问题和推理过程,生成至少一个输入样本;以及基于至少一个输入样本和至少一个样本问题的答案信息,调整目标模型。
-
公开(公告)号:CN116049347B
公开(公告)日:2023-10-31
申请号:CN202210726962.X
申请日:2022-06-24
IPC: G06F16/33 , G06F16/35 , G06F40/216 , G06F40/289 , G06F40/30 , G06F18/241 , G06N3/0464 , G06N3/08
Abstract: 本申请提供了一种基于词融合的序列标注方法及相关设备。根据该基于词融合的序列标注方法,对于简单词,端侧设备可以通过分类器模块以及词融合模块在表示模型部分逐层合并,从而改变上传至云侧的表示向量的数量。在一些可能的实现方式中,云侧设备也可以在表示模型部分进行合并。上述方式可以避免第三方拦截或云侧获取表示向量后,使用还原模型映射为用户隐私信息,从而规避隐私攻击。同时,因为随着层数增加,表示向量的数量缩减,因此可以减少上层网络的计算量,加速序列标注进程,实现更快的命名实体识别和信息抽取。
-
公开(公告)号:CN119830988A
公开(公告)日:2025-04-15
申请号:CN202411900790.9
申请日:2024-12-20
Applicant: 复旦大学
IPC: G06N3/09 , G06N3/092 , G06N3/045 , G06N5/04 , G06F16/3329
Abstract: 本申请涉及计算机技术领域,公开了一种模型训练方法、电子设备、存储介质及程序产品。该方法中,用于训练第一大语言模型的第一训练样本包括用户指令、用户指令对应的至少一个工具名称,每个工具名称包括至少一个参考标记。将用户指令输入至第一大语言模型之后,基于该模型输出的预测结果确定各参考标记的第一损失。根据参考标记的标记类别的不同,为各参考标记设置不同的损失权重,然后对各参考标记的第一损失进行加权计算,得到目标损失。基于目标损失训练第一大语言模型,得到第二大语言模型。该方法中,不同标记类别的参考标记对应不同的损失权重,可以提升第二大语言模型在预测具有较大损失权重的标记类别的参考标记时的准确度。
-
公开(公告)号:CN116049840B
公开(公告)日:2023-10-20
申请号:CN202210879047.4
申请日:2022-07-25
Abstract: 一种数据保护方法、装置、相关设备及系统,电子设备包括数据保护模型,数据保护模型包括一个编码器、一个混淆器和一个恢复器:其中,混淆器包括N个混淆模块;电子设备通过编码器对用户数据x进行特征抽取,得到特征向量z0,将输入到恢复器和第1混淆模块;电子设备通过恢复器对第i‑1特征向量zi‑1进行还原处理,并基于还原数据和用户数据x生成第i噪声δi;将δi输入到第i混淆模块;电子设备通过第i混淆模块将第i‑1特征向量zi‑1和第i噪声δi进行叠加,得到第i特征向量zi;其中,i依次从1到N进行取值;在将i的取值加1之后,重新执行通过恢复器对第i‑1特征向量zi‑1进行的步骤,直到i等于所述N。
-
公开(公告)号:CN116383370A
公开(公告)日:2023-07-04
申请号:CN202310169737.5
申请日:2023-02-27
Applicant: 复旦大学
IPC: G06F16/34 , G06F16/332 , G06F16/35 , G06F40/30 , G06N3/0455
Abstract: 本发明属于开放域问答模型分析技术领域,具体为用于解释开放域问答模型的可视分析系统。本发明系统包括解释引擎模块、流程分析模块以及视图模块;解释引擎模块使用归因方法对OpenQA模型的每个模块的最终输出和隐式输出在全局和局部级别进行归因;流程分析模块把VEQA中的模型信息、数据以及经由解释引擎生成的可解释性数据被可视化为用户分析界面的各个视图,用户按照线性工作流以数据集、子集、单个实例、单个段落的顺序进行多层次探索;视图模块包括摘要视图、上下文视图、实例视图和树视图,用于可视化分析;本发明系统可帮助理解OpenQA模型的决策原因,并为模型改进提供见解;系统还支持对单个模块内的决策流程进行细粒度探索。
-
公开(公告)号:CN117910474A
公开(公告)日:2024-04-19
申请号:CN202211234524.8
申请日:2022-10-10
Applicant: 复旦大学 , 上海高德威智能交通系统有限公司
IPC: G06F40/30 , G06F18/241 , G06N3/0499 , G06N3/084
Abstract: 本发明提供一种基于跨文档语义增强的实体识别方法,首先将文档的布局信息输入掩码生成层,基于可学习的注意力掩码机制获取对应的注意力掩码;其次将原始文本、图像和布局信息输入到特征提取网络,综合注意力掩码,得到每个词的词特征表示;然后将每个词的词特征表示存储至倒排索引中,在倒排索引中查询当前词的相关项,与当前词的词特征表示进行融合,得到该当前词的最终词特征表示;最后通过将每个词的最终词特征表示输入至分类器,输出在各个实体类别上的概率分布,从而判断词的实体类别。本发明的文档实体识别方法能够有效过滤当前文档中无关冗余信息,增强对视觉文档的理解能力,有助于模型进行实体识别,从而提高模型性能。
-
公开(公告)号:CN116049840A
公开(公告)日:2023-05-02
申请号:CN202210879047.4
申请日:2022-07-25
Abstract: 一种数据保护方法、装置、相关设备及系统,电子设备包括数据保护模型,数据保护模型包括一个编码器、一个混淆器和一个恢复器:其中,混淆器包括N个混淆模块;电子设备通过编码器对用户数据x进行特征抽取,得到特征向量z0,将输入到恢复器和第1混淆模块;电子设备通过恢复器对第i‑1特征向量zi‑1进行还原处理,并基于还原数据和用户数据x生成第i噪声δi;将δi输入到第i混淆模块;电子设备通过第i混淆模块将第i‑1特征向量zi‑1和第i噪声δi进行叠加,得到第i特征向量zi;其中,i依次从1到N进行取值;在将i的取值加1之后,重新执行通过恢复器对第i‑1特征向量zi‑1进行的步骤,直到i等于所述N。
-
-
-
-
-
-
-
-
-