-
公开(公告)号:CN119202185A
公开(公告)日:2024-12-27
申请号:CN202411322542.0
申请日:2024-09-20
Applicant: 中国科学院软件研究所 , 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06N5/045
Abstract: 本说明书公开了一种业务执行方法、装置、存储介质及电子设备。在此方法中,获取至少一个提示示例以及待分析文本,并确定待分析文本对应的自解释指令,将至少一个提示示例、待分析文本以及自解释指令输入到预设的大语言模型中,以使大语言模型根据至少一个提示示例所包含的待分析示例文本与待分析示例文本对应的标准回复文本,来预测待分析文本对应的初始回复文本,并通过待分析文本对应的自解释指令,生成得到初始回复文本的原因信息,以根据原因信息,调整初始回复文本,并将调整后的初始回复文本作为待分析文本对应的目标回复文本,继而,根据待分析文本对应的目标回复文本,执行业务。
-
公开(公告)号:CN118709716A
公开(公告)日:2024-09-27
申请号:CN202410708243.4
申请日:2024-06-03
Applicant: 中国科学院软件研究所
Abstract: 本发明公开一种基于大语言模型的多智能体系统优化方法及装置,属于自然语言处理技术领域。所述方便包括:基于目标任务选取协作架构和智能体所使用的大型语言模型;确定智能体数量、最大协作轮次以及提前停止阈值,并结合协作架构和智能体所使用的大型语言模型,构建多智能体系统以及获取该多智能体系统的参数规模;结合多智能体系统的参数规模,将协作架构的优化分解为在任何单个时间步长智能体之间每条协作路径的相对重要性和回报,以对多智能体系统进行优化。本发明可以更有效地分析和优化基于LLM的多智能体系统。
-
公开(公告)号:CN118445664A
公开(公告)日:2024-08-06
申请号:CN202410521200.5
申请日:2024-04-28
Applicant: 中国科学院软件研究所
IPC: G06F18/24 , G06F40/186 , G06F40/232 , G06F18/214 , G06N3/09 , G06N3/098 , G06N3/0455
Abstract: 本发明公开了基于多方面反事实数据的文档筛选方法、装置及介质,属于自然语言处理技术领域。本发明对带有内容质量分数标签的原文档进行内容质量的反事实推理,得到反事实文档,由原文档和反事实文档构成反事实文档对,得到对比文档集;基于大语言模型构建大语言模型评估器,利用对比文档集对该大语言模型评估器进行联合训练;针对待筛选文档,利用训练好的大语言模型评估器评估其内容质量分数,根据评估结果进行文档筛选。本发明能够对待筛选文档的内容质量进行准确评估,根据评估结果来筛选文档,从而筛选出质量优秀的文档。
-
公开(公告)号:CN113609244B
公开(公告)日:2023-09-05
申请号:CN202110637453.5
申请日:2021-06-08
Applicant: 中国科学院软件研究所
Abstract: 本发明提出一种基于可控生成的结构化记录抽取方法和装置。该方法可以从非结构化的文本中自动抽取结构化的文本记录,其抽取步骤包括:对于目标文本,序列到结构网络首先利用基于自注意力机制的编码器捕捉目标文本的文本语义,然后利用基于混合注意力机制的解码器生成结构化表示;其中,基于前缀树的可控解码算法在生成的过程中对解码空间进行约束,注入框架知识,引导模型解码,生成线性表达式;最后,对线性表达式进行结构转化,生成结构化记录。在模型训练阶段,采用两阶段的模型学习方法帮助模型进行高效的学习:第一阶段采用子结构进行模型学习,注重文本块抽取能力的训练;第二阶段采用完整记录结构进行模型学习,注重结构抽取能力的训练。
-
公开(公告)号:CN109739982A
公开(公告)日:2019-05-10
申请号:CN201811563503.4
申请日:2018-12-20
Applicant: 中国科学院软件研究所
IPC: G06F16/35
Abstract: 本发明提供一种事件检测方法。所述方法包括:使用F值评价指标对正确预测的正例样本数量和正确预测的负例样本数量求偏导数,以计算所述F值评价指标对正例样本和负例样本的边际效用;计算负例样本在事件检测模型训练中的权重以对负例样本在事件检测模型训练中的权重进行缩放处理直至事件检测模型收敛。本发明通过动态缩放负例样本的训练权重,能够解决现有事件检测模型中的类别不平等问题,且不需要引入任何额外的模型参数。
-
公开(公告)号:CN119337888A
公开(公告)日:2025-01-21
申请号:CN202411426918.2
申请日:2024-10-12
Applicant: 中国科学院软件研究所 , 支付宝(杭州)信息技术有限公司
IPC: G06F40/30 , G06N5/04 , G06F16/353
Abstract: 本说明书实施例提供了一种针对大语言模型的样本重排序方法,包括针对范例样本集的多轮迭代处理,范例样本集中各范例样本具有在目标语义下的语义标签,其中任意一轮迭代处理包括:从本轮的当前范例样本集中获取任意范例样本,将其作为输入文本,与本轮的当前序列共同输入大语言模型,使得大语言模型将当前序列中的文本作为范例,推断得到输入文本的若干推断标签的概率。根据若干推断标签的概率,确定范例样本对应的第一指标。对当前范例样本集中的各个范例样本,基于各自的第一指标进行排序,得到第一序列。从第一序列中选取目标范例样本,将其从当前范例样本集移动到当前序列尾部。
-
公开(公告)号:CN119336872A
公开(公告)日:2025-01-21
申请号:CN202411426214.5
申请日:2024-10-12
Applicant: 中国科学院软件研究所 , 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06N5/022 , G06N5/04
Abstract: 本说明书提供一种文本生成方法。首先,获取待回答问题和检索到的针对待回答问题的文档集。并将文档集中的每个文档输入问答模型,得到问答模型针对每个文档的预测结果。并基于每个文档对应的预测结果确定该文档与待回答问题之间的第一相关度。并根据第一相关度来确定输入问答模型的目标文档,以通过问答模型生成针对待回答问题的文本。通过问答模型针对每个文档生成的预测结果来对文档集中的文档选取输入问答模型的目标文档,使得输入问答模型的目标文档更符合问答模型的需求,提升了生成的文本的准确度。
-
公开(公告)号:CN119202184A
公开(公告)日:2024-12-27
申请号:CN202411322485.6
申请日:2024-09-20
Applicant: 中国科学院软件研究所 , 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法应用于开放域问答系统,所述开放域问答系统中包括检索器和阅读器,该方法包括:接收用户输入的目标问题数据;基于目标问题数据的内容,对目标问题数据对应的用户意图进行扩展处理,得到一个或多个不同的澄清查询数据;分别将每个澄清查询数据输入到检索器中,得到每个澄清查询数据对应的检索数据;确定每个澄清查询数据对应的检索数据与目标问题数据之间的相关性信息,并基于确定的相关性信息对每个澄清查询数据对应的检索数据进行重写处理,得到重写的检索数据;基于重写的检索数据,通过阅读器确定目标问题数据对应的答案数据,并输出该答案数据。
-
公开(公告)号:CN117688186B
公开(公告)日:2024-09-10
申请号:CN202311511960.X
申请日:2023-11-14
Applicant: 中国科学院软件研究所
IPC: G06F16/36 , G06F40/289 , G06F40/30
Abstract: 本发明公开了一种基于知识图谱的大语言模型幻觉问题的自动修正方法和装置,其步骤包括:使用大语言模型抽取文本中需要校验的观点;利用少样本提示的方式提取待校验观点中的命名实体;从知识图谱中筛选与待校验观点相关的三元组;根据筛选得到的若干三元组对观点的正确性进行校验,并给出修改建议;结合所有观点的修改建议对文本中的错误表述进行修正。本发明能够利用大语言模型自动执行上述步骤,根据任意给定的知识图谱对大语言模型生成的文本进行修正。
-
公开(公告)号:CN113535973B
公开(公告)日:2023-06-23
申请号:CN202110632197.0
申请日:2021-06-07
Applicant: 中国科学院软件研究所 , 腾讯科技(深圳)有限公司
IPC: G06F16/36 , G06F16/35 , G06F40/205 , G06F40/30
Abstract: 本发明公开一种基于知识映射的事件关系抽取、语篇关系分析方法及装置,包括基于语言模型,挖掘事件文本中存在相似的词法与句法结构,得到特殊字词[CLS]的嵌入表示h[CLS];基于变分自编码的语义表示编码器,获取事件文本中可类推的语义关系表示hz;根据嵌入表示h[CLS]与语义关系表示hz进行粗粒度关系分类,并获得粗粒度类别嵌入表示利用嵌入表示h[CLS]、语义关系表示hz及粗粒度类别嵌入表示对事件文本中事件对的关系类别进行分类,得到事件关系抽取结果。本发明降低训练事件关系抽取数据要求,发现大量有价值的隐式事件关系,提升事件抽取及语篇分析的准确率,丰富了大量有价值的隐式事件关系后的事件知识图谱,能够更有效地提升下游自然语言理解任务性能。
-
-
-
-
-
-
-
-
-