对模型进行动态更新的方法及装置

    公开(公告)号:CN110689359A

    公开(公告)日:2020-01-14

    申请号:CN201910942780.4

    申请日:2019-09-30

    Inventor: 张望舒 温祖杰

    Abstract: 本说明书实施例提供一种对模型进行动态更新的方法和装置,根据该方法的一个实施方式,获取对应n个新增标签的m条训练数据,单个新增标签对应至少一条训练数据,m大于n;在当前模型的输出层添加n个输出节点,其中,n个输出节点与n个新增标签一一对应;基于输出层增加的n个输出节点,在当前模型的各个隐藏层分别按照预定规则增加至少一个隐藏层节点;使用m条训练数据对当前模型进行增量训练,得到增量模型;基于对增量模型的规模控制,完成模型的动态更新。该实施方式的重复执行可以提高模型的更新效率,以及模型的有效性。

    信息提取方法及装置
    12.
    发明公开

    公开(公告)号:CN115293147A

    公开(公告)日:2022-11-04

    申请号:CN202210916980.4

    申请日:2022-08-01

    Abstract: 本说明书实施例提供信息提取方法及装置,其中所述信息提取方法包括:获取待处理文本和所述待处理文本对应的标记信息;基于所述标记信息对所述待处理文本进行数据预处理,获得待处理标记文本;将所述待处理标记文本输入至信息提取模型进行信息提取,获取所述信息提取模型输出的初始文本信息;将所述初始文本信息输入至信息校正模型进行信息校正,获取所述信息校正模型输出的目标文本信息。通过包括自回归解码器的信息提取模型可以结合上下文信息与当前轮语句直接预测出关键信息,并通过包括有非自回归解码器的信息校正模型对信息提取模型的预测结果进行校正处理,使得生成的目标文本信息更为准确,提高后续保险人员的作业效率。

    查询文档排序方法、装置及电子设备

    公开(公告)号:CN112395405A

    公开(公告)日:2021-02-23

    申请号:CN202011602065.5

    申请日:2020-12-30

    Inventor: 张望舒 温祖杰

    Abstract: 本说明书一个或多个实施例提供一种查询文档排序方法、装置及电子设备,包括:基于训练样本集对作为老师模型的第一排序模型进行有监督的训练;其中,训练样本包括查询问句和与查询问句对应的查询文档,并被标注了指示查询文档与查询问句是否匹配的标签;第一排序模型包括对至少一个评分子模型进行模型融合得到的排序模型;评分子模型用于输出查询文档对应于查询问句的匹配度评分;基于第一排序模型输出的与训练样本集对应的排序结果对作为学生模型的第二排序模型进行预训练,并基于训练样本集对预训练后的第二排序模型进行模型微调;其中,第一排序模型和第二排序模型用于按照匹配度评分对与同一查询问句对应的多个查询文档进行排序。

    文本分类模型的训练方法及装置、文本分类方法及装置

    公开(公告)号:CN111382271A

    公开(公告)日:2020-07-07

    申请号:CN202010156375.2

    申请日:2020-03-09

    Abstract: 本说明书实施例提供一种文本分类模型的训练方法,此方法包括:首先,获取N个原始文本和对应的N个文本类别标签,其中N为大于1的正整数;接着,对N个原始文本进行拼接,得到拼接文本;然后,分别对N个文本类别标签进行独热编码,得到N个类别标签向量;再接着,对N个类别标签向量进行平均处理,得到综合标签向量;再然后,将该拼接文本输入文本分类模型中,得到综合分类结果;再基于该综合分类结果和该综合标签向量,训练所述文本分类模型。此外,本说明书实施例还提供一种文本分类方法,此方法包括:获取待分类的目标文本,并对其复制得到N个目标文本,进行拼接后输入利用上述训练方法得到的文本分类模型中,得到目标文本的文本分类结果。

    训练样本获取方法、装置及设备
    15.
    发明公开

    公开(公告)号:CN110688471A

    公开(公告)日:2020-01-14

    申请号:CN201910942797.X

    申请日:2019-09-30

    Abstract: 本说明书实施例提供一种训练样本获取方法、装置及设备,在获取方法中,收集两批已标注样本,包括第一批样本和第二批样本。第一批样本中的样本包括第一用户问句和第一标签,第一标签通过人工的方式标注。第二批样本中的样本包括第二用户问句和第二标签,第二标签通过自动的方式标注。基于第一批样本,训练样本分类模型。对于第二批样本,将第二用户问句输入样本分类模型,以得到第二用户问句对应于预定义的各个类别的预测概率。基于第二用户问句对应于预定义的各个类别的预测概率以及第二标签,确定预测结果与真实结果之间的差异度。当差异度大于第一阈值时,对第一样本进行编辑。基于编辑后的第二批样本和所述第一批样本,确定最终的训练样本。

    用于确定问题答案的方法及问答装置

    公开(公告)号:CN110516060A

    公开(公告)日:2019-11-29

    申请号:CN201911018680.9

    申请日:2019-10-24

    Inventor: 张望舒 温祖杰

    Abstract: 本说明书实施例提供用于确定问题答案的方法及装置。该方法由问答装置执行,该问答装置具备利用多个问答引擎进行问题答案确定的能力,多个问答引擎中的召回模型和第一评价模型分别组成召回模型层和评价模型层。在该方法中,使用召回模型层中的各个召回模型来分别获取问题的答案;将经由各个召回模型得到的答案提供给各个第一评价模型来分别进行评价,以得到各个答案的第一评价结果集,第一评价结果集包括基于各个第一评价模型得到的第一评价结果;针对各个答案,对所得到的第一评价结果集中的各个第一评价结果进行聚合处理,以得到该答案的第二评价结果;以及根据各个答案的第二评价结果进行答案评估,以确定问题的至少一个目标答案。

    医疗模型预训练的方法、装置、电子设备及存储介质

    公开(公告)号:CN118114743A

    公开(公告)日:2024-05-31

    申请号:CN202410536960.3

    申请日:2024-04-29

    Abstract: 本申请涉及人工智能技术领域,具体提供了一种医疗模型预训练的方法、装置、电子设备及存储介质。一种医疗模型预训练的方法,包括针对各预训练文本的医疗实体信息,对各预训练文本分别进行采样,获得各预训练文本分别对应的采样片段集合;采样片段集合中采样片段中至少包含医疗实体信息;对各预训练文本中的采样片段分别进行掩码处理,获得相应的损坏文本;通过文本预测通用模型,根据各损坏文本及其分别对应的采样片段集合进行文本预测,获得相应的文本预测结果;根据各预训练文本及文本预测结果,进行参数调整,直至获得训练好的医疗预训练模型。这样,提高了医疗预训练模型在医疗领域中的语义理解能力以及逻辑处理能力。

    答案生成方法、装置、设备与存储介质

    公开(公告)号:CN116932716A

    公开(公告)日:2023-10-24

    申请号:CN202310835514.8

    申请日:2023-07-07

    Abstract: 本说明书实施例提供一种答案生成方法、装置、设备与存储介质,该方法包括:通过获取问题数据和问题数据对应的对话数据,确认问题数据对应的问题特征编码数据和对话数据对应的对话特征编码数据,基于问题特征编码数据和对话特征编码数据,确认问题数据的答案分类结果、单跨度答案预测结果和多跨度答案预测结果,答案分类结果包括无答案、单跨度答案或多跨度答案中的任一种,基于答案分类结果、单跨度答案预测结果和多跨度答案预测结果,确认问题数据的答案。

    确定查询文本所对应标准文本的方法及装置

    公开(公告)号:CN110990533B

    公开(公告)日:2023-08-25

    申请号:CN201911203536.2

    申请日:2019-11-29

    Inventor: 张望舒 温祖杰

    Abstract: 本说明书实施例提供一种确定查询文本所对应标准文本的方法。该方法包括:首先,获取用户输入的查询文本。然后,一方面,将所述查询文本输入基于Bert的第一语义模型中,得到查询语义向量;另一方面,获取若干候选文本,所述若干候选文本是根据所述查询文本检索标准文本库而确定;再获取所述若干候选文本对应的若干候选语义向量,所述若干候选语义向量通过基于Bert的第二语义模型而确定。接着,将查询语义向量分别与若干候选语义向量进行综合处理,得到若干综合向量;再然后,分别将所述若干综合向量输入预先训练的关联度预测模型,得到所述查询文本与所述若干候选文本之间的若干关联度,以用于从所述若干候选文本中确定所述查询文本所对应的标准文本。

Patent Agency Ranking