信息提取方法及装置
    1.
    发明公开

    公开(公告)号:CN115293147A

    公开(公告)日:2022-11-04

    申请号:CN202210916980.4

    申请日:2022-08-01

    Abstract: 本说明书实施例提供信息提取方法及装置,其中所述信息提取方法包括:获取待处理文本和所述待处理文本对应的标记信息;基于所述标记信息对所述待处理文本进行数据预处理,获得待处理标记文本;将所述待处理标记文本输入至信息提取模型进行信息提取,获取所述信息提取模型输出的初始文本信息;将所述初始文本信息输入至信息校正模型进行信息校正,获取所述信息校正模型输出的目标文本信息。通过包括自回归解码器的信息提取模型可以结合上下文信息与当前轮语句直接预测出关键信息,并通过包括有非自回归解码器的信息校正模型对信息提取模型的预测结果进行校正处理,使得生成的目标文本信息更为准确,提高后续保险人员的作业效率。

    用于对训练样本进行分割的方法及装置

    公开(公告)号:CN115271098A

    公开(公告)日:2022-11-01

    申请号:CN202210914562.1

    申请日:2022-08-01

    Abstract: 本说明书实施例提供了用于对训练样本进行分割的方法及装置。在该方法中,根据主题对作为训练样本的对话文本进行分割,以得到各个主题对应的对话段落,其中,作为训练样本的结构化的表单按照主题分成多个表单分块,每个表单分块对应一个主题;在各个主题包括的同一类型的事件能够多次发生时,将该主题对应的对话段落按照类型的事件进行分割,以得到各个事件对应的对话片段;将所得到的各个对话片段与该对话片段对应的表单分块中的子分块确定为对应关系;以及将各个对话片段与对应的子分块以及未分割的各个对话段落与对应的表单分块确定为训练样本。

    对话中标问匹配方法、系统及装置

    公开(公告)号:CN112925894B

    公开(公告)日:2022-07-05

    申请号:CN202110331055.0

    申请日:2021-03-26

    Abstract: 本说明书实施例公开了一种对话中标问匹配方法、系统以及装置。其中,所述方法包括获取用户话语以及与所述用户话语对应的至少一个候选标问;获取对话状态跟踪信息,所述对话状态跟踪信息至少包括基于对话上文确定的与所述用户话语相关的关键词和/或意图;至少基于所述用户话语、所述至少一个候选标问以及所述对话状态跟踪信息,利用匹配模型,分别确定对应于每个候选标问的评估值;基于每一个候选标问的评估值,确定对应于所述用户话语的目标标问。通过使用用户对话中的对话状态跟踪信息来增加标准问题的匹配依据,提高对应于用户话语的目标问题匹配精度。

    用于对结构化摘要模型进行训练的方法及装置

    公开(公告)号:CN115237922A

    公开(公告)日:2022-10-25

    申请号:CN202210914964.1

    申请日:2022-08-01

    Abstract: 本说明书实施例提供了用于对结构化摘要模型进行训练的方法及装置。在该方法中,从结构化摘要模型所应用的表单中提取字段;按照表单中各个字段的填写难度对所提取的字段进行分类,以得到不同填写难度的字段类别;按照填写难度递增的字段类别顺序,对结构化摘要模型进行训练,直至针对字段类别顺序中的所有字段类别的训练完成:针对作为当前训练目标的目标字段类别,将目标字段类别以及比目标字段类别对应的填写难度更低的其他字段类别作为训练对象,使用对话样本数据以及各个训练对象对应的标签对结构化摘要模型进行训练;以及在针对目标字段类别的训练完成时,将字段类别顺序中的下一个字段类别确定为下一轮训练中的目标字段类别。

    地址文本处理方法及装置
    7.
    发明公开

    公开(公告)号:CN114638217A

    公开(公告)日:2022-06-17

    申请号:CN202210246775.1

    申请日:2022-03-14

    Abstract: 本说明书实施例提供了地址文本处理方法及装置,其中,一种地址文本处理方法包括:获取对语音数据进行识别获得的地址文本,对所述地址文本进行切分处理获得地址关键词;对所述地址关键词进行层级标注,并基于层级标注结果搜索与所述地址关键词匹配的标准地址关键词;根据所述地址文本、所述地址关键词以及所述标准地址关键词,构建地址层级关系图;利用所述地址层级关系图计算所述地址关键词以及处于各候选地址链路的所述标准地址关键词的权重,并根据所述权重计算所述各候选地址链路的链路权重;根据所述各候选地址链路的链路权重确定所述地址文本对应的目标地址链路。

    问答数据生成方法、装置、设备与存储介质

    公开(公告)号:CN117573816A

    公开(公告)日:2024-02-20

    申请号:CN202310835504.4

    申请日:2023-07-07

    Abstract: 本说明书实施例提供一种问答数据生成方法、装置、设备与存储介质,该方法包括:通过获取服务对话数据中的无答案问题数据和目标回答数据,从服务对话数据中确认与无答案问题数据关联的第一对话数据,确认与目标回答数据关联的第二对话数据,基于第一对话数据和无答案问题数据,确认与无答案问题数据匹配的答案数据,基于第二对话数据和目标回答数据,确认与目标回答数据匹配的目标问题数据,基于无答案问题数据、答案数据、目标回答数据和目标问题数据生成问答数据。

    用于对话机器人的知识库优化方法及装置

    公开(公告)号:CN116842162A

    公开(公告)日:2023-10-03

    申请号:CN202310887518.0

    申请日:2023-07-19

    Abstract: 本说明书实施例提供用于对话机器人的知识库优化方法及装置。响应于缺陷对话的缺陷类型指示对话机器人未返回正确答案且正确答案存在于对话机器人的知识库中,基于多模型融合方式来从知识库的至少一个候选答案中确定缺陷对话的用户问题的正确答案;以及将用户问题挂载到所确定出的正确答案所在知识点的扩展问列表。响应于缺陷类型指示对话机器人未返回正确答案且正确答案未存在于知识库中,根据用户问题执行基于知识点创建的知识库优化。

Patent Agency Ranking