-
公开(公告)号:CN118114743B
公开(公告)日:2024-09-13
申请号:CN202410536960.3
申请日:2024-04-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本申请涉及人工智能技术领域,具体提供了一种医疗模型预训练的方法、装置、电子设备及存储介质。一种医疗模型预训练的方法,包括针对各预训练文本的医疗实体信息,对各预训练文本分别进行采样,获得各预训练文本分别对应的采样片段集合;采样片段集合中采样片段中至少包含医疗实体信息;对各预训练文本中的采样片段分别进行掩码处理,获得相应的损坏文本;通过文本预测通用模型,根据各损坏文本及其分别对应的采样片段集合进行文本预测,获得相应的文本预测结果;根据各预训练文本及文本预测结果,进行参数调整,直至获得训练好的医疗预训练模型。这样,提高了医疗预训练模型在医疗领域中的语义理解能力以及逻辑处理能力。
-
公开(公告)号:CN117453868A
公开(公告)日:2024-01-26
申请号:CN202311267005.6
申请日:2023-09-27
Applicant: 支付宝(杭州)信息技术有限公司 , 浙江大学
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F40/194 , G06N5/022
Abstract: 本说明书实施例提供一种多轮问答数据生成方法、装置、设备与存储介质,该方法包括:通过获取给定的上下文数据对应的第一三元组数据,基于第一三元组数据生成上下文数据的知识图谱,基于上下文数据生成单轮问答数据,确认单轮问答数据对应的第二三元组数据,将第二三元组数据与知识图谱进行匹配处理,得到序列化问答数据,在多轮对话场景下获取序列化问答数据中的待改写问题,基于序列化问答数据中待改写问题对应的历史对话数据对待改写问题进行改写,以得到目标问题,采用目标问题替换待改写问题,以得到序列化问答数据对应的多轮问答数据。
-
公开(公告)号:CN119294510A
公开(公告)日:2025-01-10
申请号:CN202411252149.9
申请日:2024-09-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供了一种基于知识图谱的医疗LLM模型推理方法及相关设备。其中,知识图谱包含多个节点和连接节点的边,节点代表实体,边代表实体之间的关系。该方法包括:获取用户输入的目标对话文本,并从知识图谱中查找出与目标对话文本中包含的实体提及相关的子图;子图中包括代表目标实体的目标节点,以及与目标节点连接的若干邻居节点;从用户输入的包含目标对话文本的多轮对话文本中获取目标实体的若干属性的属性值;基于子图以及目标实体的若干属性的属性值,构建与目标对话文本对应的对话图;根据对话图和目标对话文本构建提示词,并将提示词输入至LLM模型中,由LLM模型基于提示词进行逻辑推理。
-
公开(公告)号:CN115145928B
公开(公告)日:2024-08-16
申请号:CN202210914555.1
申请日:2022-08-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/22 , G06F16/2458 , G06F16/28 , G06F16/783
Abstract: 本说明书实施例提供了模型训练方法及装置、结构化摘要获取方法及装置。在针对结构化摘要模型的训练方法中,获取包括多轮对话的对话文本;将结构化摘要模型所应用的表单中的各个字段对应的字段标记添加至对话文本中,以得到带有字段标记的第一对话文本;按照第一对话文本中的各个字段标记的顺序,将各个字段对应的标签进行拼接,以得到标签文本,其中,标签文本中的相邻两个标签之间使用分隔符来隔离;以及使用第一对话文本和标签文本对结构化摘要模型进行训练。
-
公开(公告)号:CN118114743A
公开(公告)日:2024-05-31
申请号:CN202410536960.3
申请日:2024-04-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本申请涉及人工智能技术领域,具体提供了一种医疗模型预训练的方法、装置、电子设备及存储介质。一种医疗模型预训练的方法,包括针对各预训练文本的医疗实体信息,对各预训练文本分别进行采样,获得各预训练文本分别对应的采样片段集合;采样片段集合中采样片段中至少包含医疗实体信息;对各预训练文本中的采样片段分别进行掩码处理,获得相应的损坏文本;通过文本预测通用模型,根据各损坏文本及其分别对应的采样片段集合进行文本预测,获得相应的文本预测结果;根据各预训练文本及文本预测结果,进行参数调整,直至获得训练好的医疗预训练模型。这样,提高了医疗预训练模型在医疗领域中的语义理解能力以及逻辑处理能力。
-
公开(公告)号:CN117407494A
公开(公告)日:2024-01-16
申请号:CN202311265875.X
申请日:2023-09-27
Applicant: 支付宝(杭州)信息技术有限公司 , 浙江大学
IPC: G06F16/332 , G06F16/35 , G06F40/117 , G06F40/194 , G06F40/279
Abstract: 本说明书实施例提供对话知识点生成方法及装置。在生成对话知识点时,首先,确定多会话序列中的各个会话词元的词元级显著性信息、话语级显著性信息和会话级显著性信息,所确定出的词元级显著性信息、话语级显著性信息和会话级显著性信息分别用于反映会话词元在词元级、话语级和会话级的知识点关联度。随后,对各个会话词元的词元级显著性信息、话语级显著性信息和会话级显著性信息进行显著性信息融合;并使用各个会话词元的经过融合后的显著性信息来指导基于多会话序列中的会话词元的对话知识点生成。
-
公开(公告)号:CN116932716A
公开(公告)日:2023-10-24
申请号:CN202310835514.8
申请日:2023-07-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/35 , G06F18/24 , G06F18/214 , G06F16/9032
Abstract: 本说明书实施例提供一种答案生成方法、装置、设备与存储介质,该方法包括:通过获取问题数据和问题数据对应的对话数据,确认问题数据对应的问题特征编码数据和对话数据对应的对话特征编码数据,基于问题特征编码数据和对话特征编码数据,确认问题数据的答案分类结果、单跨度答案预测结果和多跨度答案预测结果,答案分类结果包括无答案、单跨度答案或多跨度答案中的任一种,基于答案分类结果、单跨度答案预测结果和多跨度答案预测结果,确认问题数据的答案。
-
公开(公告)号:CN116842163A
公开(公告)日:2023-10-03
申请号:CN202310889195.9
申请日:2023-07-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06N5/04
Abstract: 本说明书实施例提供基于数据驱动的对话效果优化方法、装置及对话机器人。在进行对话效果优化时,从对话机器人的人机对话日志中提取出对话片段,所提取的对话片段包括针对用户发起问题的完整会话内容。随后,对所提取出的对话片段进行缺陷检测,以检测出缺陷对话,并根据所检测出的缺陷对话中的用户问题,优化对话机器人的知识库。
-
公开(公告)号:CN115145928A
公开(公告)日:2022-10-04
申请号:CN202210914555.1
申请日:2022-08-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/22 , G06F16/2458 , G06F16/28 , G06F16/783
Abstract: 本说明书实施例提供了模型训练方法及装置、结构化摘要获取方法及装置。在针对结构化摘要模型的训练方法中,获取包括多轮对话的对话文本;将结构化摘要模型所应用的表单中的各个字段对应的字段标记添加至对话文本中,以得到带有字段标记的第一对话文本;按照第一对话文本中的各个字段标记的顺序,将各个字段对应的标签进行拼接,以得到标签文本,其中,标签文本中的相邻两个标签之间使用分隔符来隔离;以及使用第一对话文本和标签文本对结构化摘要模型进行训练。
-
公开(公告)号:CN117573816A
公开(公告)日:2024-02-20
申请号:CN202310835504.4
申请日:2023-07-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/9032 , G06N5/02
Abstract: 本说明书实施例提供一种问答数据生成方法、装置、设备与存储介质,该方法包括:通过获取服务对话数据中的无答案问题数据和目标回答数据,从服务对话数据中确认与无答案问题数据关联的第一对话数据,确认与目标回答数据关联的第二对话数据,基于第一对话数据和无答案问题数据,确认与无答案问题数据匹配的答案数据,基于第二对话数据和目标回答数据,确认与目标回答数据匹配的目标问题数据,基于无答案问题数据、答案数据、目标回答数据和目标问题数据生成问答数据。
-
-
-
-
-
-
-
-
-