一种多模态知识分层识别和受控对齐方法

    公开(公告)号:CN118133946A

    公开(公告)日:2024-06-04

    申请号:CN202410551376.5

    申请日:2024-05-07

    Abstract: 本发明属于多模态知识对齐技术领域,具体涉及一种多模态知识分层识别和受控对齐方法。所述方法包括:获取业务领域关键词,构建领域词向量模型;对服务场景进行归类,基于领域词向量模型,生成每一类服务场景的向量特征集合;采集多模态知识内容,对所述多模态知识内容进行分层格式化处理,并基于领域向量模型,形成多模态知识的特征集;将生成的多模态知识特征与每一类服务场景的向量特征进行相似度判断,若相似度值大于预设的对齐灰度阈值,则当前多模态知识向与服务场景对齐;重复上述完成多模态知识体系构建。以统一接口融合不同模态,改进多模态知识内容识别和管理的困难。

    一种领域问答集自动构建方法及其构建系统

    公开(公告)号:CN118245588A

    公开(公告)日:2024-06-25

    申请号:CN202410657791.9

    申请日:2024-05-27

    Abstract: 一种领域问答集自动构建方法及其构建系统,涉及自然语言处理技术领域。为了解决现有的领域问答集构建周期长、耗时耗力、泛化能力差、仅包含单一模态的缺陷,本发明采用大模型对领域原始数据进行预处理和特征提取;生成初始问答集;对下游小模型进行训练和验证;根据验证结果对大模型进行参数调优;对调优后的所述大模型进行绩效评估,若绩效评估不满足预设阈值,则对所述大模型进行迭代优化,直至大模型的绩效评估达到预设阈值,停止继续迭代优化。本发明主要用于构建特定领域的领域问答集。

    一种多模态知识分层识别和受控对齐方法

    公开(公告)号:CN118133946B

    公开(公告)日:2024-07-23

    申请号:CN202410551376.5

    申请日:2024-05-07

    Abstract: 本发明属于多模态知识对齐技术领域,具体涉及一种多模态知识分层识别和受控对齐方法。所述方法包括:获取业务领域关键词,构建领域词向量模型;对服务场景进行归类,基于领域词向量模型,生成每一类服务场景的向量特征集合;采集多模态知识内容,对所述多模态知识内容进行分层格式化处理,并基于领域向量模型,形成多模态知识的特征集;将生成的多模态知识特征与每一类服务场景的向量特征进行相似度判断,若相似度值大于预设的对齐灰度阈值,则当前多模态知识向与服务场景对齐;重复上述完成多模态知识体系构建。以统一接口融合不同模态,改进多模态知识内容识别和管理的困难。

    一种领域问答集自动构建方法及其构建系统

    公开(公告)号:CN118245588B

    公开(公告)日:2024-08-06

    申请号:CN202410657791.9

    申请日:2024-05-27

    Abstract: 一种领域问答集自动构建方法及其构建系统,涉及自然语言处理技术领域。为了解决现有的领域问答集构建周期长、耗时耗力、泛化能力差、仅包含单一模态的缺陷,本发明采用大模型对领域原始数据进行预处理和特征提取;生成初始问答集;对下游小模型进行训练和验证;根据验证结果对大模型进行参数调优;对调优后的所述大模型进行绩效评估,若绩效评估不满足预设阈值,则对所述大模型进行迭代优化,直至大模型的绩效评估达到预设阈值,停止继续迭代优化。本发明主要用于构建特定领域的领域问答集。

Patent Agency Ranking