一种大模型检索增强生成中关于文档切分效果评估的方法

    公开(公告)号:CN119761377A

    公开(公告)日:2025-04-04

    申请号:CN202411868956.3

    申请日:2024-12-18

    Abstract: 本发明公开了一种大模型检索增强生成中关于文档切分效果评估的方法,涉及文档切分技术领域,方法包括:获取待评估文档的进行切分处理后得到的切分对,按照顺序将切分对输入至通用语义模型中,得到每个切分对对应的目标评价值,基于评价值与效果等级对应关系,确定所有目标评价值对应的目标效果等级;通用语义模型的训练过程具体为:对训练文档进行切分得到至少两个原始切块;对任一原始切块进行随机切分,得到预设个数的切片;按照语义是否存在相关性进行标注,得到n组训练样本;计算任一组训练样本对应的目标相关性分数以及目标分离性分数,确定该训练样本对应的评价值。本发明可以反馈每个文档对应的分割效果的评分也可以有助于辅助文档切分。

    一种大模型检索增强生成的自适应切片的文档切分方法

    公开(公告)号:CN119903834A

    公开(公告)日:2025-04-29

    申请号:CN202411887946.4

    申请日:2024-12-20

    Abstract: 本发明公开了一种大模型检索增强生成的自适应切片的文档切分方法,涉及大模型检索增强生成技术领域,方法包括:获取待切分文档,并对所述待切分文档按照标题类型进行切分,得到至少一组原始切块;根据任一原始切块对应的信息密度以及主题变化度,计算该原始切块的最优切分数量;根据所述最优切分数量对该原始切块进行切分处理。本发明先将文档按照层次标题进行切分,然后计算层次标题下的信息密度和主题变化度,以层级标题为单位,自动计算该层级标题下的最优切分大小,来指导文档的自适应切分,以提高后续检索和生成任务的效果。

    基于融合注意力与动态卷积的机械图片数据集生成方法

    公开(公告)号:CN119888401A

    公开(公告)日:2025-04-25

    申请号:CN202411912230.5

    申请日:2024-12-24

    Abstract: 本发明公开了基于融合注意力与动态卷积的机械图片数据集生成方法,涉及大模型技术领域,方法包括:获取至少一张待识别机械图像,将所有待识别机械图像输入至大模型处理模块,生成每张待识别机械图像对应的机械类型以及标注信息;将所述机械类型、所述标注信息以及对应的待识别机械图像进行关联,生成一组数据信息,将所有组数据信息进行整合生成机械图片数据集;所述大模型处理模块包括多模态融合层、动态注意力机制层以及融合注意力与动态卷积的时空增强网络模块。本发明能够通过大模型处理模块可以自动从原始机械图像中提取、整理并标注出机械图片数据集,提高数据集生成的效率和准确性。

    基于多模态学习的目标分类方法、装置、设备及介质

    公开(公告)号:CN119884817A

    公开(公告)日:2025-04-25

    申请号:CN202411912711.6

    申请日:2024-12-24

    Abstract: 本发明涉及基于多模态学习的目标分类方法、装置、设备及介质,该方法包括:将待处理数据输入至预训练的分类模型中,得到待处理数据对应的分类结果;分类模型包括输入层用于接收待处理数据,深度可分离卷积层用于对每种数据进行逐通道卷积,得到每种数据对应的第一特征图,对每种数据对应的第一特征图进行逐点卷积,得到每种数据对应的第二特征图,基于每种数据对应的第一特征图和第二特征图,得到每种数据对应的第三特征图;多尺度特征融合层用于对所有数据对应的第三特征图进行融合处理得到融合特征图;输出层用于根据融合特征图得到分类结果。通过本发明的方法,可减少计算量并保持精度,从而可使得基于分类模型得到的分类结果更加准确。

    一种大模型检索增强生成中的RAG必要性判断方法

    公开(公告)号:CN119760080A

    公开(公告)日:2025-04-04

    申请号:CN202411870255.3

    申请日:2024-12-18

    Abstract: 本发明公开了一种大模型检索增强生成中的RAG必要性判断方法,涉及大模型检索增强生成技术领域,方法包括:获取用户在社交网站或社交媒体评论区或对话日志中提出的当前问题信息;针对所述当前问题信息,确定所述用户对应的事实倾向性分数;根据所述事实倾向性分数与预设倾向性分数之差,确定是否需要调用RAG对当前问题信息进行辅助回答。本发明通过对当前问题信息进行事实倾向性分数的计算可以有效的识别当前问题信息是否需要利用RAG的方式引用外部知识,通过判断RAG必要性来减少不必要的资源浪费,提升推理速度并避免因为RAG引入的知识而增加模型的混乱。

    一种数据处理方法、装置、电子设备及计算机存储介质

    公开(公告)号:CN119848538A

    公开(公告)日:2025-04-18

    申请号:CN202411829906.4

    申请日:2024-12-12

    Abstract: 本发明涉及一种数据处理方法、装置、电子设备及计算机存储介质,该方法包括:获取针对目标领域的待处理数据;根据预训练的目标分类模型,对所述待处理数据进行分类处理,得到所述待处理数据的分类结果,其中,所述目标分类模型是基于小数据量的第一训练集、第一网络确定的初始累计梯度,以及基于初始累计梯度、第二网络的初始权重矩阵和小数据量的第二训练集确定的第二权重矩阵训练得到的。通过本发明的方法,可基于小数据量的训练样本,对目标网络进行微调,训练得到目标分类模型,以使得到的目标分类模型可准确的对目标领域的待处理数据进行准确的分类。

Patent Agency Ranking