一种基于早停判断和多头解码的问答处理方法

    公开(公告)号:CN119903920A

    公开(公告)日:2025-04-29

    申请号:CN202411985989.6

    申请日:2024-12-31

    Abstract: 本发明公开了一种基于早停判断和多头解码的问答处理方法,涉及大模型问答处理技术领域,方法包括:获取用户在人机交互平台上输入的问题数据,将所述问题数据输入至预设大模型中进行处理,得到所述问题数据对应的答案数据;所述预设大模型包含hidden层、self‑att层以及FeedFroward层,通过设定早停判断机制以及多头解码机制进行训练。本方案通过早停判断机制以及多头解码机制,优化解码以及推理阶段,减少计算量,提高训练效率,通过上述方式可以提升预设大模型的训练效率,同时能够因减少计算量而导致预设大模型的训练精度更高,得到更贴近用户的问题数据的答案数据。

    一种文本向量表示方法、装置、电子设备及存储介质

    公开(公告)号:CN119849441A

    公开(公告)日:2025-04-18

    申请号:CN202510045420.X

    申请日:2025-01-13

    Abstract: 本发明涉及一种文本向量表示方法、装置、电子设备及存储介质,该方法包括:获取待表示文本,并确定所述待表示文本对应的特征图;确定预设的滑动窗口在所述特征图上滑动时对应的多个窗口特征图;对于每个所述窗口特征图,对该窗口特征图进行混合池化操作,得到该窗口特征图对应的目标特征,直到得到所有窗口特征图对应的目标特征。通过本发明的方法,通过混合池化操作可综合局部特征捕捉的能力以及保留信息完整性方面的优势,从而可准确通过目标特征表达每个窗口特征图的特征,进而可提升待表示文本的向量表示的质量。

    一种大模型检索增强生成的自适应切片的文档切分方法

    公开(公告)号:CN119903834A

    公开(公告)日:2025-04-29

    申请号:CN202411887946.4

    申请日:2024-12-20

    Abstract: 本发明公开了一种大模型检索增强生成的自适应切片的文档切分方法,涉及大模型检索增强生成技术领域,方法包括:获取待切分文档,并对所述待切分文档按照标题类型进行切分,得到至少一组原始切块;根据任一原始切块对应的信息密度以及主题变化度,计算该原始切块的最优切分数量;根据所述最优切分数量对该原始切块进行切分处理。本发明先将文档按照层次标题进行切分,然后计算层次标题下的信息密度和主题变化度,以层级标题为单位,自动计算该层级标题下的最优切分大小,来指导文档的自适应切分,以提高后续检索和生成任务的效果。

    基于融合注意力与动态卷积的机械图片数据集生成方法

    公开(公告)号:CN119888401A

    公开(公告)日:2025-04-25

    申请号:CN202411912230.5

    申请日:2024-12-24

    Abstract: 本发明公开了基于融合注意力与动态卷积的机械图片数据集生成方法,涉及大模型技术领域,方法包括:获取至少一张待识别机械图像,将所有待识别机械图像输入至大模型处理模块,生成每张待识别机械图像对应的机械类型以及标注信息;将所述机械类型、所述标注信息以及对应的待识别机械图像进行关联,生成一组数据信息,将所有组数据信息进行整合生成机械图片数据集;所述大模型处理模块包括多模态融合层、动态注意力机制层以及融合注意力与动态卷积的时空增强网络模块。本发明能够通过大模型处理模块可以自动从原始机械图像中提取、整理并标注出机械图片数据集,提高数据集生成的效率和准确性。

    基于多模态学习的目标分类方法、装置、设备及介质

    公开(公告)号:CN119884817A

    公开(公告)日:2025-04-25

    申请号:CN202411912711.6

    申请日:2024-12-24

    Abstract: 本发明涉及基于多模态学习的目标分类方法、装置、设备及介质,该方法包括:将待处理数据输入至预训练的分类模型中,得到待处理数据对应的分类结果;分类模型包括输入层用于接收待处理数据,深度可分离卷积层用于对每种数据进行逐通道卷积,得到每种数据对应的第一特征图,对每种数据对应的第一特征图进行逐点卷积,得到每种数据对应的第二特征图,基于每种数据对应的第一特征图和第二特征图,得到每种数据对应的第三特征图;多尺度特征融合层用于对所有数据对应的第三特征图进行融合处理得到融合特征图;输出层用于根据融合特征图得到分类结果。通过本发明的方法,可减少计算量并保持精度,从而可使得基于分类模型得到的分类结果更加准确。

    一种大模型检索增强生成中的RAG必要性判断方法

    公开(公告)号:CN119760080A

    公开(公告)日:2025-04-04

    申请号:CN202411870255.3

    申请日:2024-12-18

    Abstract: 本发明公开了一种大模型检索增强生成中的RAG必要性判断方法,涉及大模型检索增强生成技术领域,方法包括:获取用户在社交网站或社交媒体评论区或对话日志中提出的当前问题信息;针对所述当前问题信息,确定所述用户对应的事实倾向性分数;根据所述事实倾向性分数与预设倾向性分数之差,确定是否需要调用RAG对当前问题信息进行辅助回答。本发明通过对当前问题信息进行事实倾向性分数的计算可以有效的识别当前问题信息是否需要利用RAG的方式引用外部知识,通过判断RAG必要性来减少不必要的资源浪费,提升推理速度并避免因为RAG引入的知识而增加模型的混乱。

Patent Agency Ranking