一种基于多任务学习的文档图像校正方法和装置

    公开(公告)号:CN117727039A

    公开(公告)日:2024-03-19

    申请号:CN202311746693.4

    申请日:2023-12-19

    Abstract: 本发明公开了一种基于多任务学习的文档图像校正方法和装置,该方法包括:文档图像输入、文档分类、目标检测、关键点定位、四方向分类、畸变校正、角度校正、输出结果;本发明还公开了一种基于多任务学习的文档图像校正模型训练方法和装置,该方法包括:文档图像训练数据采集、输入数据预处理、Backbone特征提取、Neck特征融合、Head输出,还包括损失函数确定。本发明利用多任务学习方法,将目标检测、关键点定位、四方向分类和文档分类结合在一起,共同完成文档图像校正任务,其在解决文档图像因拍摄和扫描过程导致的旋转、倾斜和畸变的问题时,可以实现任务之间的信息和特征共享,提高模型效率,提升校正性能,提升后续任务的准确度,具有准确高效的特点。

    文本分类方法、文本分类装置、系统及可读存储介质

    公开(公告)号:CN115455183A

    公开(公告)日:2022-12-09

    申请号:CN202211059854.8

    申请日:2022-08-31

    Abstract: 本发明提出了一种文本分类方法、文本分类装置、系统及可读存储介质。文本分类方法,包括:根据文本分类参数从多个预选分类模型中确定第一模型以及多个第二模型;根据第一文本数据对多个第二模型进行训练,并确定训练后的多个第二模型的多个输出数据;根据多个输出数据以及第一文本数据对第一模型进行训练;对训练后的第一模型进行优化处理,并对优化处理后的第一模型进行压缩处理;根据压缩后的第一模型对待分类文本进行文本分类处理;优化处理用于提升第一模型的训练程度。

    一种基于大模型编排的机器人流程自动化方法及装置

    公开(公告)号:CN117726157A

    公开(公告)日:2024-03-19

    申请号:CN202311772447.6

    申请日:2023-12-21

    Inventor: 付立波 方高林

    Abstract: 本发明公开了一种基于大模型编排的机器人流程自动化方法、装置、设备及存储介质,方法包括:步骤a、Agent模块接收用户的RPA任务请求,进行意图识别初筛后转发给大模型LLM模块;步骤b、Agent模块接收大模型LLM模块返回的RPA程序,进行验证检查,包括:RPA程序已经是完整、可执行时的确认验证步骤;RPA程序中包含技能调用需根据技能调用结果进行后续编排时的验证步骤(动态编排);RPA程序中包含技能调用且技能的参数缺失,或者RPA程序中某些指令的参数缺失时的验证步骤等;步骤c.重复b验证检查步骤,直到任务编排完成。本发明可以实现RPA任务从执行到编排过程的全部自动化,大大减轻了人的工作量;还可以实现动态编排从而可以扩大LLM可自动编排的RPA任务的范围。

    信息分类方法、信息分类装置以及可读存储介质

    公开(公告)号:CN115563990A

    公开(公告)日:2023-01-03

    申请号:CN202211181226.7

    申请日:2022-09-27

    Abstract: 本发明提出了一种信息分类方法、信息分类装置和可读存储介质,信息分类方法包括:在接收到第一信息的情况下,提取第一信息的多个目标关键词;根据多个目标关键词,确定预设词库中每个意图类别对应的第一参数,第一参数与多个目标关键词在每个意图类别对应的词汇集合中的占比相关联;根据第一参数,确定多个意图类别中的目标意图类别;其中,预设词库包括多个意图类别和多个词汇集合,词汇集合与意图类别一一对应,能够满足2B领域数据量小的使用需求,实现服务器资源的合理配置,同时不需要进行大量计算和训练,能够提高信息意图类别的识别和响应速度。

    基于大语言模型的表格问答方法、设备、介质及程序产品

    公开(公告)号:CN119441432A

    公开(公告)日:2025-02-14

    申请号:CN202411513366.9

    申请日:2024-10-28

    Abstract: 本发明公开了基于大语言模型的表格问答方法、设备、介质及程序产品,方法包括:首先利用文件上传界面接收用户上传的表格文件,将表格文件的内容进行向量化并存入向量库;接收到用户发送的问题请求后,利用大语言模型在表格文件中确定问题请求对应的目标列;根据问题请求和表格各行的索引列拼接所得字符串之间的向量相似度,确定问题请求对应的目标行;利用目标行和目标列,构建问题请求对应的问题子表;最后基于大语言模型,根据问题请求和问题子表,输出答复结果。本发明能够使得大语言模型在最大处理长度有限的情况下针对大体量表格内容进行准确作答。

Patent Agency Ranking