-
公开(公告)号:CN117235233B
公开(公告)日:2024-06-11
申请号:CN202311379778.3
申请日:2023-10-24
Applicant: 之江实验室
IPC: G06F16/332 , G06F40/205 , G06F18/214 , G06Q40/12
Abstract: 本发明公开了一种基于大模型的财报自动化问答方法和装置,该方法包括以下步骤:基于金融数据集和历年财报数据对基础开源大模型进行预训练和微调,构建具有财务问答能力的财报大模型;用户上传财报文件并输入问题至财报大模型,通过财报大模型对财报文件进行文件解析并生成答案返回给用户;构建数据库,其中包括历年财报数据、财报文件解析结果和对答案的打分结果;利用数据库中的信息通过反馈迭代机制对财报大模型进行迭代优化;利用优化后的财报大模型进行财报自动化问答。本发明方法能够有效提高财报分析的准确性和效率,适用于财务领域中对财报数据的智能化问答应用场景。
-
公开(公告)号:CN117094394B
公开(公告)日:2024-01-30
申请号:CN202311333807.2
申请日:2023-10-16
Applicant: 之江实验室
IPC: G06N5/022 , G06F16/2453 , G06F16/2455
Abstract: 本申请涉及一种基于论文PDF的天文多模态知识图谱构建方法和系统,其中,该方法包括:将预选的天文领域论文的PDF文档作为目标文档;将目标文档拆分为至少一张图片,得到目标图片;对目标图片中的图像、图注以及文本信息进行识别,得到图像文本对;根据天文领域中的实体,构建图谱本体;根据图像文本对和图谱本体,构建天文多模态知识图谱;基于天文多模态知识图谱,对目标资料进行检索,得到检索结果,通过本申请,解决了研究者无法从网络资料中快速检索到天文领域相关的目标资料问题,提高了研究者对天文领域相关的目标资料的检索效率。
-
公开(公告)号:CN117094394A
公开(公告)日:2023-11-21
申请号:CN202311333807.2
申请日:2023-10-16
Applicant: 之江实验室
IPC: G06N5/022 , G06F16/2453 , G06F16/2455
Abstract: 本申请涉及一种基于论文PDF的天文多模态知识图谱构建方法和系统,其中,该方法包括:将预选的天文领域论文的PDF文档作为目标文档;将目标文档拆分为至少一张图片,得到目标图片;对目标图片中的图像、图注以及文本信息进行识别,得到图像文本对;根据天文领域中的实体,构建图谱本体;根据图像文本对和图谱本体,构建天文多模态知识图谱;基于天文多模态知识图谱,对目标资料进行检索,得到检索结果,通过本申请,解决了研究者无法从网络资料中快速检索到天文领域相关的目标资料问题,提高了研究者对天文领域相关的目标资料的检索效率。
-
公开(公告)号:CN117370795A
公开(公告)日:2024-01-09
申请号:CN202311185301.1
申请日:2023-09-14
Applicant: 之江实验室
IPC: G06F18/214 , G06F18/213 , G06F21/62 , G06Q40/06 , G06Q40/03
Abstract: 本发明公开了一种基于结构化数据生成的模型解释方法和装置,利用任务相关的训练数据对生成式对抗网络模型进行训练,并利用训练后的生成式对抗网络模型生成结构化数据;对结构化数据中的连续特征进行预处理;对预处理后的特征进行采样得到各采样特征样本,并根据解释样例数据与各采样特征样本计算样本权重;基于各采样特征样本和样本权重筛选前K大的特征作为重要特征;基于各采样特征样本与重要特征构建进行线性回归得到用于解释的解释模型;应用时利用解释模型对解释样例数据在任务模型中起到的作用进行模型解释,该方法和装置被应用到金融领域和医疗领域,在保护数据隐私和安全的同时实现对模型做出决策的原理进行解释。
-
公开(公告)号:CN117349420A
公开(公告)日:2024-01-05
申请号:CN202311397489.6
申请日:2023-10-26
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/34 , G06N3/09 , G06F16/35
Abstract: 本发明公开了一种基于本地知识库和大型语言模型的回复方法,该方法通过将拆分的文章段落输入大型语言模型中得到与输入的段落相匹配的问题,从而能够较为高效的获得带有匹配标签的文章段落‑生成问题对,从而解决了现有技术的有监督学习中标签成本高的问题,进而能够高效的获得精召回模型;并且本发明通过大语言模型将精召回语料段落与对应的待召回问题的拼接结果进行分析直接得到针对待召回问题的回复,提升了用户的体验感。本发明还提供一种基于本地知识库和大型语言模型的回复装置。
-
公开(公告)号:CN117235233A
公开(公告)日:2023-12-15
申请号:CN202311379778.3
申请日:2023-10-24
Applicant: 之江实验室
IPC: G06F16/332 , G06F40/205 , G06F18/214 , G06Q40/12
Abstract: 本发明公开了一种基于大模型的财报自动化问答方法和装置,该方法包括以下步骤:基于金融数据集和历年财报数据对基础开源大模型进行预训练和微调,构建具有财务问答能力的财报大模型;用户上传财报文件并输入问题至财报大模型,通过财报大模型对财报文件进行文件解析并生成答案返回给用户;构建数据库,其中包括历年财报数据、财报文件解析结果和对答案的打分结果;利用数据库中的信息通过反馈迭代机制对财报大模型进行迭代优化;利用优化后的财报大模型进行财报自动化问答。本发明方法能够有效提高财报分析的准确性和效率,适用于财务领域中对财报数据的智能化问答应用场景。
-
公开(公告)号:CN117077679B
公开(公告)日:2024-03-12
申请号:CN202311332338.2
申请日:2023-10-16
Applicant: 之江实验室
IPC: G06F40/295 , G06F40/216 , G06F16/35
Abstract: 本申请涉及一种命名实体识别方法和装置。所述方法包括:获取专业知识数据库;其中,专业知识数据库包括至少两个粒度实体;确定与粒度实体对应的价值评分,基于价值评分从粒度实体中确定目标实体,并根据目标实体以及对应于目标实体的预设指令模板,得到提示指令模板;基于提示指令模板和获取到的待识别数据,生成第一待识别文本信息,对第一待识别文本信息进行命名实体识别处理,得到命名实体识别结果。采用本方法能够实现高效且准确地针对专业领域的专业型命名实体识别。
-
公开(公告)号:CN117173725B
公开(公告)日:2024-04-09
申请号:CN202311456584.9
申请日:2023-11-03
Applicant: 之江实验室
IPC: G06V30/412 , G06V30/416 , G06V30/262 , G06F40/30 , G06F40/232 , G06F40/242 , G06F18/22 , G06F18/20
Abstract: 本申请涉及一种表格信息处理方法、装置、计算机设备和存储介质。所述方法包括:获取包含待识别表格的待识别图片;基于文本检测识别模型,从待识别图片提取第一表格信息;根据表格信息处理规则,对第一表格信息进行处理,得到第二表格信息;从第二表格信息中提取各基础数据行对应的数据对,并将各数据行对应的数据对存储至数据库。本申请的方法,能够提高从待识别表格中获取的数据的准确性。
-
公开(公告)号:CN116910277B
公开(公告)日:2024-02-27
申请号:CN202311179454.5
申请日:2023-09-13
Applicant: 之江实验室
IPC: G06F16/36 , G06F16/332 , G06F16/338 , G06F16/383 , G06F16/901 , G06F40/284 , G06F40/30
Abstract: 本申请涉及一种知识图谱构建方法、资源查找方法、计算机设备和介质,通过获取资源对应的数据集,其中,资源包括天文学领域数据,数据集包括多个关键词以及每个关键词的属性,关键词的属性包括关键词在多个资源中的第一权重和关键词对应的资源标识;根据第一权重确定主关键词和副关键词,并将属于同一研究方向的副关键词与主关键词关联,其中,主关键词的第一权重大于副关键词的第一权重;分别在主关键词和副关键词之间构建知识图谱,其中,分别将主关键词和副关键词作为节点,将对应的资源标识和第一权重作为节点属性,将语义关系作为边,构建相应知识图谱,降低了知识图谱的规模,实现了关键词的交叉检索。
-
公开(公告)号:CN117173725A
公开(公告)日:2023-12-05
申请号:CN202311456584.9
申请日:2023-11-03
Applicant: 之江实验室
IPC: G06V30/412 , G06V30/416 , G06V30/262 , G06F40/30 , G06F40/232 , G06F40/242 , G06F18/22 , G06F18/20
Abstract: 本申请涉及一种表格信息处理方法、装置、计算机设备和存储介质。所述方法包括:获取包含待识别表格的待识别图片;基于文本检测识别模型,从待识别图片提取第一表格信息;根据表格信息处理规则,对第一表格信息进行处理,得到第二表格信息;从第二表格信息中提取各基础数据行对应的数据对,并将各数据行对应的数据对存储至数据库。本申请的方法,能够提高从待识别表格中获取的数据的准确性。
-
-
-
-
-
-
-
-
-