-
公开(公告)号:CN113342950B
公开(公告)日:2023-04-21
申请号:CN202110625585.6
申请日:2021-06-04
Applicant: 北京信息科技大学
IPC: G06F16/332 , G06F16/35 , G06F40/211 , G06F40/253 , G06F40/30 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/047 , G06N3/084
Abstract: 本发明提供一种基于语义联合的答案选取方法,文本预处理与输入层对原始数据预处理,删除无正确答案问题,将问题与答案语义联合拼成文段序列,使用特殊标志分割将问题和答案句子区分,得到格式数组;语义编码层将格式数组输入,用自注意力机制使单词成为隐藏文段中其他单词信息的语义向量,并输入向前传播层,得到文段的向量表示;特征提取层获取向量表示作为问题和答案的语义信息,用线性函数将高维向量转化为低维;并用进行特征提取,获得语义语法信息;语义关联层使用分类,对语义语法信息的相关联程度进行评分,得到二维向量,选取后一维度的数值,得到关联度。本发明的方法在问答数据集上表现出优越的性能,提取答案与问题关键信息能力显著。
-
公开(公告)号:CN114913530B
公开(公告)日:2025-02-11
申请号:CN202210440263.9
申请日:2022-04-25
Applicant: 北京信息科技大学
IPC: G06V30/148 , G06N3/0464 , G06F16/951 , G06F16/35 , G06V10/774 , G06V10/82 , G06N3/0442 , G06N3/045
Abstract: 本发明公开了一种审计凭证数字化方法及系统,包括:构建审计文档的图像资源库;利用OCA多阶段光学字符识别模型对图像资源库中图像进行文字识别,得到数字化的审计文档;利用ACPmarked架构对数字化的审计文档进行文本分类,去除审计无关的文字内容。本发明可以有效实现审计凭证的数字化,减轻审计专业人员的劳动强度,对提高审计效率和质量具有重要意义。
-
公开(公告)号:CN113342950A
公开(公告)日:2021-09-03
申请号:CN202110625585.6
申请日:2021-06-04
Applicant: 北京信息科技大学
IPC: G06F16/332 , G06F16/35 , G06F40/211 , G06F40/253 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于语义联合的答案选取方法,文本预处理与输入层对原始数据预处理,删除无正确答案问题,将问题与答案语义联合拼成文段序列,使用特殊标志分割将问题和答案句子区分,得到格式数组;语义编码层将格式数组输入,用自注意力机制使单词成为隐藏文段中其他单词信息的语义向量,并输入向前传播层,得到文段的向量表示;特征提取层获取向量表示作为问题和答案的语义信息,用线性函数将高维向量转化为低维;并用进行特征提取,获得语义语法信息;语义关联层使用分类,对语义语法信息的相关联程度进行评分,得到二维向量,选取后一维度的数值,得到关联度。本发明的方法在问答数据集上表现出优越的性能,提取答案与问题关键信息能力显著。
-
公开(公告)号:CN114913530A
公开(公告)日:2022-08-16
申请号:CN202210440263.9
申请日:2022-04-25
Applicant: 北京信息科技大学
IPC: G06V30/148 , G06N3/04 , G06K9/62 , G06F16/951 , G06F16/35 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种审计凭证数字化方法及系统,包括:构建审计文档的图像资源库;利用OCA多阶段光学字符识别模型对图像资源库中图像进行文字识别,得到数字化的审计文档;利用ACPmarked架构对数字化的审计文档进行文本分类,去除审计无关的文字内容。本发明可以有效实现审计凭证的数字化,减轻审计专业人员的劳动强度,对提高审计效率和质量具有重要意义。
-
-
-