-
公开(公告)号:CN111061935B
公开(公告)日:2022-04-12
申请号:CN201911292337.3
申请日:2019-12-16
Applicant: 北京理工大学
IPC: G06F16/951 , G06F16/9035 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于自注意力机制的科技写作推荐方法,属于计算机自然语言处理以及社交媒体技术领域。所述科技写作推荐方法,首先利用已有的段落写作内容,挖掘作者写作主题与意图,并以此初步筛选候选段落;其次设计了基于自注意力机制的深度科技写作推荐模型,用于获取上下文语境的深度语义表示,以对候选段落进行排序;通过将预测排序结果与真实排序结果进行比较,获取召回率和归一化折损累积增益,以评价写作推荐方法的好坏。所述方法与传统的基于内容的引文推荐方法相比,在一个真实的科技论文写作推荐中进行推荐预测,取得最高的召回率和归一化折损累积增益。
-
公开(公告)号:CN111061935A
公开(公告)日:2020-04-24
申请号:CN201911292337.3
申请日:2019-12-16
Applicant: 北京理工大学
IPC: G06F16/951 , G06F16/9035 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于自注意力机制的科技写作推荐方法,属于计算机自然语言处理以及社交媒体技术领域。所述科技写作推荐方法,首先利用已有的段落写作内容,挖掘作者写作主题与意图,并以此初步筛选候选段落;其次设计了基于自注意力机制的深度科技写作推荐模型,用于获取上下文语境的深度语义表示,以对候选段落进行排序;通过将预测排序结果与真实排序结果进行比较,获取召回率和归一化折损累积增益,以评价写作推荐方法的好坏。所述方法与传统的基于内容的引文推荐方法相比,在一个真实的科技论文写作推荐中进行推荐预测,取得最高的召回率和归一化折损累积增益。
-
公开(公告)号:CN110751038A
公开(公告)日:2020-02-04
申请号:CN201910875019.3
申请日:2019-09-17
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于图注意力机制的PDF表格结构识别方法,属于数据挖掘技术中的文档分析技术领域;包括以下步骤:一、预处理:获取表格中的所有单元格以及它们的位置坐标;二、图构建:对得到的单元格建立无向图;三、关系预测:通过对构建的无向图上的边进行分类,使用神经网络模型预测出单元格之间的邻接关系。对比现有技术,本发明首次提出解决PDF中复杂表格结构的识别方法,在两个表格结构识别数据集上都取得了最好的效果,尤其在复杂表格结构识别上,效果有明显的提高。
-
-