一种融合段落和文档特征的金融公告事件抽取方法

    公开(公告)号:CN118673919A

    公开(公告)日:2024-09-20

    申请号:CN202410713191.X

    申请日:2024-06-04

    Abstract: 本发明公开了一种融合段落和文档特征的金融公告事件抽取方法,涉及金融领域与信息抽取技术领域,具体如下:步骤1.对金融公开数据集ChFinAnn中的金融公告文本进行数据预处理工作,将金融公告划分为段落;步骤2.利用Fin‑BERT预训练模型、卷积神经网络以及自注意力机制对金融公告进行段落特征的提取;步骤3.利用word2vec模型和双向长短期记忆网络对金融公告进行文档特征的提取;步骤4.将经过Fin‑BERT预训练模型得到的段落分类向量送入卷积神经网络,对金融公告中的事件进行分类判断;步骤5.将提取到的段落特征与文档特征融合后,通过双向长短期记忆网络与条件随机场对金融公告中的事件进行事件论元识别抽取。本发明达到了较好的事件抽取性能,具有较高的准确率。

    一种煤层气井筛管
    2.
    发明公开

    公开(公告)号:CN111927406A

    公开(公告)日:2020-11-13

    申请号:CN202010799967.6

    申请日:2020-08-11

    Abstract: 本发明实施例提供了一种煤层气井筛管,为了解决筛管堵塞的问题,通过清洗组件套设在第一支撑杆上,第一支撑杆具有螺旋凸起,并且此螺旋凸起围绕所述第一支撑杆设置且至少设置一周,这样位于第一支撑杆一端的清理组件的一侧受到冲击力时,清理组件沿着第一支撑杆的螺旋凸起,螺旋式朝向清理组件的另一侧方向转动至第一支撑杆的另一端。这样由于清理组件中的清理部接触于筛管内壁,因此,在清理组件螺旋式前进的过程中,通过清理部清刷筛管内壁及筛管缝隙,以提升筛管的自洁程度,进一步加强对筛管的清洁效果。

    一种面向证券信息披露长文档的表格分类方法

    公开(公告)号:CN116562251B

    公开(公告)日:2024-09-27

    申请号:CN202310569275.6

    申请日:2023-05-19

    Abstract: 本发明公开了一种面向证券信息披露长文档的表格分类方法,具体如下:步骤1、获得证券信息披露长文档的PDF文件,并进行解析;步骤2、依据关键词和上下文抽取算法,从解析后的PDF结构的证券信息披露长文档中抽取待分析的表格及其上下文;步骤3、预处理表格及其上下文,形成词嵌入模型训练上下文样本集合与表格分类样本集合;步骤4、通过上下文样本集合训练词嵌入模型;步骤5、使用训练获得的词嵌入模型对预处理后的表格及其上下文进行词嵌入表示,并使用不同的多尺度卷积神经网络,对表格及其上下文进行特征提取;步骤6、对提取到的表格及其上下文特征采取特征扩展融合方式,得到特征融合结果进行表格分类。本发明能快速准确的获取待分析表格。

    一种PDF业务文档的信息抽取方法

    公开(公告)号:CN116311259B

    公开(公告)日:2024-03-12

    申请号:CN202211562314.1

    申请日:2022-12-07

    Abstract: 本发明公开了一种PDF业务文档的信息抽取方法,涉及文件信息抽取和数据处理领域,包括如下步骤:步骤1、对PDF业务文档的每个页面进行解析,得到表格线列表;步骤2、若能够为一个字符对象生成最小单元格,则判定该字符对象为表格字符;否则判定该字符对象为非表格字符;步骤3、对所有的非表格字符以坐标信息进行拼接、分段,完成非表格区域的文本抽取,并得到每个非表格字符段的中心点的坐标;步骤4、根据非表格字符段的中心点的坐标,对所有最小单元格所属的表格区域进行划分,得到表格区域列表;步骤5、对表格区域列表完成结构和区域文本的抽取。本方法能够提高PDF业务文档,尤其是包含复杂表格的金融披露文档中信息抽取的精度。

    一种面向证券信息披露长文档的表格分类方法

    公开(公告)号:CN116562251A

    公开(公告)日:2023-08-08

    申请号:CN202310569275.6

    申请日:2023-05-19

    Abstract: 本发明公开了一种面向证券信息披露长文档的表格分类方法,具体如下:步骤1、获得证券信息披露长文档的PDF文件,并进行解析;步骤2、依据关键词和上下文抽取算法,从解析后的PDF结构的证券信息披露长文档中抽取待分析的表格及其上下文;步骤3、预处理表格及其上下文,形成词嵌入模型训练上下文样本集合与表格分类样本集合;步骤4、通过上下文样本集合训练词嵌入模型;步骤5、使用训练获得的词嵌入模型对预处理后的表格及其上下文进行词嵌入表示,并使用不同的多尺度卷积神经网络,对表格及其上下文进行特征提取;步骤6、对提取到的表格及其上下文特征采取特征扩展融合方式,得到特征融合结果进行表格分类。本发明能快速准确的获取待分析表格。

    一种PDF业务文档的信息抽取方法

    公开(公告)号:CN116311259A

    公开(公告)日:2023-06-23

    申请号:CN202211562314.1

    申请日:2022-12-07

    Abstract: 本发明公开了一种PDF业务文档的信息抽取方法,涉及文件信息抽取和数据处理领域,包括如下步骤:步骤1、对PDF业务文档的每个页面进行解析,得到表格线列表;步骤2、若能够为一个字符对象生成最小单元格,则判定该字符对象为表格字符;否则判定该字符对象为非表格字符;步骤3、对所有的非表格字符以坐标信息进行拼接、分段,完成非表格区域的文本抽取,并得到每个非表格字符段的中心点的坐标;步骤4、根据非表格字符段的中心点的坐标,对所有最小单元格所属的表格区域进行划分,得到表格区域列表;步骤5、对表格区域列表完成结构和区域文本的抽取。本方法能够提高PDF业务文档,尤其是包含复杂表格的金融披露文档中信息抽取的精度。

    一种自旋转自清洁的煤层气井筛管

    公开(公告)号:CN114183096B

    公开(公告)日:2022-08-26

    申请号:CN202111501558.4

    申请日:2021-12-09

    Abstract: 本发明提供了一种自旋转自清洁的煤层气井筛管,包括:筛管本体,筛管本体设有若干条贯穿筛管本体壁面的切割缝隙;清洁组件,包括若干个感应器和若干个清洁器,所述感应器安装于所述筛管本体的内侧壁,用于监测所述筛管本体内的液体流量,所述清洁器可拆卸地安装在所述内侧壁上,感应器与清洁器连接;感应器监测到所述液体流量处于预设的正常流量的范围时,控制清洁器的清洁部处于静止状态,监测到所述液体流量低于预设的清洗流量时,启动所述清洗部清洗筛管本体;旋转盘,安装在筛管本体的底部,且通讯连接感应器,用于监测筛管本体的重量和控制筛管本体自转。

    一种煤层气井筛管
    9.
    发明授权

    公开(公告)号:CN111927406B

    公开(公告)日:2021-03-12

    申请号:CN202010799967.6

    申请日:2020-08-11

    Abstract: 本发明实施例提供了一种煤层气井筛管,为了解决筛管堵塞的问题,通过清洗组件套设在第一支撑杆上,第一支撑杆具有螺旋凸起,并且此螺旋凸起围绕所述第一支撑杆设置且至少设置一周,这样位于第一支撑杆一端的清理组件的一侧受到冲击力时,清理组件沿着第一支撑杆的螺旋凸起,螺旋式朝向清理组件的另一侧方向转动至第一支撑杆的另一端。这样由于清理组件中的清理部接触于筛管内壁,因此,在清理组件螺旋式前进的过程中,通过清理部清刷筛管内壁及筛管缝隙,以提升筛管的自洁程度,进一步加强对筛管的清洁效果。

    一种自旋转自清洁的煤层气井筛管

    公开(公告)号:CN114183096A

    公开(公告)日:2022-03-15

    申请号:CN202111501558.4

    申请日:2021-12-09

    Abstract: 本发明提供了一种自旋转自清洁的煤层气井筛管,包括:筛管本体,筛管本体设有若干条贯穿筛管本体壁面的切割缝隙;清洁组件,包括若干个感应器和若干个清洁器,所述感应器安装于所述筛管本体的内侧壁,用于监测所述筛管本体内的液体流量,所述清洁器可拆卸地安装在所述内侧壁上,感应器与清洁器连接;感应器监测到所述液体流量处于预设的正常流量的范围时,控制清洁器的清洁部处于静止状态,监测到所述液体流量低于预设的清洗流量时,启动所述清洗部清洗筛管本体;旋转盘,安装在筛管本体的底部,且通讯连接感应器,用于监测筛管本体的重量和控制筛管本体自转。

Patent Agency Ranking