一种年报文本结构识别方法

    公开(公告)号:CN110287784B

    公开(公告)日:2023-12-15

    申请号:CN201910416590.9

    申请日:2019-05-20

    Applicant: 暨南大学

    Abstract: 本发明公开了一种年报文本结构识别方法,体步骤为:步骤1:利用标题规则抽取TXT版本年报中的行,作为候选第一标题;步骤2:利用OpenCV基于视觉的图像处理技术,识别出PDF文件中具有标题特征的候选第二标题;步骤3:比对候选第一标题和候选第二标题形成候选第三标题;步骤4:利用信息熵计算标题行的左右互信息,对候选第三标题进行筛选形成企业年报小标题;步骤5:整理年报小标题形成企业年报目录结构涉及年报文本结构识别技术领域。该年报文本结构识别方法解决了PDF财务报告中不仅内嵌多种多样的表格,还嵌有类型各异的文件,这些表格和文件具有独立表格和独立文件的结构,分析难度大的问题。

    一种年报文本标题自动标注系统

    公开(公告)号:CN110287458B

    公开(公告)日:2023-05-02

    申请号:CN201910416616.X

    申请日:2019-05-20

    Applicant: 暨南大学

    Abstract: 本发明公开了一种年报文本标题自动标注系统,其具体方法为:A、对不同级别的一级标题和二级标题都要进行两次标注;B、匹配一级标题,第一次标注将完全和标题模板匹配,以及通过相似度计算达到阈值的一级标题别添加M、S标注,并筛选越级标注,第二次标注将通过相似度计算而标注的标题进行二次匹配涉及年报文本标题标注技术领域。该年报文本标题自动标注系统,发明选择采用机器视觉的方法对财务报告文本版面进行识别,并将机器视觉和规则统计文本抽取方法有机结合起来,以解决较难准确的对标题进行标注的问题。

    一种低能耗集群环境下的服务质量保证方法

    公开(公告)号:CN103108039B

    公开(公告)日:2015-07-22

    申请号:CN201310030340.4

    申请日:2013-01-25

    Applicant: 暨南大学

    Abstract: 本发明公开了一种低能耗集群环境下的服务质量保证方法,包括以下步骤:(1)集群系统接收来自用户的负载连接请求,将负载连接至各个集群节点;(2)根据当前t时刻前一段时间T内负载连接数之和的实际值预测系统在t+T时刻的负载连接数预测值V;(3)预测值V计算出系统在t+T时刻需要保持在工作状态下的集群节点个数N;(4)判断N是否大于A,若是,唤醒N-A个处于休眠状态下的集群节点,进入步骤(6);若否,则进入步骤(5);(5)判断A和N是否相等,若是,则进入步骤(6);若否,则进行节能调度,执行步骤(6);(6)本轮集群节点的调度完成,返回步骤(2)。本发明使得集群系统的功耗更低且服务质量更高。

    一种低能耗集群环境下的服务质量保证方法

    公开(公告)号:CN103108039A

    公开(公告)日:2013-05-15

    申请号:CN201310030340.4

    申请日:2013-01-25

    Applicant: 暨南大学

    Abstract: 本发明公开了一种低能耗集群环境下的服务质量保证方法,包括以下步骤:(1)集群系统接收来自用户的负载连接请求,将负载连接至各个集群节点;(2)根据当前t时刻前一段时间T内负载连接数之和的实际值预测系统在t+T时刻的负载连接数预测值V;(3)预测值V计算出系统在t+T时刻需要保持在工作状态下的集群节点个数N;(4)判断N是否大于A,若是,唤醒N-A个处于休眠状态下的集群节点,进入步骤(6);若否,则进入步骤(5);(5)判断A和N是否相等,若是,则进入步骤(6);若否,则进行节能调度,执行步骤(6);(6)本轮集群节点的调度完成,返回步骤(2)。本发明使得集群系统的功耗更低且服务质量更高。

    一种网络鲁棒性评估方法及系统

    公开(公告)号:CN111488711A

    公开(公告)日:2020-08-04

    申请号:CN202010282838.X

    申请日:2020-04-08

    Applicant: 暨南大学

    Inventor: 郑桦 邓原 梁倬骞

    Abstract: 本发明属于网络检测技术领域,尤其涉及一种网络鲁棒性评估方法及系统。所述方法包括:获取网络的初始参数,根据所述初始参数获取所述网络的初始负载模型,所述初始参数包括:所述网络的初始节点数、初始边数、初始随机游走者数、负载容限参数和负载削减参数;通过卷积神经网络模型用于对特征进行提取,并通过特征进行特征学习,网络中模拟基于随机游走的网络故障,并根据所述初始参数和所述初始负载模型对鲁棒图进行表征学习,提高了网络鲁棒图的获取的准确性。进一步,根据网络故障后网络重新稳定时对应的目标网路巨分量来评估网络的鲁棒性,不需要网络中所有节点的连接情况,数据处理量较小,提高了网络鲁棒性评估的速度和精度。

    一种基于动态信息分配的非等间隔联邦滤波方法

    公开(公告)号:CN111397597A

    公开(公告)日:2020-07-10

    申请号:CN202010269012.X

    申请日:2020-04-08

    Applicant: 暨南大学

    Inventor: 郑桦 邓原 梁倬骞

    Abstract: 本发明公开的属于动态信息技术领域,具体为一种基于动态信息分配的非等间隔联邦滤波方法,该方法如下:步骤一:设定主滤波器和子滤波器数量,进行信息平均分配;步骤二:设定检测信息,进行故障检测;步骤三:产生故障时,对产生故障的子滤波器进行数据消除;步骤七:代入到整体单元中后,对递进时产生的过渡信息进行刮削,刮削后进行刷新即可,能够针对产生的传感器故障,进行整体降级,使全局滤波器和局部滤波器呈比例状进行重置,同时在故障隔离后,重新调整故障的局部滤波器,使其呈递进式的过渡到整体单元中,再通过对过渡时间段进行刮削,有效的减少了故障恢复时长,提高故障恢复能力。

    一种年报文本结构识别方法

    公开(公告)号:CN110287784A

    公开(公告)日:2019-09-27

    申请号:CN201910416590.9

    申请日:2019-05-20

    Applicant: 暨南大学

    Abstract: 本发明公开了一种年报文本结构识别方法,体步骤为:步骤1:利用标题规则抽取TXT版本年报中的行,作为候选第一标题;步骤2:利用OpenCV基于视觉的图像处理技术,识别出PDF文件中具有标题特征的候选第二标题;步骤3:比对候选第一标题和候选第二标题形成候选第三标题;步骤4:利用信息熵计算标题行的左右互信息,对候选第三标题进行筛选形成企业年报小标题;步骤5:整理年报小标题形成企业年报目录结构涉及年报文本结构识别技术领域。该年报文本结构识别方法解决了PDF财务报告中不仅内嵌多种多样的表格,还嵌有类型各异的文件,这些表格和文件具有独立表格和独立文件的结构,分析难度大的问题。

    一种年报文本标题自动标注系统

    公开(公告)号:CN110287458A

    公开(公告)日:2019-09-27

    申请号:CN201910416616.X

    申请日:2019-05-20

    Applicant: 暨南大学

    Abstract: 本发明公开了一种年报文本标题自动标注系统,其具体方法为:A、对不同级别的一级标题和二级标题都要进行两次标注;B、匹配一级标题,第一次标注将完全和标题模板匹配,以及通过相似度计算达到阈值的一级标题别添加M、S标注,并筛选越级标注,第二次标注将通过相似度计算而标注的标题进行二次匹配涉及年报文本标题标注技术领域。该年报文本标题自动标注系统,发明选择采用机器视觉的方法对财务报告文本版面进行识别,并将机器视觉和规则统计文本抽取方法有机结合起来,以解决较难准确的对标题进行标注的问题。

    一种基于事件关联的桌面云搜索方法

    公开(公告)号:CN102508857A

    公开(公告)日:2012-06-20

    申请号:CN201110299737.4

    申请日:2011-09-29

    Applicant: 暨南大学

    Abstract: 本发明公开了一种基于时间关联的桌面云搜索方法,具体步骤是:(1)对存储本地文件使用的历史文件数据库进行监控,当这些文件被修改时则执行步骤(2)的操作;(2)内核给程序发出一个时间通知来唤醒程序,经过对上述对象事件的判定来构建结构体,然后执行步骤(3);(3)把步骤(2)中构建的结构体发送到预先约定的消息队列中,然后进程继续阻塞,等待下一个时间的到来,继续执行步骤(1);(4)对消息队列中的消息进行读取;(5)为用户提供一个图形前端界面;(6)程序搜索;(7)显示搜索结果。本发明将模糊的记忆和其相应的历史事件关联起来,通过关联的历史,也就是数据起源的方式,来准确定位搜索的信息。

Patent Agency Ranking