一种非结构化文本表格识别方法和系统

    公开(公告)号:CN115424282A

    公开(公告)日:2022-12-02

    申请号:CN202211188303.1

    申请日:2022-09-28

    Abstract: 本发明提供了一种非结构化文本(包括所有格式的办公文档、文本、图片、各种报表和图像等)表格识别方法,涉及文本识别领域,该方法包括:采集数据集,首先把非结构化文本转化为图像类集合,然后对集合进行图像预处理,把图像集合作为数据集导入模型,对图像数据集的信息进行分析,检测出表格区域,把图像转换成序列,进行表格结构序列预测,检测出表格行结构,进行表格行识别,表格行单元格识别后,识别结果经过后处理,融合表格行结构和单元格文本内容,最终通过文本框和单元格内容进行匹配得到Excel形式的表格识别数据。该方法通过特征学习训练了模型,实现了非结构化文本数据信息的智能提取,有利于非结构化文本数据的进一步分析和实际应用,极大地节省了人力成本提高了工作效率,在一定程度上提高了表格检测速度和准确率,使用本发明所述的方法和系统,可以通过转化进行非结构化文本内容的分析和信息的识别提取,使得非结构化文本在各行各业中具有更好的实用价值和应用。

    一种基于文本生成的数据增强方法、系统及存储介质

    公开(公告)号:CN115392214A

    公开(公告)日:2022-11-25

    申请号:CN202211035627.1

    申请日:2022-08-26

    Abstract: 本发明公开了一种基于文本生成的数据增强方法、系统及存储介质,该方法以原始文本数据集为基础,通过自然语言处理技术实现文本生成,得到增强数据集。包括:获取某文本数据集,将文本合集中的文本内容作为文本数据增强的原始数据上传至临时存储区中;获取临时存储区中的文本内容,进行原始文本数据进行数据预处理和分句、分词和词性标注;对分词后的原始语句进行关键词抽取、命名实体识别,根据分词识别结果完成原始语句的分词状态标注;将带有分词状态标注的原始分词语句输入到文本生成模型生成目标增强语句;将原始语句集和目标增强语句集进行汇总,得到增强数据集。本发明有效地缓解了自然语言处理任务中数据量少、有效数据稀疏性等问题。

    一种橄榄核随形雕刻方法及系统

    公开(公告)号:CN110239270B

    公开(公告)日:2020-12-25

    申请号:CN201910537717.2

    申请日:2019-06-20

    Abstract: 本公开公开了一种橄榄核随形雕刻方法及系统,包括:获取标准雕刻工艺品外形数据,所述标准雕刻工艺品的外形数据,包括:标准雕刻工艺品的长度、每个点的切削深度和最大切削深度;获取待雕刻橄榄核的外形数据;所述待雕刻橄榄核的外形数据,包括:待雕刻橄榄核的长度和待雕刻橄榄核的每个点的高度;根据标准雕刻工艺品外形数据和待雕刻橄榄核的外形数据,计算出实际雕刻过程中待雕刻橄榄核每个点的切削深度;将实际雕刻过程中待雕刻橄榄核每个点的切削深度发送给雕刻机,雕刻机对橄榄核完成雕刻任务。

    基于多域高效特征聚合网络的齿轮缺陷检测方法及系统

    公开(公告)号:CN118898614B

    公开(公告)日:2025-01-28

    申请号:CN202411397545.0

    申请日:2024-10-09

    Abstract: 本发明提出了基于多域高效特征聚合网络的齿轮缺陷检测方法及系统,涉及计算机视觉应用领域,用于缺陷检测的多域高效特征聚合网络包括多域混合特征提取网络、多尺度特征聚焦传播融合网络以及检测头网络;所述多域混合特征提取网络,采用多域特征无损下采样模块在频域和空间域下对齿轮图像进行下采样,构建初始特征图,利用高效混合特征感知模块从局部和全局、空间和通道的角度对初始特征图进行增强,得到多尺度特征图;所述多尺度特征聚焦传播融合网络,对多尺度特征进行融合,得到融合后的特征图;所述检测头网络,根据融合后的特征图,检测齿轮缺陷;本发明构建多域高效特征聚合网络,进行鲁棒性强、精度高的齿轮缺陷检测。

    一种基于特征交互与关联融合的情感分析方法及系统

    公开(公告)号:CN119106100A

    公开(公告)日:2024-12-10

    申请号:CN202411174716.3

    申请日:2024-08-26

    Abstract: 本发明属于情感分析技术领域,尤其涉及一种基于特征交互与关联融合的情感分析方法及系统,方法包括:将获取的文本数据输入至BERT模型中,得到多层表示向量;将所有的中间层表示向量输入多层特征交互模块中,得到第一关联特征融合向量;将第一关联特征融合向量与最终层表示向量输入至动态关联融合模块中,得到分类文本特征向量;基于动态掩码的自适应丢弃方法对分类文本特征向量进行特征丢弃,之后经过全连接层和激活函数层得到待识别文本的情感类别。本发明将多层表示向量进行特征融合,能够充分利用模型输出的不同层次的语义表示,从而获得更加丰富和全面的特征信息,有助于提高模型对文本语义的理解能力和情感分析的准确性。

Patent Agency Ranking