一种基于BERT的自动填补空缺文本方法

    公开(公告)号:CN112395841B

    公开(公告)日:2022-05-13

    申请号:CN202011291822.1

    申请日:2020-11-18

    Applicant: 福州大学

    Inventor: 柯逍 卢恺翔

    Abstract: 本发明提出一种基于BERT的自动填补空缺文本方法,包括以下步骤;步骤S1:以公开完型填空CLOTH数据集作为训练数据基础,利用分词器对进行预处理,提取出文章的内容和填空选项;步骤S2:将处理过的数据集通过联合调节所有层中的上下文来预先训练深度双向表示模型;并利用预训练模型提供语言模型,通过额外的输出层对其进行微调,最后以加入问题的位置信息和该语言模型共同组成编码器;步骤S3:用全连接层、gelu激活函数层、归一层和全连接层依次堆叠,构成解码器,并将编码器结果输入到解码器解码;步骤S4:以解码器的输出预测出空格处应该出现的单词;本发明能够实现利用人工智能完成对有空缺的文本进行预测和校对,辅助校对人员进行审查出版书本的工作。

    一种基于BERT的自动填补空缺文本方法

    公开(公告)号:CN112395841A

    公开(公告)日:2021-02-23

    申请号:CN202011291822.1

    申请日:2020-11-18

    Applicant: 福州大学

    Inventor: 柯逍 卢恺翔

    Abstract: 本发明提出一种基于BERT的自动填补空缺文本方法,包括以下步骤;步骤S1:以公开完型填空CLOTH数据集作为训练数据基础,利用分词器对进行预处理,提取出文章的内容和填空选项;步骤S2:将处理过的数据集通过联合调节所有层中的上下文来预先训练深度双向表示模型;并利用预训练模型提供语言模型,通过额外的输出层对其进行微调,最后以加入问题的位置信息和该语言模型共同组成编码器;步骤S3:用全连接层、gelu激活函数层、归一层和全连接层依次堆叠,构成解码器,并将编码器结果输入到解码器解码;步骤S4:以解码器的输出预测出空格处应该出现的单词;本发明能够实现利用人工智能完成对有空缺的文本进行预测和校对,辅助校对人员进行审查出版书本的工作。

    基于YOLOV5的自然场景文本检测与识别方法

    公开(公告)号:CN115205839A

    公开(公告)日:2022-10-18

    申请号:CN202210785742.4

    申请日:2022-07-05

    Applicant: 福州大学

    Inventor: 柯逍 卢恺翔

    Abstract: 本发明提出一种基于YOLOV5的自然场景文本检测与识别方法,包括:步骤S1:获取自然场景文本图像数据集,将对应标签转换为YOLOV5所需要的格式;步骤S2:用YOLOV5的轻量级特征提取器提取图像文本的位置信息和深层的语义信息;利用跨层连接和空间金字塔池化层将浅层特征和深层特征结合;在跨层连接中加入形变卷积,使得网络能够更好地处理特征图尺度的变化;步骤S3:利用Kmeans算法聚合过的锚框拟合真实文本框的长宽比,并预测锚框与真实框的偏差;利用长卷积处理特征,让锚框的长宽比更贴合真实文本框;步骤S4:利用双向LSTM和注意力机制对齐文本特征并预测文本序列;其能够实现利用深度学习完成对自然场景文本进行检测和识别,且轻量级足以实现在移动端部署。

Patent Agency Ranking