-
公开(公告)号:CN111581970B
公开(公告)日:2023-01-24
申请号:CN202010396183.9
申请日:2020-05-12
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F40/289 , G06F40/30 , G06F40/126 , G06F40/216 , G06N3/048 , G06N3/09
Abstract: 本发明提出了一种网络语境的文本识别方法、装置及存储介质,该方法包括:基于文本长窗口构建风格语义模型,基于文本短窗口构建偏旁级语义模型;使用网络语境的语料库基于风格语义模型向量模型和偏旁级语义模型训练得到网络语境的中文词向量模型;使用所述网络语境的中文词向量模型对输入的网络语境的文本进行识别并输出识别结果。本发明在分词时使用两个不同窗口,长窗口用于提取网络化风格的语义信息,文本短窗口用于提取不同细粒度的语义特征,在训练阶段将二者结合,获得更加准确的词向量表达,以提高网络语境的文本识别率,本发明优化了目标函数,使得模型训练速度加快,在训练时,还建立了部首转义的方法,从而提高了文本的识别率。
-
公开(公告)号:CN115408495A
公开(公告)日:2022-11-29
申请号:CN202211023077.1
申请日:2022-08-25
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/33 , G06F16/35 , G06F16/9536 , G06F40/247 , G06F40/284 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本申请提出了一种基于多模态检索和关键词提取的社交文本增强方法,包括:S1、利用类别关键词抽取算法提取不同类别样本语句中的关键词;S2、采用RNN模型结合自注意力机制的方式,利用训练样本训练得到句子的生成模型,并根据所述训练样本对应类别的关键词控制所述生成模型的句子生成方向;S3、将原始语句输入到所述生成模型中,生成文本增强的第一生成语句;S4、基于多模态检索算法,判断所述第一生成语句是否存在所述关键词文件中的关键词,若是,则在所述第一生成语句中找出需要替换的关键词,并检索出所述需要替换的关键词的近义词进行替换,从而生成多个数据增强的第二生成语句。本申请具有能够对生成模型的生成方向、生成数量进行控制的效果。
-
公开(公告)号:CN112348015B
公开(公告)日:2022-11-18
申请号:CN202011238231.8
申请日:2020-11-09
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V20/62 , G06V10/22 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/04 , G06N3/08 , G06N5/04
Abstract: 本发明公开了一种基于级联神经网络的文字检测方法、装置及存储介质,该方法通过收集样本,并对样本进行处理生成数据集;搭建第一全卷积网络,通过数据集对第一全卷积网络进行训练至网络收敛,并通过训练后的第一全卷积网络对数据集进行推理,获得回归结果;搭建第二全卷积网络,通过回归结果对第二全卷积网络进行训练至网络收敛;将待验证图片输入第一全卷积网络,若第一全卷积网络判断在滑窗范围内存在文字,则裁剪下滑窗范围内的区域做双线性插值尺度变换并输入第二全卷积网络,通过第二全卷积网络判断区域是否为文字区域。该方法具有更好的泛化性能,并能够在保证检测准确率与召回率的同时,降低模型大小,从而提升文字检测算法性能。
-
公开(公告)号:CN115293920A
公开(公告)日:2022-11-04
申请号:CN202210971424.7
申请日:2022-08-12
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06Q50/00 , G06V10/74 , G06V10/762 , G06V10/80 , G06F40/295
Abstract: 本发明提出一种基于多模态数据的社交关系分析方法,包括:S1,提取人员的社交文本和社交图像信息,分别转换为文本特征和图像特征,并统计人员亲密度,基于人员亲密度构建人员社交网络图;S2,将文本特征和图像特征输入基于transformer的多模态融合模型,获得融合特征;S3,采用Si‑SCAN图聚类算法对人员社交网络图进行分析,获得社交关系聚类结果,其中,Si‑SCAN图聚类算法通过在SCAN算法基础上引入人员亲密度和融合特征信息构建。本发明基于文本、图像两个模态的信息对社交关系进行深入分析,通过多模态信息融合模型的设计,学习跨模态间的交互关系,生成多模态融合的图节点嵌入表征。通过图聚类分析,实现对社交网络的深层关系分析,能够有效发现潜在的社交关联。
-
公开(公告)号:CN115205605A
公开(公告)日:2022-10-18
申请号:CN202210966666.7
申请日:2022-08-12
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提出了一种多任务边缘特征提取的深伪视频图像鉴定方法,该方法包括如下步骤:S1、构建并获取图像鉴定所需训练数据;S2、搭建网络框架对图像进行图像特征提取和边缘特征提取;S3、对提取的图像特征和边缘特征进行展平和拼接处理;S4、获得图像类别的预测结果。通过添加对边缘生成的任务,能够让网络获取到边缘特征,利用这些特征进行进一步的分类,本发明能够解决传统特征提取耗时慢、计算量大的问题,让神经网络具有可解释性的同时提高网络的预测性能。
-
公开(公告)号:CN115147908A
公开(公告)日:2022-10-04
申请号:CN202210879588.7
申请日:2022-07-25
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本申请提出了一种基于图像patch序损失的人脸鉴伪方法,包括:S1、获取包含训练图像及其标签信息的人像鉴伪数据集;S2、对所述人像鉴伪数据集进行数据处理,包括:对所述训练图像进行均匀切割并打乱所述训练图像的初始patch序列集合,得到所述训练图像的第一patch序列集合;对所述第一patch序列集合进行增强处理,得到第二patch序列集合;将不同所述训练图像的所述第一patch序列集合和所述第二patch序列集合中的patch块进行随机交换,从而得到处理后的人像鉴伪数据集;S3、利用所述处理后的人像鉴伪数据集训练得到神经网络分类模型;S4、将待检测图像输入到所述神经网络分类模型中。本申请的人像鉴伪方法极大的节约了训练成本和数据收集成本,并且具有较高的判别准确性。
-
公开(公告)号:CN113822328B
公开(公告)日:2022-09-16
申请号:CN202110894433.6
申请日:2021-08-05
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明涉及防御对抗样本攻击的图像分类方法、终端设备及存储介质,该方法中包括:S1:采集原始图像和其对应的对抗样本;S2:构建图像分类模型,图像分类模型采用深度神经网络结构,并在深度神经网络中添加去噪模块,去噪模块包括非局部均值模块和自注意力机制模块;S3:将原始图片和对应的对抗样本混合后对图像分类模型进行训练;S4:采用训练后的图像分类模型对图像进行分类。本发明通过端到端的方式在卷积网络的中间层添加去噪模块来降低对抗图像的噪声扰动,去噪模块由非局部均值模块和自注意力机制模块相结合,能够达到去噪目的且能够与任意卷积层相衔接,从而提高模型的对抗鲁棒性,有效解决了对抗样本攻击深度学习系统存在的隐患。
-
公开(公告)号:CN113807392B
公开(公告)日:2022-09-16
申请号:CN202110896904.7
申请日:2021-08-05
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V10/764 , G06V10/80 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于多预处理特征融合的篡改图像鉴别方法,其可包括以下步骤:S1、收集样本,构建训练集与验证集;S2、搭建多预处理特征提取模块;S3、将训练集中的每一张图像通过多预处理特征提取模块处理得到相应特征,并对同一张图像获取到的特征以通道维度合并,形成该图像的特征张量;S4、将特征张量输入神经网络模型进行训练直到损失收敛;S5、将验证集输入训练好的神经网络模型,获取输出结果,若输出结果大于预设阈值,则判定该图像为篡改图像。本发明通过提前提取先验特征的方式,使得模型更容易拟合到相关特征,更易于训练,能够实现对多种篡改方式进行同时鉴别。
-
公开(公告)号:CN111126501B
公开(公告)日:2022-09-16
申请号:CN201911365650.5
申请日:2019-12-26
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06K9/62 , G06V10/762 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种图像识别方法、终端设备及存储介质,该方法包括以下步骤:S1:采集图像并对其进行标记后组成训练集;S2:通过训练集对神经网络模型进行训练,并对训练后的神经网络模型进行剪枝,剪枝过程如下:S21:输入每层卷积层的所有卷积核,设定卷积层的最大簇间距,层数i=N,N表示卷积层的总层数;S22:判断i
-
公开(公告)号:CN113807337B
公开(公告)日:2022-09-06
申请号:CN202110940583.6
申请日:2021-08-17
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V30/16 , G06V30/148 , G06V30/19
Abstract: 本发明涉及一种基于图连通的文本检测方法、终端设备及存储介质,该方法中包括:S1:采集具有单字符文本标注的图像组成训练集;S2:构建文字检测模型,通过训练集对模型进行训练;S3:将待处理图像输入训练后的文字检测模型中,剔除置信度较低的预测文本框后,将其他预测文本框组成集合B;S4:计算集合B中每两个预测文本框之间的第一参数GIoU和第二参数DHIoU;S5:将集合B中所有的预测文本框作为图节点构建无向图,若两节点之间满足GIoU小于第一阈值且DHIoU小于第二阈值,则设定两节点之间连通,否则不连通;S6:计算无向图的连通分量,并计算每个连通分量所包含节点的最小外接矩形,将最小外接矩形作为文本框。本发明能够快速的准确进行文本区域定位。
-
-
-
-
-
-
-
-
-