基于多条件输入的人脸伪造分割方法

    公开(公告)号:CN119296186A

    公开(公告)日:2025-01-10

    申请号:CN202411330378.8

    申请日:2024-09-24

    Abstract: 本发明涉及人工智能技术领域,提供了一种基于多条件输入的人脸伪造分割方法。方法包括:提取到图像中的特征底噪;提取到图像中的高频信息。构建一个多条件输入分割神经网络,对多条件输入分割神经网络进行高效微调训练,直至多条件输入分割神经网络收敛。利用训练好的多条件输入分割神经网络模型对图片进行推理,分割神经网络模型最终输出和原始图像大小一致的二值分割图,检测并定位图像中的人脸伪造区域。本发明通过提取伪造图像中的特征底噪和高频信息,并将这些信息作为额外条件和原始图像一起输入到分割网络中,利用设计好的多条件输入高效微调架构对模型进行训练,使得模型能够预测二值分割图,从而检测并精准定位图像中的人脸伪造区域。

    基于深度学习的甲骨文部首拆分匹配方法

    公开(公告)号:CN117333882A

    公开(公告)日:2024-01-02

    申请号:CN202311298964.4

    申请日:2023-10-07

    Abstract: 本发明提出一种基于深度学习的甲骨文部首拆分匹配方法,包括以下步骤:首先收集甲骨文与对应汉字图像数据,使用汉字识别工具得到标签;然后在部首拆分模块中,甲骨文图像经过调整后分割得到甲骨文部首图像,用于训练甲骨文特征提取模块;接着在部首匹配模块中,根据部首图像间的特征相似度与已破译汉字IDS序列,将甲骨文部首匹配对应的汉字部首;最后在组合破译模块中,提取甲骨文图像结构信息,结合匹配的汉字部首,寻找与之匹配的IDS序列,破译得到汉字。本发明使用无监督对比学习网络作为特征提取模块,结合IDS序列,能够在没有甲骨文部首对应汉字部首标签的情况下学习两者对应关系,完成甲骨文的分解破译。

    一种用于反诈与风险识别的多模态风险数据合成方法

    公开(公告)号:CN119479026A

    公开(公告)日:2025-02-18

    申请号:CN202411330384.3

    申请日:2024-09-24

    Abstract: 本发明涉及人工智能技术领域,提供了一种用于反诈与风险识别的多模态风险数据合成方法。方法包括:获取目标人脸图像、目标声音数据以及包含人脸和声音的视频;在获取的视频或图像中,通过深度伪造技术将原有人脸替换为目标人脸,将视频中的原始声音替换为目标声音;对生成的多模态数据中的图像和音频的标注;将伪造合成的多模态数据及其标注输入多模态大模型,对多模态数据进行识别和分析,生成风险摘要。本发明构建了一个系统化的多模态风险内容生成流程,满足了多模态大模型对高质量训练数据的需求,并通过将伪造数据与多模态大模型结合使用,从而充分发挥合成数据在风险分析中的优势,显著提升对复杂多模态场景中潜在风险的识别和应对能力。

    基于分类模型的甲骨文辅助破译分类方法及系统

    公开(公告)号:CN117315686A

    公开(公告)日:2023-12-29

    申请号:CN202311287573.2

    申请日:2023-10-07

    Abstract: 本发明公开了一种基于分类模型的甲骨文辅助破译分类方法,该方法包括:获取数据源,并基于所述数据源进行数据集的划分;训练分类模型,其中包括:将训练集输入训练模型中训练,在训练过程中,对训练集每一组图像中不同时期汉字图像进行特征系数加权;每轮训练结束后,输出由验证集得到的模型性能评估参数,根据这些参数的优劣筛选得到的分类模型;所有训练结束后,将测试集中的图片去除标签作为未破译甲骨文置于所述分类模型中进行预测,输出预测正确率高于预设数值的结果;基于分类模型,进行未破译甲骨文的分类和辅助破译。本方法方便地实现了甲骨文辅助破译的分类范式。本发明还提供了相应的基于分类模型的甲骨文辅助破译分类系统。

    一种基于多模态大模型的风险内容识别方法

    公开(公告)号:CN119339419A

    公开(公告)日:2025-01-21

    申请号:CN202411330377.3

    申请日:2024-09-24

    Abstract: 本发明涉及人工智能技术领域,提供了一种基于多模态大模型的风险内容识别方法。方法包括:识别音频中的伪造部分;对目标人脸图像提取底噪特征和高频特征输入图像分割模型,定位伪造区域;对目标人脸图像进行切块,将切块得到的局部区域图像和全局图像输入视觉编码器提取视觉特征;计算文本特征和全局图像特征对局部图像特征的注意力,丢弃注意力小的局部图像特征;将音频分割模型、图像分割模型的输出、图像特征和问题输入大语言模型中,总结出风险点。本发明通过整合多种数据来源,并基于多模态大模型进行风险识别,提高了识别的准确性和鲁棒性,还能够有效应对多种诈骗手段,解决了现有技术无法应对多个模态的数据和缺乏可解释性的问题。

    基于条件扩散模型的甲骨文辅助破译方法

    公开(公告)号:CN117333881A

    公开(公告)日:2024-01-02

    申请号:CN202311295878.8

    申请日:2023-10-07

    Abstract: 本发明公开了一种基于条件扩散模型的甲骨文辅助破译方法:收集和整理已破译的甲骨文文字在甲骨文、金文、大篆、隶书和楷书五个阶段的字形演变数据;将两个不同时期的文字图片进行配对,并进行固定尺寸的随机裁剪操作;构建一个条件扩散模型神经网络,将成对图片送入神经网络中进行训练,优化网络参数;输入一张甲骨文文字图片,利用训练好的条件扩散模型对图片进行逆向扩散,并使用加权滑动方法生成甲骨文字形演变图片。本发明提出了一个简单而有效的甲骨文字形演变生成模型,利用已破译甲骨文不同时期文字图片的监督信息,达到了输入甲骨文图片,模型能够预测生成其在任意时期的字形图片的目的,从而辅助甲骨文专家对未破译的甲骨文进行破译。

Patent Agency Ranking