-
公开(公告)号:CN117437464A
公开(公告)日:2024-01-23
申请号:CN202311366292.6
申请日:2023-10-20
Applicant: 北京邮电大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V20/70 , G06F40/289 , G06N3/045 , G06N3/084
Abstract: 本公开提供了一种图像有序分类模型训练方法及装置、电子设备、存储介质,该方法包括:获取多个类型的训练样本,每个训练样本中包含文本描述和对应于所述文本描述的第一图像;对所述文本描述进行分词处理,得到每个文本描述的分词;对各个文本描述中的第一分词进行第一排序处理,基于第一排序处理的结果对各个文本描述进行排序;其中,所述第一分词为每个文本描述中用于标识训练样本类型的分词;对每个文本描述中的第二分词进行第二排序处理;其中,所述第二分词为每个文本描述中除第一分词之外的分词;基于第一排序处理和第二排序处理后的文本描述以及所述第一图像训练图像有序分类模型。本公开可以解决相关技术中存在的过拟合问题。
-
公开(公告)号:CN119151774A
公开(公告)日:2024-12-17
申请号:CN202411373580.9
申请日:2024-09-29
Applicant: 北京邮电大学
IPC: G06T3/04 , G06T5/70 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08 , G06F3/0486 , G06F3/04845
Abstract: 本公开提供了一种图像拖拽编辑方法及系统,属于图像处理技术领域,该方法包括:基于第一图像和第一图像的拖拽点信息进行意图推理,得到N个语义意图;所述第一图像为拖拽编辑前的原始图像;基于N个语义意图分别对第一图像进行编辑,得到N个第二图像;所述N个第二图像用于指示用户从所述N个第二图像中选取目标图像。本公开提供的图像拖拽编辑方法及系统能够得到符合用户预期的拖拽编辑结果。
-
公开(公告)号:CN116450784A
公开(公告)日:2023-07-18
申请号:CN202310118446.3
申请日:2023-02-03
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F40/30 , G06F16/33 , G06N20/00
Abstract: 本发明涉及图像处理技术领域,提出了基于任务型对话的图像编辑系统,包括对话理解模块,用于根据输入的对话文本得到对话状态,所述对话状态包括用户要编辑的属性和编辑程度;图像编辑模块,用于接收用户输入图像和对话状态,根据对话状态对用户输入图像进行编辑,输出编辑后的图像;系统回复模块,用于输出系统回复信息;所述对话理解模块包括依次连接的编码器、解码器、第一线性层和Softmax函数,所述编码器和所述解码器均为N个,每一所述解码器的输出均设置一个适应器。通过上述技术方案,解决了现有技术中图像编辑方法在连续的图像编辑时出现历史编辑信息遗忘、用户需求理解偏差、系统交互不准确、不灵活的问题。
-
公开(公告)号:CN116450784B
公开(公告)日:2024-09-27
申请号:CN202310118446.3
申请日:2023-02-03
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F40/30 , G06F16/33 , G06N20/00
Abstract: 本发明涉及图像处理技术领域,提出了基于任务型对话的图像编辑系统,包括对话理解模块,用于根据输入的对话文本得到对话状态,所述对话状态包括用户要编辑的属性和编辑程度;图像编辑模块,用于接收用户输入图像和对话状态,根据对话状态对用户输入图像进行编辑,输出编辑后的图像;系统回复模块,用于输出系统回复信息;所述对话理解模块包括依次连接的编码器、解码器、第一线性层和Softmax函数,所述编码器和所述解码器均为N个,每一所述解码器的输出均设置一个适应器。通过上述技术方案,解决了现有技术中图像编辑方法在连续的图像编辑时出现历史编辑信息遗忘、用户需求理解偏差、系统交互不准确、不灵活的问题。
-
公开(公告)号:CN118445414A
公开(公告)日:2024-08-06
申请号:CN202410657457.3
申请日:2024-05-25
Applicant: 北京邮电大学
IPC: G06F16/35 , G06F16/583 , G06F16/332 , G06F40/30 , G06F16/9536 , G06Q50/00
Abstract: 本公开提供了一种虚假新闻检测方法及装置、电子设备、可读存储介质,属于深度学习技术领域,该方法包括:根据目标新闻中的第一文本特征和第一图像特征确定对应于目标新闻的语义关联数据;语义关联数据包括第一数据和第二数据;第一数据和第二数据为不同种类的数据;对第一数据进行处理得到第三数据;第三数据包括虚假痕迹信息;基于第二数据和第三数据对目标大语言模型进行训练;基于已训练的目标大语言模型进行虚假新闻检测。本公开基于多模态的数据处理技术,能够更能准确地反映新闻内容的真实性和完整性。
-
公开(公告)号:CN117912082A
公开(公告)日:2024-04-19
申请号:CN202410100065.7
申请日:2024-01-24
Applicant: 北京邮电大学
IPC: G06V40/16 , G06V10/82 , G06N3/0475 , G06N3/094
Abstract: 本公开提供了一种对抗人脸隐私保护方法,属于人脸识别技术领域,该方法包括:基于多个第一输入样本对对抗网络模型进行训练,以对对抗网络模型中的生成器参数和判别器参数进行第一阶段更新。第一输入样本为第一人脸图像。基于多个第二输入样本对对抗网络模型进行训练,以对对抗网络模型中的生成器参数和判别器参数进行第二阶段更新。第二输入样本为多个第二人脸图像。多个第二人脸图像对应的人员身份相同且面部变化不同。基于进行第二阶段更新后的生成器对人脸图像进行隐私保护。本公开提供的对抗人脸隐私保护方法能够提高人脸隐私保护的有效性和效率。
-
公开(公告)号:CN117788646A
公开(公告)日:2024-03-29
申请号:CN202410143913.2
申请日:2024-02-01
Applicant: 北京邮电大学
IPC: G06T11/60 , G06T5/70 , G06N3/0464 , G06N3/0455
Abstract: 本公开提供了一种图像生成方法及装置、电子设备、可读存储介质,属于人工智能技术领域,该方法包括:将第一图像和对应于第一图像的第一文本提示输入至第一模型中得到第一反演噪声;将第一反演噪声以及多个第二文本提示输入至第二模型得到对应于多个第二文本提示的多个第二图像;将第三图像以及对应于第三图像的第三文本提示输入至噪声估计模型中以对噪声估计模型中的可学习参数进行更新;可学习参数更新后的噪声估计模型用于进行图像生成。本公开提供的图像生成方法及装置、电子设备、可读存储介质可以更加细粒度地提取参考图像的风格,使文本提示可以很好的表征风格,还可以生成组合风格的图像。
-
公开(公告)号:CN119598382A
公开(公告)日:2025-03-11
申请号:CN202411424876.9
申请日:2024-10-12
Applicant: 北京邮电大学
Abstract: 本公开提供了一种混合来源的多模态错误信息检测方法及系统,属于错误信息检测技术领域,该方法包括:获取目标信息;将目标信息输入目标检测模型,判断目标信息是否为错误信息;目标检测模型为基于多类错误信息训练得到的多模态错误信息检测模型,多类错误信息的信息来源不同。本公开提供的混合来源的多模态错误信息检测方法及系统能够有效提高检测模型对复杂错误类型的适应性。
-
-
-
-
-
-
-