-
公开(公告)号:CN113535961B
公开(公告)日:2024-06-07
申请号:CN202110886442.0
申请日:2021-08-03
Applicant: 公安部第三研究所
IPC: G06F16/35
Abstract: 本发明涉及一种基于小样本学习实现多语言混合短文本分类处理的系统,其中,该系统包括数据采集模块,用于将少量预设标签样本输入至该系统;数据预处理模块,用于对所述的预设标签样本进行数据预处理;模型计算处理模块,用于进行关键特征提取,并生成相应的模型准确率计算结果;模型生成及输出模块,用于预测出当前文本数据的模型预测结果,并通过对所述的模型预测结果的抽样审核处理,进一步更新迭代该输出模型。本发明还涉及一种相应的方法、装置、处理器及其存储介质。采用了本发明的该系统、方法、装置、处理器及其存储介质,利用小样本学习较省时省力的完成对大规模数据潜在信息的挖掘,有效获取构词信息及词互相关信息,具有较大的创新性。
-
公开(公告)号:CN116959011A
公开(公告)日:2023-10-27
申请号:CN202310904151.9
申请日:2023-07-21
Applicant: 公安部第三研究所
Abstract: 本发明涉及一种身份证证件识别与信息提取的方法,其中,所述的方法包括以下步骤:通过底图采集、人工去除文字与头像、人工标注文字与头像坐标、生成基础证件、模拟光照、几何变换、样本分级、背景填充进行证件数据的生成处理;提出IDYolo模型对获取到的证件数据进行识别训练;最后使用成熟OCR提取方法对证件数据进行提取。本发明还涉及一种相应的装置、处理器及其计算机可读存储介质。采用了本发明的该身份证证件识别与信息提取的方法、装置、处理器及其计算机可读存储介质,从训练数据、证件识别模型、后处理三方面进行设计,有效提高了相机拍摄角度不完全垂直带来的几何畸变、背景多样造成的证件检测漏报、闪光灯等点光源造成的漏检问题。
-
公开(公告)号:CN119202945A
公开(公告)日:2024-12-27
申请号:CN202411298650.9
申请日:2024-09-18
Applicant: 公安部第三研究所
IPC: G06F18/2431 , G06F18/25 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本发明涉及一种基于自适应动态路径修剪实现层次多粒度标签识别处理的方法,包括以下步骤:获取内容编码特征;获取关系编码特征;更新内容编码特征;构建语义注意力矩阵;进行层次多标签分类。本发明还涉及一种用于实现基于自适应动态路径修剪进行层次多粒度标签识别处理的装置、处理器及其可读存储介质。采用了本发明的基于自适应动态路径修剪实现层次多粒度标签识别处理的方法、装置、处理器及其计算机可读存储介质,可依据大模型的动态感知能力与深度图神经网络的语义表征能力,实现对层次多标签文本的精准分类。该模型通过大模型的动态路径修剪技术优化层次多粒度识别并提升图神经网络模型的稳定性;提高了分类准确性,还增强了对数据扰动的鲁棒性,具有较大的创新性。
-
公开(公告)号:CN115357568A
公开(公告)日:2022-11-18
申请号:CN202210988682.6
申请日:2022-08-17
Applicant: 公安部第三研究所
IPC: G06F16/215 , G06F16/26 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明涉及一种基于时、空域可信图神经网络计算实现社交信息发现的方法,其中,该方法包括以下步骤:(1)获取社交网络图基础信息进行社交媒体文本数据的采集,并进行数据预处理;(2)对社交网络图进行基础图计算及构建处理;(3)通过图信息嵌入,获得社交行为高阶信号的编码分析;(4)根据社交行为高阶信号的编码分析结果得到相关的判别特征,从而预测重要社交关注群体及关键传播路径,供用户潜在行为交互信息的挖掘。本发明还涉及一种相应的装置、处理器及其存储介质。采用了本发明的该基于时、空域可信图神经网络计算实现社交信息发现的方法、装置、处理器及其存储介质,能够有效的获取帐号社交信息及某类群组信息,具有较大的创新性。
-
公开(公告)号:CN117688150A
公开(公告)日:2024-03-12
申请号:CN202311576591.2
申请日:2023-11-23
Applicant: 公安部第三研究所
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F16/35 , G06N5/04 , G06N5/022 , G06F40/30 , G06F40/289 , G06F18/2415 , G06N3/042 , G06N3/0464 , G06N3/0499
Abstract: 本发明涉及一种基于触发词位置编码实现大型语言模型与知识图谱意图对齐处理的方法,包括以下步骤:获取用户意图;分解意图;进行指令映射;通过生成的KG指令从本地知识图谱库中检索知识;进行知识汇聚;利用LLM生成最终的答案。本发明还涉及一种用于实现基于触发词位置编码的大型语言模型与知识图谱意图对齐处理的装置、处理器及存储介质。采用了本发明的基于触发词位置编码实现大型语言模型与知识图谱意图对齐处理的方法、装置、处理器及其计算机可读存储介质,利用深度神经网络模型做到对用户意图和指令的对齐,融合了触发词的位置信息,确保查询语句的准确性。该方法利用深度学习模型较省时省力的完成LLM与本地KG的交互,有效生成用户意图所需的信息,具有较大的创新性。
-
公开(公告)号:CN113535961A
公开(公告)日:2021-10-22
申请号:CN202110886442.0
申请日:2021-08-03
Applicant: 公安部第三研究所
IPC: G06F16/35
Abstract: 本发明涉及一种基于小样本学习实现多语言混合短文本分类处理的系统,其中,该系统包括数据采集模块,用于将少量预设标签样本输入至该系统;数据预处理模块,用于对所述的预设标签样本进行数据预处理;模型计算处理模块,用于进行关键特征提取,并生成相应的模型准确率计算结果;模型生成及输出模块,用于预测出当前文本数据的模型预测结果,并通过对所述的模型预测结果的抽样审核处理,进一步更新迭代该输出模型。本发明还涉及一种相应的方法、装置、处理器及其存储介质。采用了本发明的该系统、方法、装置、处理器及其存储介质,利用小样本学习较省时省力的完成对大规模数据潜在信息的挖掘,有效获取构词信息及词互相关信息,具有较大的创新性。
-
-
-
-
-