-
公开(公告)号:CN112990220B
公开(公告)日:2022-08-05
申请号:CN202110417894.4
申请日:2021-04-19
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及人工智能技术领域,特别涉及一种图像中目标文本智能识别方法。该方法步骤如下:将目标文本由像素点坐标表示,输入目标文本像素点坐标值对像素坐标识别神经网络进行训练,获得文本自编码模型和目标文本的表述特征;根据区域的高度值计算背景区域数量,提取覆盖背景区域,剩余区域为前景区域;利用训练好的文本自编码模型在前景区域中获得待识别的文本的表述特征,将文本的表述特征与期望的目标文本的表述特征进行对比判断,若两者误差达到预设阈值,则识别文字为目标文本。本发明还提供一种图像中目标文本智能识别系统。本发明通过基于文本自编码模型来识别目标文本,能够精准定位目标文本在图像中的位置,计算复杂度低,识别准确率高。
-
公开(公告)号:CN109241438B
公开(公告)日:2022-06-24
申请号:CN201811128658.5
申请日:2018-09-27
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F40/30 , G06F40/284
Abstract: 本发明公开了一种基于要素的跨通道热点事件发现方法、装置及存储介质,本发明融合某一领域的新闻报道数据与微博数据,通过联合两个通道提取的要素与文本语义相似度分析,有利于发现该领域热点事件,并且更全面细致的了解热点事件。
-
公开(公告)号:CN113672963A
公开(公告)日:2021-11-19
申请号:CN202111002320.7
申请日:2021-08-30
Applicant: 国家计算机网络与信息安全管理中心 , 恒安嘉新(北京)科技股份公司
Inventor: 佟玲玲 , 时磊 , 段东圣 , 井雅琪 , 段运强 , 任博雅 , 周强 , 赵天夫 , 傅强 , 蔡琳 , 阿曼太 , 梁彧 , 马寒军 , 田野 , 王杰 , 杨满智 , 金红 , 陈晓光
IPC: G06F21/60
Abstract: 本申请实施例公开了一种基于彩虹表的匹配方法、装置、存储介质及电子设备。该方法包括:获取移动应用的目标数据;其中,所述目标数据用于表征加密后的移动应用数据;所述目标数据包括文本数据、图片数据、语音数据以及视频数据中的至少一种;所述移动应用用于表征采用端对端通讯方式的应用;利用预先配置的彩虹表,对所述目标数据进行匹配,获得目标关键词;其中,所述彩虹表中包括关键词链表的初始关键词和结束关键词,用于破解加密关键词。本技术方案,能够支持移动应用关键词匹配,并且不需要解密移动应用通信信息内容,保护了用户隐私。且对移动应用匹配具备快速部署的优势。
-
公开(公告)号:CN110610230A
公开(公告)日:2019-12-24
申请号:CN201910698120.6
申请日:2019-07-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种台标检测方法、装置及可读存储介质,该方法包括如下步骤:获取台标数据集,并对所述台标数据集进行分组获得台标训练集;构建多损失融合的孪生神经网络,并基于所述台标训练集对所构建的多损失融合的孪生神经网络进行训练获得训练后的多损失融合的孪生神经网络;通过所述训练后的多损失融合的孪生神经网络对待测台标进行检测。本发明方法通过构建孪生神经网络框架,很好地消除了样本数量不足对训练网络带来的影响,可以更好地检测未知的新的种类的敏感台标。
-
公开(公告)号:CN109471932A
公开(公告)日:2019-03-15
申请号:CN201811415780.0
申请日:2018-11-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/332 , G06F16/35 , G06F17/27 , G06N3/08
Abstract: 本发明公开了一种基于学习模型的谣言检测方法、系统及存储介质,其中检测方法包括:构建新闻语料库;构建博文语料库;对新闻语料库中的数据进行模型训练,获得第一分类器模型;对博文语料库中的数据进行特征提取,获得训练特征,利用训练特征进行模型训练获得第二分类器模型;利用第一分类器模型和第二分类器模型对社交平台中的博文数据进行谣言检测。本发明通过对新闻数据中的谣言和非谣言数据进行采集构建新闻语料库,再进行模型训练获得第一训练模型;再对社交平台中的谣言和非谣言数据进行采集构建博文语料库,再进行模型训练获得第二训练模型,最后利用两个训练模型对社交平台中的数据进行谣言检测,使最终的检测结果更加准确可靠。
-
公开(公告)号:CN104361037B
公开(公告)日:2017-12-19
申请号:CN201410591807.7
申请日:2014-10-29
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种微博分类方法及装置。该方法包括:步骤1,对训练语料集合进行预处理,对预处理后的训练语料进行分词,获取候选特征,并对候选特征进行权重计算,根据权重计算结果进行特征选择,获取最终的分类特征;步骤2,根据最终的分类特征,采用贝叶斯分类器进行模型训练,获取分类模型;步骤3,采用贝叶斯分类器根据分类模型对微博文档进行分类。借助于本发明的技术方案,提高了分类的召回率与准确率。
-
公开(公告)号:CN106201441A
公开(公告)日:2016-12-07
申请号:CN201610539099.1
申请日:2016-07-08
Applicant: 汉柏科技有限公司 , 国家计算机网络与信息安全管理中心
CPC classification number: G06F9/30 , G06F9/5027 , G06F9/5044 , G06F9/505
Abstract: 本发明实施例公开一种网络设备中CPU利用率的获取方法及装置。所述方法包括:获取在预设时间段内CPU执行完整的工作循环的循环次数,以及在所述循环次数内、在报文处理流程中未接收到报文的空转次数;获取所述非报文处理流程对应的第一权重值和所述报文处理流程对应的第二权重值;根据所述循环次数、所述空转次数、所述第一权重值和所述第二权重值,获取CPU利用率。所述装置用于执行所述方法。本发明实施例提供的方法,可准确地获取到网络设备中的CPU利用率。
-
公开(公告)号:CN105912716A
公开(公告)日:2016-08-31
申请号:CN201610285420.8
申请日:2016-04-29
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种短文本分类方法及装置。该方法包括:对待分类的短文本进行分词预处理,并获取分词得到的每个词语的扩展词;根据预先构建的词项集获取每个词语及其扩展词的权重值;根据权重值,利用多个类别SVM分类模型获取短文本所属每个类别的概率;根据预设的概率分类模型确定短文本的所属类别。本发明所提供的短分本分类方法,克服了短文本特征稀疏的问题,有效降低采用多分类模型的复杂度,更符合实际应用。
-
公开(公告)号:CN118520929A
公开(公告)日:2024-08-20
申请号:CN202411003497.2
申请日:2024-07-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06N3/09 , G06N3/0455 , G06F40/194
Abstract: 本发明提供一种文本相似度确定模型的训练方法及文本相似度计算方法,属于计算机技术领域,该训练方法包括:获取第一数据集和第二数据集;第一数据集中包括至少一个短文本数据对;第二数据集中包括至少一个目标文本数据对,目标文本数据对中的两个目标文本数据至少一个为长文本数据;基于句向量对比模型,获取第二数据集中各目标文本数据的关键表述;句向量对比模型是基于第一数据集和第一损失函数对第一预训练模型训练得到的;基于各关键表述和第二损失函数,对第二预训练模型进行训练,得到文本相似性确定模型。通过在判定过程中引入短文本和长文本,提升了文本相似度确定模型输出结果的准确性。
-
公开(公告)号:CN118277914A
公开(公告)日:2024-07-02
申请号:CN202311471891.4
申请日:2023-11-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2431 , G06F18/24 , G06F18/213 , G06F18/22
Abstract: 本发明涉及APP分类分析技术领域,公开了一种基于动静结合多维度APK特征的移动应用分类方法,首先进行APP特征构建,基于主流手机应用商店、互联网小型分发平台、APP传播页面对APP的信息进行采集,具体通过APP所提供的功能或呈现的信息内容,识别APP的业务分类,采集通信类的信息,形成初始的测试数据集;再基于APP源码进行分析,获取APP的静态源码特征、动态流量和页面特征数据,具体包括名称、流量和内容信息;进行建立规则匹配模型和匹配机制,具体通过构建定时扫描程序,通过预设的各分类规则匹配模型进行识别和研判。本发明对具有显著技术特征或内容特征的APP具有较高的识别准确率,降低人工审核参与度。
-
-
-
-
-
-
-
-
-