-
公开(公告)号:CN110633366A
公开(公告)日:2019-12-31
申请号:CN201910697992.0
申请日:2019-07-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种短文本分类方法、装置和存储介质,用以从有限的训练数据中获取泛化能力强并且较为准确的分类特征,提高短文本分类的准确性。所述短文本分类方法,包括:获取待分类短文本;将所述待分类短文本输入到多层分类器中,其中,所述多层分类器为利用训练样本和所述待分类短文本所属目标领域的领域知识图谱进行训练得到的,每一层分类器提取不同的文本特征进行训练;根据所述多层分类器的输出结果,确定所述待分类短文本对应的文本类别。
-
公开(公告)号:CN119991328A
公开(公告)日:2025-05-13
申请号:CN202510151780.8
申请日:2025-02-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q50/00 , G06F18/20 , G06F18/22 , G06F18/2323 , G06F16/9535 , G06N5/025 , G06F123/02
Abstract: 本公开涉及复杂网络分析技术领域,具体涉及一种融合内容结构规则和时间规律的目标社区发现方法及装置,所述融合内容结构规则和时间规律的目标社区发现方法,包括:获取用户的发文信息以及发文次数;从所述发文信息中识别用户内容结构规则,并通过杰卡德相似系数计算用户间内容结构规则相似度;基于所述发文次数构建用户发文时间规律矩阵,并通过皮尔逊相关系数计算用户间时间规律相似度;建立基于用户间内容结构规则相似度以及用户间时间规律相似度的网络无向加权图;使用谱聚类方法对于网络无向加权图进行社区发现,得到社区划分结果。上述技术方案有助于发现社交平台中的隐藏社群和影响力网络,准确定位基于用户偏好的目标社区。
-
公开(公告)号:CN119988633A
公开(公告)日:2025-05-13
申请号:CN202510151779.5
申请日:2025-02-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/353 , G06F40/16 , G06F40/186 , G06F40/295 , G06F18/214 , G06F18/2415 , G06F18/2431 , G06N3/045 , G06N3/0464 , G06N5/022
Abstract: 本公开涉及自然语言处理技术领域,具体涉及一种基于大模型和知识库的文本观点自动标注方法及装置,所述基于大模型和知识库的文本观点自动标注方法包括:识别知识库中存在的与原始文本的实体对应的知识库实体以及所述知识库实体的扩展实体,将扩展实体基于预定义实体关系插入到原始文本中进行知识补全,生成知识嵌入文本;提供给定话题实体集;创建提示模板,将所述知识嵌入文本以及给定话题实体集填充所述提示模板中,然后利用大语言模型进行生成式标注得到态度标签;基于所述给定话题实体,态度标签得到倾向标签;基于所述原始文本、倾向标签构建标注数据集。上述技术方案对于高质量标注数据集的标注工作提供了有力支持。
-
公开(公告)号:CN110704612B
公开(公告)日:2022-09-16
申请号:CN201910732451.7
申请日:2019-08-09
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/35 , G06F16/31 , G06F40/216 , G06F40/30 , G06Q50/00
Abstract: 本发明提出了一种社交群体发现方法、装置和存储介质,用以提高社交群体发现精度和准确度。所述社交群体发现方法,包括:利用预先设定的种子用户和约束条件,从通信数据源中查找候选用户,所述候选用户包括与所述种子用户通信的第一用户和/或满足所述约束条件的第二用户;从所述候选用户的通信数据中提取与所述种子用户关联的关联特征信息;根据提取的关联特征信息,确定每一候选用户对应的置信度;确定对应的置信度大于预设阈值的候选用户为目标用户;根据目标用户之间的通信联系建立初始群体网络;利用群体发现算法从所述初始群体网络中发现社交群体子网络。
-
公开(公告)号:CN114626425A
公开(公告)日:2022-06-14
申请号:CN202011456860.8
申请日:2020-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06K9/62 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种面向噪声文本的多视角交互匹配方法及电子装置,包括对两段待匹配噪声文本分别编码,得到两段编码向量序列,并向两段编码向量序列的每个编码向量中加入位置信息;对加入位置信息的两段编码向量序列进行内部交互,分别得到两段内部交互结果;对两段内部交互结果进行外部交互,分别构建两个双向的噪声文本交互矩阵;拼接两个噪声文本交互矩阵,判断两个待匹配噪声文本是否匹配。本发明采用注意力机制捕获噪声文本之间的双向匹配模式,受噪声文本中句子的逻辑顺序影响较小,增加文本有效语义单词影响,提高模型时间效率及噪声文本匹配效果,避免传递匹配问题。
-
公开(公告)号:CN114625978A
公开(公告)日:2022-06-14
申请号:CN202011454130.4
申请日:2020-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/9536 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明提供一种基于类型感知的异质网络用户锚链接预测方法及电子装置,包括收集待检测网络和目标网络的网络信息,构建待检测异质网络和目标异质网络;获取每一节点各维度的初始特征向量,得到每个节点的初始特征向量表示;将初始特征向量表示输入基于自注意力图神经网络进行学习,计算各节点的类型感知向量和类型融合向量;通过待检测异质网络和目标异质网络中各节点对之间属于同一类型的类型感知向量及类型融合向量的相似度,判断待检测网络和目标网络是否为锚链接。本发明采用注意力机制捕获节点与类型信息之间影响,利用图注意力网络学习类型感知向量和类型融合向量,解决异质网络中对多种类型信息建模的问题,取得较好的锚链接预测效果。
-
公开(公告)号:CN110879856A
公开(公告)日:2020-03-13
申请号:CN201911180128.X
申请日:2019-11-27
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/901 , G06F16/906 , G06F16/909 , G06K9/62 , G06Q50/00
Abstract: 本发明公开了一种基于多特征融合的社交群体分类方法及系统。本方法为:1)对一目标社交群体的数据集,对该数据集中各用户的轨迹数据进行预处理,去除噪声并对缺失位置信息进行插值;2)使用频繁序列挖掘算法从各用户轨迹数据中挖掘对应用户的轨迹模式,再将用户的轨迹模式看作时序序列,采用LSTM对该时间序列进行编码,得到用户的轨迹编码;3)根据所述社交关系生成一图网络,将所述社交关系投影到低维空间,学习得到各用户的嵌入表示;4)将每一用户的轨迹编码和对应用户的嵌入表示结合输入softmax层,确定各用户的类别,实现对该目标社交群体的分类。本发明大大提升了群体分类的精度。
-
公开(公告)号:CN110659561A
公开(公告)日:2020-01-07
申请号:CN201910725251.9
申请日:2019-08-07
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种互联网暴恐视频识别模型的优化方法及装置,所述方法包括:获取互联网暴恐视频识别模型的卷积神经网络中各个层的卷积核的各个通道的参数;根据所述各个通道的参数判断是否丢弃对应的通道,如果判断为是,执行通道丢弃操作。本发明使得每天使用暴恐模型审核的数据量大大提升。填补了海量互联网视频暴恐视频审核技术和产品空白,可以极大程度提升了暴恐图像审核的产品竞争力。
-
公开(公告)号:CN110610230A
公开(公告)日:2019-12-24
申请号:CN201910698120.6
申请日:2019-07-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种台标检测方法、装置及可读存储介质,该方法包括如下步骤:获取台标数据集,并对所述台标数据集进行分组获得台标训练集;构建多损失融合的孪生神经网络,并基于所述台标训练集对所构建的多损失融合的孪生神经网络进行训练获得训练后的多损失融合的孪生神经网络;通过所述训练后的多损失融合的孪生神经网络对待测台标进行检测。本发明方法通过构建孪生神经网络框架,很好地消除了样本数量不足对训练网络带来的影响,可以更好地检测未知的新的种类的敏感台标。
-
公开(公告)号:CN114626425B
公开(公告)日:2024-11-08
申请号:CN202011456860.8
申请日:2020-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F18/22 , G06F40/30 , G06F40/284 , G06N3/0464 , G06N3/045 , G06N3/0442 , G06N3/084
Abstract: 本发明提供一种面向噪声文本的多视角交互匹配方法及电子装置,包括对两段待匹配噪声文本分别编码,得到两段编码向量序列,并向两段编码向量序列的每个编码向量中加入位置信息;对加入位置信息的两段编码向量序列进行内部交互,分别得到两段内部交互结果;对两段内部交互结果进行外部交互,分别构建两个双向的噪声文本交互矩阵;拼接两个噪声文本交互矩阵,判断两个待匹配噪声文本是否匹配。本发明采用注意力机制捕获噪声文本之间的双向匹配模式,受噪声文本中句子的逻辑顺序影响较小,增加文本有效语义单词影响,提高模型时间效率及噪声文本匹配效果,避免传递匹配问题。
-
-
-
-
-
-
-
-
-