-
公开(公告)号:CN113255360A
公开(公告)日:2021-08-13
申请号:CN202110418139.8
申请日:2021-04-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/284 , G06F40/126 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本发明实施例公开了基于层次化自注意力网络的文档评级方法和装置。该方法包括:获取目标文档的评论文本,其中,所述评论文本包含多个评论,各评论包含多个句子;提取各句子中各词语的特征;基于自注意力机制,从各评论中各句子所包含全部词语的特征中提取各评论中各句子的特征;基于自注意力机制,从各评论所包含的所述多个句子的特征中提取各评论的特征;基于自注意力机制,从所述多个评论的特征中提取所述评论文本的特征;根据所述评论文本的特征,生成所述目标文档的评级结果。基于该方法和装置,可以充分捕捉目标文档的评论文本所包含的深层次语义信息,进而自动给出针对目标文档的评级结果。
-
公开(公告)号:CN119848603A
公开(公告)日:2025-04-18
申请号:CN202411930366.9
申请日:2024-12-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/24 , G06Q50/00 , G06N3/0455 , G06F40/20 , G06N3/042 , G06F18/213
Abstract: 本发明提出一种基于异构图的社交机器人检测方法和装置,包括获取社交网络中指定事件的用户文本,利用大语言模型分析文本间的隐式关联;以该用户文本的账号、内容和话题为节点,构建该指定事件下的异质图;根据预设的元路径,提取该异质图中各账号的特征表示;并利用图神经网络建模该特征表示,得到该元路径下的用户节点表示;将该账号的所有该用户节点表示进行融合,得到该账号的最终表示;将该最终表示输入到分类器中,得到该账号是否属于社交机器人的检测结果。
-
公开(公告)号:CN112214558B
公开(公告)日:2023-08-15
申请号:CN202011296138.2
申请日:2020-11-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/28 , G06F16/33 , G06F16/951 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本申请提供了一种主题相关度判别方法及装置,方法包括:对获取的网页构建网页特征向量;利用预先训练的语义向量空间模型对选定的主题特征向量与网页特征向量之间的相似度进行计算;筛选出相似度高于预设值的网页特征向量。本申请结合了语义向量相似度计算和机器学习方法的优点,相比于现有技术,可以实现较高的判别精度,并且本申请在训练样本的筛选上也作出了不同于现有技术的改进。
-
公开(公告)号:CN113313379A
公开(公告)日:2021-08-27
申请号:CN202110586002.3
申请日:2021-05-27
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q10/06
Abstract: 本发明提供一种确定事件角色影响力指数的方法、装置及存储介质,包括:对各角色类别中的角色个体划分为一级指标和二级指标;根据角色类别及特定限制信息,提取所有满足所述限制信息的角色个体对应的二级指标中各指标的数值,计算并形成信息矩阵;对所提取形成的信息矩阵,利用熵权法计算二级指标的权重;针对二级指标权重利用变异系数法计算一级指标权重;将每个二级指标权重与其对应一级指标权重相乘,得到每个二级指标的综合权重;将目标角色个体的各二级指标对应的值与每个二级指标的综合权重相乘求和,得到所述目标角色个体的影响力指数。通过本发明的方法,能够计算出事件角色影响力,用于各领域角色影响力量化分析。
-
公开(公告)号:CN113256079A
公开(公告)日:2021-08-13
申请号:CN202110490584.5
申请日:2021-05-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q10/06
Abstract: 本发明公开了一种特定领域的国际组织影响力的量化评价方法,包括:获取特定领域的每一国际组织信息和每一国际组织的每一成员信息;将国际组织影响力划分为多个维度,每个维度划分为多个指标,每个指标包含不同的国际组织信息和/或国际组织的成员信息,根据每个指标包含的国际组织信息和/或国际组织的成员信息计算特定领域的每一国际组织每个指标的指标值,再对每个指标值进行无量纲化处理;计算待评价国际组织其中一个维度的维度总分;为待评价国际组织每个维度的维度总分分配权重,将待评价国际组织的所有维度的维度总分加权求和得到待评价国际组织的影响力得分。本发明实现了定领域下的国际组织的影响力自动评价推荐的业务需求。
-
公开(公告)号:CN113239663A
公开(公告)日:2021-08-10
申请号:CN202110309085.1
申请日:2021-03-23
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F40/126 , G06F40/216 , G06F40/242 , G06F40/284 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于知网的多义词中文实体关系识别方法,其步骤包括:1)对中文网事数据中的每一条语料样本基于知网进行字颗粒度的向量化,得到每一个字对的字颗粒度向量;然后对每一字颗粒度向量所在的位置信息进行编码,得到语料中每个字与预标注的待识别实体关系对的相对位置编码;2)根据步骤1)所得结果生成每一语料样本的字颗粒度语义向量集合;3)基于知网生成每一语料的词颗粒度语义向量集合;4)利用各语义向量及其对应位置编码训练深度自注意力神经网络,得到深度自注意力神经网络编码器;5)生成待处理语料中字和词汇的语义向量及其对应位置编码输入深度自注意力神经网络编码器,得到该待处理语料中的实体关系。
-
公开(公告)号:CN111694952A
公开(公告)日:2020-09-22
申请号:CN202010299741.X
申请日:2020-04-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/31 , G06F16/335
Abstract: 本发明公开了一种基于微博的大数据分析模型系统及其实现方法,该实现方法包括以下步骤:步骤1、首先对收集的数据进行清洗和预处理工作,然后对数据进行人工标注;步骤2、模型训练阶段,采用SVM、cnnrnn结合Bert预训练模的方式进行模型训练;步骤3、在次人工标注的训练集上进行模型训练;步骤4、通过对比真实数据标签和预测结果,不断迭代优化通过不断的迭代优化参数调优的方式得到最佳模型;步骤5、在海量的文章中聚类,通过simHash算法,对文章内容进行局部HASH;步骤6、把选择出来的HASH对应的文章查询出来,再通过机器学习的算法进行聚类。本发明能够在保证模型准确率的基础上可以有效地减少机器需求,提高模型的准确率以及鲁棒性。
-
公开(公告)号:CN119807424A
公开(公告)日:2025-04-11
申请号:CN202411929873.0
申请日:2024-12-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/353 , G06N3/0455 , G06F18/22
Abstract: 本发明提出一种基于大语言模型的自适应文本分类方法和装置,包括:根据文本分类任务的需求,制定文本类别集合,并为该文本类别集合中各个文本类别创建多个示例样本;根据该文本分类任务的定义,制定用于文本分类的提示模板;获取待分类文本,选择该待分类文本的示例样本,作为样例数据;根据该提示模板,组装文本类别和该样例数据,得到提示文本;将该提示文本输入到大语言模型中,得到该大语言模型的输出结果;解析该输出结果,得到该待分类文本的文本类别。
-
公开(公告)号:CN119106199A
公开(公告)日:2024-12-10
申请号:CN202310657378.8
申请日:2023-06-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F16/906 , G06F16/904 , G06Q50/00
Abstract: 本发明提出一种面向社交媒体的迭代式线索发现方法和系统。包括融合文本、结构和互动信息的线索主体重要度评分方法。通过对候选账号的文本内容、社交网络结构和互动信息分别进行建模,分别得到内容、结构和互动三个维度的重要度评分,再对多个维度的评分进行加权,得到最终的线索主体重要度评分。选取分数最高的作为线索发现结果。该方法及系统可以综合利用社交媒体平台中的内容、结构以及互动信息对线索主体进行评分,提升线索主体识别的准确率。
-
公开(公告)号:CN113220964B
公开(公告)日:2024-03-22
申请号:CN202110357064.7
申请日:2021-04-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/9032 , G06F16/955 , G06F40/242 , G06F40/284 , G06N3/045 , G06N3/0464 , G06N3/09 , G06Q50/00
Abstract: 本发明属于网络信息以及自然语言处理技术领域,特别涉及一种基于网信领域短文本的观点挖掘方法。本方法包括网信领域相关的数据获取与预处理模块、基于短文本的特征提取模块、短文本属性推断模块、观点挖掘结果输出模块。本发明方法提出了基于网信领域的短文本获取与数据清洗模型,建立了面向社交网络短文本的文本特征提取模型,设计了基于网信领域的社交网络短文本的属性推断模型,综合考虑了文本关键词抽取和摘要生成,提出对应的观点挖掘输出模型,最终基于实际采集的网络安全法相关短文本数据实现输出及可视化的展示。本发明极大地减少了人工收集、分析与网信领域相关的短文本的时间成本,能够有效的为网信领域相关专业人士提供观点挖掘结果。
-
-
-
-
-
-
-
-
-