-
公开(公告)号:CN119938926A
公开(公告)日:2025-05-06
申请号:CN202510023680.7
申请日:2025-01-07
Applicant: 北京工业大学
IPC: G06F16/353 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06F18/241 , G06F18/213 , G06F16/951
Abstract: 本发明公开了一种评估暗网文本危险等级方法、系统、电子设备及存储介质,包括获取暗网文本;将暗网文本输入语言模型BERT,输出高维的嵌入表示;将高维的嵌入表示输入分类模型CNN,输出特征;将特征输入神经网络BiLSTM,输出文本内容危险分数和用户危险分数;基于文本转发量、点赞量和评论量计算文本传播危险分数;基于文本内容危险分数、用户危险分数和文本传播危险分数对暗网文本划分危险等级。本发明能够从多个角度分析暗网文本的潜在危险性,包括内容特征、用户行为、传播模式。这些维度提供了更为全面的信息,能够帮助发现深度学习模型可能忽视的风险点。
-
公开(公告)号:CN119886221A
公开(公告)日:2025-04-25
申请号:CN202411950173.X
申请日:2024-12-27
Applicant: 北京工业大学
IPC: G06N3/0464 , G06N3/042 , G06N3/082
Abstract: 本发明公开了一种稀疏网络的隐式关系检测方法和检测系统,属于电数字数据处理技术领域,所述方法包括以下步骤:基于图卷积网络和关系边稀疏性,获得数据集中节点的嵌入表示;根据嵌入表示、元路径及其优先级,获得节点的特征表示;获得候选节点对的候选边;通过得分函数和节点对中节点的特征表示,计算候选边的关系得分;根据关系得分,预测候选边是否存在。对稀疏网络的节点和关系的数据进行聚合,获得基于稀疏性的嵌入表示,以及基于关系边稀疏性和元路径的特征表示;计算候选节点之间候选边关系得分,检测是否存在隐式关系;通过递归传播捕捉节点之间的复杂多维关系,增强了节点特征的表示能力,有效提升了隐式关系挖掘的准确性。
-
公开(公告)号:CN119808773A
公开(公告)日:2025-04-11
申请号:CN202510251664.3
申请日:2025-03-05
Applicant: 北京工业大学
IPC: G06F40/279 , G06F40/295 , G06N3/0464 , G06N3/042 , G06N3/0442 , G06N3/047 , G06F18/25 , G06F18/213 , G06N5/02
Abstract: 本发明公开了一种基于动态知识图谱增强的序列标注方法及系统,方法包括:S1、从基础属性稀疏、属性缺失的文本信息中,挖掘基础属性信息和相关实体信息,构建知识图谱;S2、将输入序列的每个Token映射到知识图谱的实体节点,提取局部子图;S3、通过图卷积网络进行特征提取,得到每个Token的实体嵌入特征;S4、将每个Token的原始特征与实体嵌入特征进行融合;S5、将每个Token的融合特征输入BiLSTM模型,得到输入序列的输出特征;S6、将输入序列的输出特征输入CRF模型,得到输入序列的最终的综合特征。本发明在BiLSTM和CRF的基础上引入GCN模型生成基于知识图谱的特征,并融合原始输入特征和GCN生成的特征,在基础属性稀疏、属性缺失的文本中进行序列标注取得了较好的性能。
-
公开(公告)号:CN119990118A
公开(公告)日:2025-05-13
申请号:CN202510055566.2
申请日:2025-01-14
Applicant: 北京工业大学
IPC: G06F40/284 , G06F40/242 , G06N3/045
Abstract: 本发明公开一种基于动态词嵌入的中文隐语识别方法,属于自然语言处理、深度学习、数据挖掘、跨语境文本分析和网络安全等技术领域;该方法包括:获取待检测文本数据;通过新词发现技术和边界增强技术,从待检测文本数据中获取新词词汇,从而构建新词词典;根据新词词典和基本词典,对待检测文本数据进行分词处理,得到分词结果;所述分词结果包括新词和已知词;将已知词与正式语料进行比较,识别已知词是否为隐语;将新词与预定义类别进行比较,识别新词是否为隐语。本发明通过整合平台数据,显著提升了数据多样性,增强了模型在不同环境的适应性。
-
-
-