-
公开(公告)号:CN118377907A
公开(公告)日:2024-07-23
申请号:CN202410599196.4
申请日:2024-05-15
Applicant: 西安理工大学
IPC: G06F16/35 , G06F16/9536 , G06F18/214 , G06F18/241 , G06N3/042 , G06N3/0442 , G06N3/045 , G06N3/08 , G06Q50/00
Abstract: 本发明公开了基于社会网络和舆情主题的网络舆情文本分类方法,具体包括如下步骤:步骤1,创建了反映用户活跃度的字典,并转化为描述用户互动频率的特征向量;步骤2,将处理后的数据集随机分为训练集、测试集和验证集,并创建可视化的用户关联关系图;步骤3,利用BERT模型对处理用户关联关系图的数据;步骤4,利用BiLSTM网络处理降维后的融合特征;步骤5,提取数据集的深层语义特征;步骤6,对步骤4中和步骤5的输出均应用多头自注意力机制,增强模型对关键信息的聚焦能力;步骤7,通过线性分类器进行整合和最终分类决策。解决了现有分类方法存在的分类性能不佳、计算复杂度高以及特征提取不准确的问题。
-
公开(公告)号:CN115357715A
公开(公告)日:2022-11-18
申请号:CN202211039043.1
申请日:2022-08-29
Applicant: 西安理工大学
Abstract: 本发明公开了一种基于奇异值分解和领域预训练的短文本聚类方法,步骤为:获取短文本作为数据集,对数据集进行预处理;采用CBOW模型提取词向量特征,包括频繁词和对应的文档;将频繁词与文档形成矩阵形式,使用SVD方法对矩阵进行分解,随后构造GCN表示,形成对应的图结构向量,使用RoBERTa模型对文档进行基础训练,再添加新的语义子任务进行训练,生成NLP语义向量,使用两个向量相结合,采用D‑D‑Kmeans算法进行聚类,得到聚类结果。本发明更能提高聚类收敛速度和准确性,能够较好抵抗噪声干扰,具有较强的鲁棒性。
-
公开(公告)号:CN114036298B
公开(公告)日:2024-02-02
申请号:CN202111361790.2
申请日:2021-11-17
Applicant: 西安理工大学
IPC: G06F16/35 , G06F40/289 , G06F40/295 , G06F40/211 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/0499 , G06N3/088
Abstract: 本发明公开了一种基于图卷积神经网络与词向量的节点分类方法,包括:将图中节点表示为文本,构建文本数据集,对文本数据集中文本进行分词;使用Word2Vec模型对分词后的文本进行词向量表示;通过数据集内节点与边的信息,得到对应图的标准化邻接矩阵、标准化Laplacian矩阵,利用标准化邻接矩阵、标准化Laplacian矩阵赋权求和结果表示图的结构信息;以词向量表示节点的特征,与图的结构信息相结合作为GCN图卷积神经网络的输入,得到节点的向量嵌入;将节点的向量嵌入输入多层感知机进行节点分类操作,得到分类结果。显著的提高了节点分类任务的效果。
-
公开(公告)号:CN114092784A
公开(公告)日:2022-02-25
申请号:CN202111180545.1
申请日:2021-10-11
Applicant: 西安理工大学
IPC: G06V20/00 , G06V10/56 , G06V10/764 , G06V10/762 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , G01N21/25
Abstract: 本发明公开了基于长短期记忆神经网络的混合染液浓度光谱检测方法,具体为:首先,配置不同浓度的混合染液,得到原始染液数据;在不同的光源及不同的曝光时间下,采集原始染液数据的图像信息并记录;将数据进行横向DBSCAN聚类,得到k类数据;再将聚类后的每类数据进行预处理,并划分训练集与验证集,之后再采用长短期记忆神经网络算法来建立模型,对模型进行训练,最后利用训练完成的最优预测模型对测试集数据进行检验预测。本发明使用科学智能的方法有效的解决了国内外印染行业在染料浓度检测方面的瓶颈问题,该方法在操作过程中十分简单,非印染专业人员也可以进行操作,在避免造成污染的同时,实现了低成本、高效率、高精度地检测。
-
公开(公告)号:CN114036298A
公开(公告)日:2022-02-11
申请号:CN202111361790.2
申请日:2021-11-17
Applicant: 西安理工大学
IPC: G06F16/35 , G06F40/289 , G06F40/295 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于图卷积神经网络与词向量的节点分类方法,包括:将图中节点表示为文本,构建文本数据集,对文本数据集中文本进行分词;使用Word2Vec模型对分词后的文本进行词向量表示;通过数据集内节点与边的信息,得到对应图的标准化邻接矩阵、标准化Laplacian矩阵,利用标准化邻接矩阵、标准化Laplacian矩阵赋权求和结果表示图的结构信息;以词向量表示节点的特征,与图的结构信息相结合作为GCN图卷积神经网络的输入,得到节点的向量嵌入;将节点的向量嵌入输入多层感知机进行节点分类操作,得到分类结果。显著的提高了节点分类任务的效果。
-
公开(公告)号:CN116467443A
公开(公告)日:2023-07-21
申请号:CN202310404738.3
申请日:2023-04-17
Applicant: 西安理工大学
IPC: G06F16/35 , G06F40/216 , G06F40/242 , G06F18/214 , G06F18/2415 , G06F18/2431 , G06N3/0464 , G06N3/0475 , G06N3/084 , G06N3/094
Abstract: 本发明公开了一种基于主题识别的网络舆情文本分类方法,具体包括如下步骤:步骤1,选取原始数据集,对该数据集进行处理;步骤2,对步骤1处理后的数据进行主题识别,得到与网络舆情主题相关的文本数据;步骤3,采用混合数据增强技术对步骤2所得的文本数据进行对抗训练;步骤4,对步骤3处理后的数据进行不相关词汇剔除;步骤5,将经步骤4处理后的数据导入TextCNN模型中进行文本分类。本发明解决了网络空间中涉法舆情领域所爬取的评论数据呈现短文本居多且核心内容稀疏的问题,以及涉法网络舆情文本语义表述隐晦、专业术语难以识别的问题。
-
-
-
-
-