基于奇异值分解和领域预训练的短文本聚类方法

    公开(公告)号:CN115357715A

    公开(公告)日:2022-11-18

    申请号:CN202211039043.1

    申请日:2022-08-29

    Abstract: 本发明公开了一种基于奇异值分解和领域预训练的短文本聚类方法,步骤为:获取短文本作为数据集,对数据集进行预处理;采用CBOW模型提取词向量特征,包括频繁词和对应的文档;将频繁词与文档形成矩阵形式,使用SVD方法对矩阵进行分解,随后构造GCN表示,形成对应的图结构向量,使用RoBERTa模型对文档进行基础训练,再添加新的语义子任务进行训练,生成NLP语义向量,使用两个向量相结合,采用D‑D‑Kmeans算法进行聚类,得到聚类结果。本发明更能提高聚类收敛速度和准确性,能够较好抵抗噪声干扰,具有较强的鲁棒性。

    基于长短期记忆神经网络的混合染液浓度光谱检测方法

    公开(公告)号:CN114092784A

    公开(公告)日:2022-02-25

    申请号:CN202111180545.1

    申请日:2021-10-11

    Abstract: 本发明公开了基于长短期记忆神经网络的混合染液浓度光谱检测方法,具体为:首先,配置不同浓度的混合染液,得到原始染液数据;在不同的光源及不同的曝光时间下,采集原始染液数据的图像信息并记录;将数据进行横向DBSCAN聚类,得到k类数据;再将聚类后的每类数据进行预处理,并划分训练集与验证集,之后再采用长短期记忆神经网络算法来建立模型,对模型进行训练,最后利用训练完成的最优预测模型对测试集数据进行检验预测。本发明使用科学智能的方法有效的解决了国内外印染行业在染料浓度检测方面的瓶颈问题,该方法在操作过程中十分简单,非印染专业人员也可以进行操作,在避免造成污染的同时,实现了低成本、高效率、高精度地检测。

    一种基于图卷积神经网络与词向量的节点分类方法

    公开(公告)号:CN114036298A

    公开(公告)日:2022-02-11

    申请号:CN202111361790.2

    申请日:2021-11-17

    Abstract: 本发明公开了一种基于图卷积神经网络与词向量的节点分类方法,包括:将图中节点表示为文本,构建文本数据集,对文本数据集中文本进行分词;使用Word2Vec模型对分词后的文本进行词向量表示;通过数据集内节点与边的信息,得到对应图的标准化邻接矩阵、标准化Laplacian矩阵,利用标准化邻接矩阵、标准化Laplacian矩阵赋权求和结果表示图的结构信息;以词向量表示节点的特征,与图的结构信息相结合作为GCN图卷积神经网络的输入,得到节点的向量嵌入;将节点的向量嵌入输入多层感知机进行节点分类操作,得到分类结果。显著的提高了节点分类任务的效果。

Patent Agency Ranking