一种基于多信息过滤编码的多标签文本分类方法及系统

    公开(公告)号:CN115168566B

    公开(公告)日:2025-04-15

    申请号:CN202210914791.3

    申请日:2022-08-01

    Applicant: 济南大学

    Abstract: 本发明公开了一种基于多信息过滤编码的多标签文本分类方法及系统,该方法包括:获取包含标签的文本训练集;基于文本训练集,得到文本和标签的单词向量;通过多信息过滤编码进行文本信息和标签信息的过滤和特征提取,得到过滤的文本特征和标签特征;通过过滤的文本特征和过滤的标签特征交互,结合过滤的文本特征,得到最终文本向量表示,以此训练多标签文本分类模型;利用训练好的多标签文本分类模型对待分类文本数据集进行多标签文本分类。本发明通过过滤文本信息和标签信息的噪音及冗余信息,分别在文本空间和标签空间提取过滤信息中的语义特征,通过过滤的语义特征的交互,捕获更多与分类相关的信息,提高多标签文本分类的精度。

    一种营销文本识别方法及系统

    公开(公告)号:CN114724167B

    公开(公告)日:2025-04-01

    申请号:CN202210498687.0

    申请日:2022-05-09

    Applicant: 济南大学

    Abstract: 本发明提供了一种营销文本识别方法及系统,包括:获取待识别文本,并进行预处理;基于预处理后的待识别文本,构建待识别文本的文本图;基于待识别文本的文本图,生成文本级单词表示,并结合所有标签的嵌入表示,生成文本表示;基于文本表示,采用分类器得到待识别文本是否属于营销文本的结果;其中,标签的嵌入表示的获取方法为:基于训练集的文本图及其标签,生成主题单词概率分布,将主题单词概率分布映射到标签向量空间,并在标签图的指导下学习标签间的相关性关系和语义信息,得到标签的嵌入表示。达到了生成完整标签嵌入的目的,联合学习单词与标签捕获更多与分类相关的信息,提高了营销文本识别的精度。

    一种基于多信息过滤编码的多标签文本分类方法及系统

    公开(公告)号:CN115168566A

    公开(公告)日:2022-10-11

    申请号:CN202210914791.3

    申请日:2022-08-01

    Applicant: 济南大学

    Abstract: 本发明公开了一种基于多信息过滤编码的多标签文本分类方法及系统,该方法包括:获取包含标签的文本训练集;基于文本训练集,得到文本和标签的单词向量;通过多信息过滤编码进行文本信息和标签信息的过滤和特征提取,得到过滤的文本特征和标签特征;通过过滤的文本特征和过滤的标签特征交互,结合过滤的文本特征,得到最终文本向量表示,以此训练多标签文本分类模型;利用训练好的多标签文本分类模型对待分类文本数据集进行多标签文本分类。本发明通过过滤文本信息和标签信息的噪音及冗余信息,分别在文本空间和标签空间提取过滤信息中的语义特征,通过过滤的语义特征的交互,捕获更多与分类相关的信息,提高多标签文本分类的精度。

    一种营销文本识别方法及系统

    公开(公告)号:CN114724167A

    公开(公告)日:2022-07-08

    申请号:CN202210498687.0

    申请日:2022-05-09

    Applicant: 济南大学

    Abstract: 本发明提供了一种营销文本识别方法及系统,包括:获取待识别文本,并进行预处理;基于预处理后的待识别文本,构建待识别文本的文本图;基于待识别文本的文本图,生成文本级单词表示,并结合所有标签的嵌入表示,生成文本表示;基于文本表示,采用分类器得到待识别文本是否属于营销文本的结果;其中,标签的嵌入表示的获取方法为:基于训练集的文本图及其标签,生成主题单词概率分布,将主题单词概率分布映射到标签向量空间,并在标签图的指导下学习标签间的相关性关系和语义信息,得到标签的嵌入表示。达到了生成完整标签嵌入的目的,联合学习单词与标签捕获更多与分类相关的信息,提高了营销文本识别的精度。

Patent Agency Ranking