一种主观文本和客观文本分类方法及装置

    公开(公告)号:CN102298646A

    公开(公告)日:2011-12-28

    申请号:CN201110281938.1

    申请日:2011-09-21

    Applicant: 苏州大学

    Abstract: 本发明实施例公开了一种主观文本和客观文本分类方法及装置,该发明对不平衡训练样本进行多次欠采样,并对欠采样后的训练集进行训练,从而构建出多个基分类器,进而利用基分类器对待分样本进行分类,最后将所有分类结果进行统计得到最终的分类结果。本发明实施例采用多次欠采样能够充分利用样本,训练欠采样训练集时使用不同的机器学习方法,构建出差异性大的基分类器。解决了样本不平衡给机器学习分类方法带来的不利影响,提高了分类效果。

    基于知识蒸馏的语音情感分类方法

    公开(公告)号:CN113297383B

    公开(公告)日:2023-08-04

    申请号:CN202110695067.1

    申请日:2021-06-22

    Applicant: 苏州大学

    Abstract: 本申请涉及一种基于知识蒸馏的语音情感分类方法,涉及语音智能处理技术,该方法包括:将样本文本数据预处理后输入向量提取网络提取文本词嵌入向量;将文本词嵌入向量输入预设的分类模型;将样本文本数据进行语音合成转换;将TTS语音数据输入语音特征提取模块;将语音时域及频域特征输入预设的分类模型,使用交叉熵损失函数对预设的分类模型进行语音情感分类预测训练;将文本情感分类软标签输入所述预设的分类模型并使用预设的知识蒸馏损失函数进行语音情感分类预测训练,使所述TTS语音数据的情感类别预测趋近于所述样本文本数据的情感分布,得到训练后的分类模型。训练后的分类模型可以对输入的语音数据进行语音情感分类。

    基于联合学习的前后缀否定词识别方法

    公开(公告)号:CN115034213B

    公开(公告)日:2022-12-30

    申请号:CN202210976821.3

    申请日:2022-08-15

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于联合学习的前后缀否定词识别方法,包括:将目标前后缀否定词输入训练好的主任务模型,并输出英文预测输出序列中英文标签描述词对应的英文预测输出向量;将目标前后缀否定词输入训练好的辅助任务模型,并输出中文预测输出序列中中文标签描述词对应的中文预测输出向量;将英文预测输出向量和中文预测输出向量输入训练好的联合学习模型,联合学习模型将英文预测输出向量和中文预测输出向量进行融合,得到融合向量序列,并向融合向量序列中添加不同向量之间的关联性,最后输出目标前后缀否定词的预测标签,预测标签包括否定词和非否定词。本发明的识别方法可以有效提升前后缀否定词的识别准确率。

    一种否定焦点的识别方法及系统

    公开(公告)号:CN115081436A

    公开(公告)日:2022-09-20

    申请号:CN202210831553.6

    申请日:2022-07-15

    Applicant: 苏州大学

    Abstract: 本发明公开了一种否定焦点的识别方法及系统,将待识别文本转换成词序列输入已经训练好的模型中,将词序列生成编码向量和特征向量,再基于给定的否定条件利用编码向量、特征向量及之前生成的所有否定焦点的起始标记和结束标记,计算生成下一个否定焦点的起始标记或结束标记;相比于现有的序列标注模型,对待识别文本中每个词进行标注,本发明生成标记为每个否定焦点的起始和结束,最终得到的是否定焦点范围,在计算下一个否定焦点时不需要根据词序列中每个词再计算,一定程度上减少了计算量,提高了计算效率,同时也能满足在单一否定条件下的否定焦点识别,计算量减少了,计算效率也提高了。

    一种多类别情感分类方法、装置以及计算机存储介质

    公开(公告)号:CN114706986A

    公开(公告)日:2022-07-05

    申请号:CN202210621469.1

    申请日:2022-06-02

    Applicant: 苏州大学

    Abstract: 本发明公开了一种多类别情感分类方法、装置以及计算机存储介质,包括对样本数据集中的文本数据添加分类模板与回归模板,并在模板中标注标签描述词,得到提示训练样本,基于所述情感类别标签计算所述标签描述词的概率,得到所述提示训练样本的目标值;基于所述提示训练样本及所述目标值,采用二值交叉熵损失函数训练预训练模型,得到训练完成的情感分类检测模型;利用情感分类检测模型检测待检测文本数据,将回归预测值与分类预测概率利用权重距离融合,取最小权重距离对应的情感类别标签作为所述待检测文本数据的预测类别。实现了在训练数据量很少的情况下也可以完成快速学习,进一步提高了多类别情感分类任务的精度。

    基于融合模态内和模态间关系的数据处理方法及系统

    公开(公告)号:CN113254741B

    公开(公告)日:2021-09-28

    申请号:CN202110665991.5

    申请日:2021-06-16

    Applicant: 苏州大学

    Abstract: 本申请涉及基于融合模态内和模态间关系的数据处理方法及系统,包括:获取社交网络指向目标分类的样本数据,并将样本数据划分为训练集、验证集和测试集,获得训练集样本数据、验证集样本数据和测试集样本数据;构建预设分类模型,所述预设分类模型包括特征提取网络,与所述特征提取网络相连的目标分类主任务网络和多模态主题信息辅助任务网络;将所述训练集样本数据输入所述预设分类模型并利用预设的损失函数进行训练,使用门控机制融合主任务和辅助任务的输出,得到社交数据分类模型,所述社交数据分类模型用于对输入的待分类数据进行分类。本申请能够有效的提升社交网络数据指向目标分类的性能。

    基于BERT的自适应文本分类方法及装置

    公开(公告)号:CN113220892A

    公开(公告)日:2021-08-06

    申请号:CN202110658382.7

    申请日:2021-06-15

    Applicant: 苏州大学

    Abstract: 本申请涉及一种基于BERT的自适应文本分类方法及装置,属于中文信息处理技术领域,包括:获取语料样本数据并对语料样本数据进行预处理;构建预设网络模型;将所述预处理后的样本数据输入预设的网络模型,并使用预设的损失函数进行监督训练,得到分类模型;设置所述分类模型的输出阈值,得到设置后的分类模型,所述输出阈值控制分类结果的提前输出,所述设置后的分类模型用于对输入的文本进行分类。相较于传统的BERT模型,可在不损失精度的情况下,缩短模型推理时间。

    融合文本与图像的双模态性格分类方法及装置

    公开(公告)号:CN112949622A

    公开(公告)日:2021-06-11

    申请号:CN202110376917.1

    申请日:2021-04-08

    Applicant: 苏州大学

    Abstract: 本申请涉及一种融合文本与图像的双模态性格分类方法及装置,属于人工智能技术领域,该方法包括:将文本数据和图像数据输入预先训练的性格分类网络,得到性格分类结果;性格分类网络包括特征提取网络、对比视觉注意力网络和对比感知解码网络;特征提取网络中的文本特征提取分支用于提取文本数据的词嵌入向量、图像特征提取分支用于提取图像数据的图像区域向量;对比视觉注意力网络中的基础视觉注意力分支用于提取与文本数据对齐的图像对象,并计算对齐的视觉表示、逆视觉注意力分支用于提取与文本数据不对齐的图像对象,并计算不对齐的视觉表示;对比感知解码网络用于进行性格类别的预测;缓解了分类性能不佳和无法捕捉认知差异信息的问题。

    基于ResNet-50时间压缩的胃镜图片分类方法、装置和存储介质

    公开(公告)号:CN112364926A

    公开(公告)日:2021-02-12

    申请号:CN202011283381.0

    申请日:2020-11-17

    Applicant: 苏州大学

    Abstract: 本申请公开了一种基于ResNet‑50时间压缩的胃镜图片分类方法、装置和存储介质,涉及医学图像智能处理技术领域,所述方法包括:获取胃镜图片;对所述胃镜图片进行预处理;将预处理后的所述胃镜图片输入至ResNet‑50网络模型中,所述ResNet‑50网络模型的前三种残差结构中每种残差结构之后设置有分支分类器,最后一种残差结构之后设置有主干分类器;依次获取所述ResNet‑50网络模型中每个分类器的分类结果,根据获取到的分类结果确定所述胃镜图片的最终分类结果。解决了现有技术中人眼观察胃镜图片时由于医生经验水平等影响导致人为判断会存在误诊并且需要耗费大量时间的问题,达到了将胃镜图片输入至ResNet‑50网络模型之后即可自动输出分类结果,在基本不影响分类准确度的情况下节省测试时间的效果。

    一种基于微博的用户职业分类方法及系统

    公开(公告)号:CN104778283B

    公开(公告)日:2018-05-01

    申请号:CN201510236383.7

    申请日:2015-05-11

    Applicant: 苏州大学

    Abstract: 本发明提供的一种基于微博的用户职业分类方法和系统,包括:获取预设数量的第一用户,第一用户为已经提供职业信息的微博用户;获取每个第一用户的职业信息和微博文本;依据第一用户的职业信息对第一用户进行分类,利用分类后得到的结果确定每个第一用户的职业类型;将每个第一用户的微博文本分别进行分词处理,得到第一文本词组;利用第一文本词组构成分别与每个第一用户的微博文本对应的第一特征向量,并利用第一用户的职业类型及第一特征向量构建最大熵分类器;利用最大熵分类器对第二特征向量进行处理,得到与第二特征向量对应的微博文本所属的第二用户的职业类型。由此,能够准确获知未知职业信息的微博用户的职业类型。

Patent Agency Ranking