-
公开(公告)号:CN112069793A
公开(公告)日:2020-12-11
申请号:CN202010799665.9
申请日:2020-08-11
Applicant: 武汉大学
IPC: G06F40/211 , G06F40/284 , G06F16/35 , G06N7/00
Abstract: 本发明提供了一种从软件开发文本类制品中识别假设条件的自动化方法,包括以下步骤:步骤1:对软件开发文本类制品中的句子进行人工标记,识别出假设条件和非假设条件,构造由于识别假设条件的数据集。步骤2:使用几种对文本数据进行预处理的方法,对数据集中的自然语言语句进行预处理。步骤3:使用词句向量化处理,将预处理后的一维词句转化为多维的特征化向量。步骤4:使用多种分类算法对处理后的自然语言句子进行分类识别。构造不同的分类器。并使用训练好的分类器对预测测试集中每个句子的类别。本发明能够对软件开发文本类制品中的包含假设条件的语句进行自动分类,为从业人员和开发人员提供便利和指导。