-
公开(公告)号:CN105335350A
公开(公告)日:2016-02-17
申请号:CN201510644536.1
申请日:2015-10-08
Applicant: 北京理工大学
CPC classification number: G06F17/2785 , G06K9/6269
Abstract: 本发明涉及一种基于集成学习的语种识别方法,属于自然语言处理应用技术领域;本发明方法首先从训练集D中按照预设的抽取比例参数max_samples选取bootstrap样例得到训练集Db;其次基于Db按照特征选取比例参数max_features选取样例特征,并基于选取的特征对Db进行过滤得到训练集Dt;再者基于Dt对多项式朴素贝叶斯(MNBBL)、随机森林(RFBL)、支持向量机(SVMBL)和线性模型(LMBL)四种基本分类器进行训练;最后利用多数表决把四种基本分类器组合成为一个更强的分类器;接下来就可以采用此分类器对待识别样例进行识别。对比现有技术,本发明方法可以识别少数民族的短文本语言,且准确率得到了提高。
-
公开(公告)号:CN111061935A
公开(公告)日:2020-04-24
申请号:CN201911292337.3
申请日:2019-12-16
Applicant: 北京理工大学
IPC: G06F16/951 , G06F16/9035 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于自注意力机制的科技写作推荐方法,属于计算机自然语言处理以及社交媒体技术领域。所述科技写作推荐方法,首先利用已有的段落写作内容,挖掘作者写作主题与意图,并以此初步筛选候选段落;其次设计了基于自注意力机制的深度科技写作推荐模型,用于获取上下文语境的深度语义表示,以对候选段落进行排序;通过将预测排序结果与真实排序结果进行比较,获取召回率和归一化折损累积增益,以评价写作推荐方法的好坏。所述方法与传统的基于内容的引文推荐方法相比,在一个真实的科技论文写作推荐中进行推荐预测,取得最高的召回率和归一化折损累积增益。
-
公开(公告)号:CN111061935B
公开(公告)日:2022-04-12
申请号:CN201911292337.3
申请日:2019-12-16
Applicant: 北京理工大学
IPC: G06F16/951 , G06F16/9035 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于自注意力机制的科技写作推荐方法,属于计算机自然语言处理以及社交媒体技术领域。所述科技写作推荐方法,首先利用已有的段落写作内容,挖掘作者写作主题与意图,并以此初步筛选候选段落;其次设计了基于自注意力机制的深度科技写作推荐模型,用于获取上下文语境的深度语义表示,以对候选段落进行排序;通过将预测排序结果与真实排序结果进行比较,获取召回率和归一化折损累积增益,以评价写作推荐方法的好坏。所述方法与传统的基于内容的引文推荐方法相比,在一个真实的科技论文写作推荐中进行推荐预测,取得最高的召回率和归一化折损累积增益。
-
-