-
公开(公告)号:CN108984525A
公开(公告)日:2018-12-11
申请号:CN201810741530.X
申请日:2018-07-06
Applicant: 北京邮电大学
CPC classification number: G06F17/274 , G06F17/277 , G06N3/0445
Abstract: 本发明公开了一种加入文本信息的词向量的中文语法错误检测方法及装置,属于信息处理领域。该方法的特征包括:先对输入的文本的词语进行向量化,形成文本矩阵;再利用循环神经网络形成各词向量相关的文本信息;重建文本矩阵;利用循环神经网络提取上下文信息;之后利用前向神经网络计算各个词语错误性得分;使用错误性得分推断错误位置。本发明通过结合基于文本化词向量,使得中文语法检测效果得到提升,具有很大的使用价值。
-
公开(公告)号:CN107644074A
公开(公告)日:2018-01-30
申请号:CN201710845221.2
申请日:2017-09-19
Applicant: 北京邮电大学
Abstract: 本发明实施例公开了一种基于卷积神经网络的中文教材可读性分析的方法。该方法包括如下步骤:文本中词变换为词向量步骤;生成文本向量步骤;文本难易程度分类步骤。利用本发明实施例,能够可靠的实现对文本难易程度的分类,提高分类速度及准确率,具有很大的实用价值。
-
公开(公告)号:CN108959260B
公开(公告)日:2019-05-28
申请号:CN201810735068.2
申请日:2018-07-06
Applicant: 北京邮电大学
Abstract: 本发明公开了一种中文语法错误检测方法及装置,属于信息处理领域。该方法的特征包括:先对输入的文本词语向量化,连接形成文本矩阵;再利用循环神经网络形成关于词向量中各分量重要程度的掩码;重建文本矩阵;利用循环神经网络提取上下文信息;利用前向神经网络计算各个词语错误性得分;使用错误性得分推断错误位置。本发明通过结合基于文本化词向量,使得中文语法检测效果得到提升,具有很大的使用价值。
-
公开(公告)号:CN108959260A
公开(公告)日:2018-12-07
申请号:CN201810735068.2
申请日:2018-07-06
Applicant: 北京邮电大学
CPC classification number: G06F17/271 , G06N3/0445 , G06N3/0454 , G06N3/084
Abstract: 本发明公开了一种中文语法错误检测方法及装置,属于信息处理领域。该方法的特征包括:先对输入的文本词语向量化,连接形成文本矩阵;再利用循环神经网络形成关于词向量中各分量重要程度的掩码;重建文本矩阵;利用循环神经网络提取上下文信息;利用前向神经网络计算各个词语错误性得分;使用错误性得分推断错误位置。本发明通过结合基于文本化词向量,使得中文语法检测效果得到提升,具有很大的使用价值。
-
公开(公告)号:CN107679199A
公开(公告)日:2018-02-09
申请号:CN201710941048.6
申请日:2017-10-11
Applicant: 北京邮电大学
Abstract: 本发明实施例公开了一种基于深度局部特征的对外汉语教材可读性分析方法。该方法包括如下步骤:输入文本的词语向量化步骤;卷积神经网络提取文本特征步骤;双向长短期记忆网络生成文本向量步骤;文本分类步骤。利用本发明实施例,能够可靠的对对外汉语教材可读性进行分类,提高分类速度及准确率,具有很大的实用价值。
-
公开(公告)号:CN110309512A
公开(公告)日:2019-10-08
申请号:CN201910606372.1
申请日:2019-07-05
Applicant: 北京邮电大学
Abstract: 本发明公开了一种基于生成对抗网络的中文语法错误更正方法,属于信息处理领域。该方法的特征包括:先利用生成网络生成更正语句;利用判别网络计算损失函数,优化生成网络;利用判别网络判别句子更正来源;优化判别网络;对生成网络与判别网络不断迭代优化。本发明通过生成对抗网络,使得中文语法错误更正效果得到提升,具有很大的使用价值。
-
公开(公告)号:CN108984525B
公开(公告)日:2019-07-12
申请号:CN201810741530.X
申请日:2018-07-06
Applicant: 北京邮电大学
Abstract: 本发明公开了一种加入文本信息的词向量的中文语法错误检测方法及装置,属于信息处理领域。该方法的特征包括:先对输入的文本的词语进行向量化,形成文本矩阵;再利用循环神经网络形成各词向量相关的文本信息;重建文本矩阵;利用循环神经网络提取上下文信息;之后利用前向神经网络计算各个词语错误性得分;使用错误性得分推断错误位置。本发明通过结合基于文本化词向量,使得中文语法检测效果得到提升,具有很大的使用价值。
-
公开(公告)号:CN109766553A
公开(公告)日:2019-05-17
申请号:CN201910018546.2
申请日:2019-01-09
Applicant: 北京邮电大学
Abstract: 本发明提供了一种基于多正则化结合的胶囊模型的中文分词方法,通过增加胶囊滑动窗口capsule sliding window,将胶囊模型迁移应用到自然语言处理NLP序列标注任务即中文分词任务中,解决了胶囊模型并不适用于序列标注的任务的技术问题;将多个正则化项联合,实现简单的领域迁移,本发明将胶囊模型适应到序列标注任务上,完成了更高准确率的中文分词,帮助更复杂的自然语言处理任务;通过多正则项的联合,提升了模型的泛化能力,实现了一定的领域迁移,能够减少人工语料的标注,降低在自然语言处理研究时人工标注语料的人工和时间成本。
-
-
-
-
-
-
-