一种基于贝叶斯统计学习的医学古汉语句子切分方法

    公开(公告)号:CN107491439A

    公开(公告)日:2017-12-19

    申请号:CN201710800571.7

    申请日:2017-09-07

    Abstract: 本发明属于语言处理领域,公开了一种基于贝叶斯统计学习的医学古汉语句子切分方法,在所述的基于贝叶斯统计学习的医学古汉语句子切分方法对句子识别的朴素贝叶斯方法的基础之上,对于特征属性再添加二元组与三元组或者进行一元组、二元组、三元组多样特征属性组合得到多组实验数据结果,最后得出最佳模型;进而实现医学古汉语句子切分任务。本发明与实际处理文本内容相结合,通过本实验方法将现有技术各项特征的F值可提高至少25个百分点,本发明中系统地分析与归纳了医学古汉语文本句子识别规则,实现了可以应用于实际中医医学领域的处理方法,建立了医学古汉语文本的句子识别语料库,进一步让科研成果发挥出更大的作用。

    一种文章题目自动生成方法

    公开(公告)号:CN110413768B

    公开(公告)日:2022-05-03

    申请号:CN201910719567.7

    申请日:2019-08-06

    Abstract: 本发明属于自然语言处理技术领域,公开了一种文章题目自动生成方法,解决现有混合式题目生成方法存在着生成的题目可读性较差以及题目不够连贯的问题。本发明包括(1)输入文章;(2)对文章进行预处理;(3)对文章进行数据增强处理;(4)基于抽取式模型生成候选摘要;(5)根据步骤(4)中得到的候选摘要分别基于生成式模型生成候选题目;(5)基于3‑gram语言模型对生成的候选题目进行可读性评估获得连贯性最强的候选题目则为文章生成的题目。

    一种基于贝叶斯统计学习的医学古汉语句子切分方法

    公开(公告)号:CN107491439B

    公开(公告)日:2020-05-19

    申请号:CN201710800571.7

    申请日:2017-09-07

    Abstract: 本发明属于语言处理领域,公开了一种基于贝叶斯统计学习的医学古汉语句子切分方法,在所述的基于贝叶斯统计学习的医学古汉语句子切分方法对句子识别的朴素贝叶斯方法的基础之上,对于特征属性再添加二元组与三元组或者进行一元组、二元组、三元组多样特征属性组合得到多组实验数据结果,最后得出最佳模型;进而实现医学古汉语句子切分任务。本发明与实际处理文本内容相结合,通过本实验方法将现有技术各项特征的F值可提高至少25个百分点,本发明中系统地分析与归纳了医学古汉语文本句子识别规则,实现了可以应用于实际中医医学领域的处理方法,建立了医学古汉语文本的句子识别语料库,进一步让科研成果发挥出更大的作用。

    一种文章题目自动生成方法

    公开(公告)号:CN110413768A

    公开(公告)日:2019-11-05

    申请号:CN201910719567.7

    申请日:2019-08-06

    Abstract: 本发明属于自然语言处理技术领域,公开了一种文章题目自动生成方法,解决现有混合式题目生成方法存在着生成的题目可读性较差以及题目不够连贯的问题。本发明包括(1)输入文章;(2)对文章进行预处理;(3)对文章进行数据增强处理;(4)基于抽取式模型生成候选摘要;(5)根据步骤(4)中得到的候选摘要分别基于生成式模型生成候选题目;(5)基于3-gram语言模型对生成的候选题目进行可读性评估获得连贯性最强的候选题目则为文章生成的题目。

Patent Agency Ranking