一种答题内容评测方法及装置

    公开(公告)号:CN110069783A

    公开(公告)日:2019-07-30

    申请号:CN201910360959.9

    申请日:2019-04-30

    Abstract: 本申请公开了一种答题内容评测方法及装置,本方法对于待评测答题内容确定其深度特征,基于该深度特征可自动确定待评测答题内容的评测结果,由此可见,本方案能够实现自动对待评测答题内容进行评测的目的,相比于现有的人工评测方法,具有耗时短、效率高的优点,并且大大降低了人工成本。进一步,深度特征具备相比于相同评测结果,对不同评测结果对应的答题内容的表征差异性更大的能力,和/或,具备对差别越大的评测结果对应的答题内容的表征差异性越大的能力,所以本方法充分考虑不同评测结果对应的答题内容之间的差异性,提高了评测结果的准确性。

    一种对话语料库的扩容方法、装置、设备及存储介质

    公开(公告)号:CN112231458A

    公开(公告)日:2021-01-15

    申请号:CN202011146220.7

    申请日:2020-10-23

    Abstract: 本申请提供了一种对话语料库的扩容方法、装置、设备及存储介质,其中,方法包括:获取输入文本总集;从输入文本总集中滤除在当前的对话语料库中存在匹配回复文本的输入文本,剩余的输入文本组成的集合作为目标输入文本集;利用预先建立的生成式对话生成模型,生成目标输入文本集中输入文本对应的回复文本,以得到第一对话语料集;将第一对话语料集中的对话语料加入当前的对话语料库。本申请提供的对话语料库的扩容方法可利用生成式对话生成模型自动生成输入文本对应的回复文本,从而得到对话语料,由于加入对话语料的对话语料自动生成,而无需人工编写,因此,获取对话语料的效率较高,人工成本较低。

    一种文本处理方法及装置

    公开(公告)号:CN108090098A

    公开(公告)日:2018-05-29

    申请号:CN201611045923.4

    申请日:2016-11-22

    Abstract: 本发明实施例提供了一种文本处理方法及装置,其中方法包括:获取待处理文本数据;根据文本分类模型获取所述文本数据属于每个预设类别的概率,其中所述文本分类模型用于根据所述文本数据的标题及所述文本数据所包含的句子对所述文本数据分类;根据所述文本数据属于每个预设类别的概率确定所述文本数据的类别。在本发明实施例中,使用文本分类模型从标题+全文这种篇章角度对待分类文本进行分类,得到当前文本属于每个预设类别的概率,再在此基础上最终确定文本的类别,这样有效地提高了文本分类的效率,同时也提高了文本分类的准确性,降低了人的主观性对分类结果的影响。

    一种定标集确定方法及装置

    公开(公告)号:CN110096708B

    公开(公告)日:2023-12-01

    申请号:CN201910361757.6

    申请日:2019-04-30

    Abstract: 本申请公开了一种定标集确定方法及装置,本方法首先获取各答题对象对目标题目的答题内容,然后根据各所述答题内容间的属性差别,对各答题内容进行聚类,通过聚类可以将属性相近的答题内容聚集到一个聚类簇中,由此得到至少两个聚类簇,其中,从属于同一聚类簇的各答题内容的属性差别更小,而从属于不同聚类簇的答题内容的属性差别更大。进一步,从每个聚类簇中抽取答题内容,由抽取的答题内容组成定标集。综上可见,本申请抽取的定标集包含了各个聚类簇中的答题内容,也即覆盖了各属性的答题内容,保证了定标集的均衡性。进一步,基于本申请抽取的定标集训练的自动评测模型,其评测准确度也会更高。

Patent Agency Ranking