-
公开(公告)号:CN110807069B
公开(公告)日:2022-06-07
申请号:CN201911011199.7
申请日:2019-10-23
Applicant: 华侨大学
IPC: G06F16/28 , G06F16/36 , G06F40/284
Abstract: 本发明公开了一种基于强化学习算法的实体关系联合抽取模型构建方法,包括:输入文本,采用联合抽取标注策略对原始语料中的每条语句的词语进行实体关系标注;将文本转化为word2vec向量;预训练LSTM联合抽取器;初始化训练器网络并打乱袋子顺序;计算当前语句奖励值;计算总期望奖励值;利用优化函数更新模型参数;如果模型已收敛,对模型进行超参数的调优训练;如果超参数为最优解,生成最终的实体关系联合抽取方案。本发明基于策略梯度优化算法构建强化学习模型,能对复杂的自然语言类型原始语料的语句实体关系联合抽取问题进行有效求解,并能有效提高实体关系抽取的准确率和F1值。
-
公开(公告)号:CN110807069A
公开(公告)日:2020-02-18
申请号:CN201911011199.7
申请日:2019-10-23
Applicant: 华侨大学
IPC: G06F16/28 , G06F16/36 , G06F40/284
Abstract: 本发明公开了一种基于强化学习算法的实体关系联合抽取模型构建方法,包括:输入文本,采用联合抽取标注策略对原始语料中的每条语句的词语进行实体关系标注;将文本转化为word2vec向量;预训练LSTM联合抽取器;初始化训练器网络并打乱袋子顺序;计算当前语句奖励值;计算总期望奖励值;利用优化函数更新模型参数;如果模型已收敛,对模型进行超参数的调优训练;如果超参数为最优解,生成最终的实体关系联合抽取方案。本发明基于策略梯度优化算法构建强化学习模型,能对复杂的自然语言类型原始语料的语句实体关系联合抽取问题进行有效求解,并能有效提高实体关系抽取的准确率和F1值。
-
公开(公告)号:CN111651970B
公开(公告)日:2022-07-22
申请号:CN202010675938.9
申请日:2020-07-14
Applicant: 华侨大学
Abstract: 本发明提供一种基于表格型数据生成文本的方法、装置、设备及存储介质,包括:构建数据特征表示空间,其中,所述数据特征表示空间包括记录编码层、内容选择层以及内容规划层,以实现层次化的特征表示;通过训练特征表示空间到输出向量的映射关系,构建深度生成网络;构建表格型数据到文本的生成模型;基于所述生成模型将输入的待转换的表格型数据转换为文本输出。本发明将基于层次化结构的数据特征表示与深度生成的文本生成技术融合,能够对整个表格型数据中的每条样本数据记录进行理解与推理,能够实现将结构化数据转换为全局语义连贯长文本,丰富了输入数据推理方式与输出文本表达多样性,有效提升数据到文本生成模型中BLEU与PPL等性能评测指标。
-
公开(公告)号:CN111651970A
公开(公告)日:2020-09-11
申请号:CN202010675938.9
申请日:2020-07-14
Applicant: 华侨大学
Abstract: 本发明提供一种基于表格型数据生成文本的方法、装置、设备及存储介质,包括:构建数据特征表示空间,其中,所述数据特征表示空间包括记录编码层、内容选择层以及内容规划层,以实现层次化的特征表示;通过训练特征表示空间到输出向量的映射关系,构建深度生成网络;构建表格型数据到文本的生成模型;基于所述生成模型将输入的待转换的表格型数据转换为文本输出。本发明将基于层次化结构的数据特征表示与深度生成的文本生成技术融合,能够对整个表格型数据中的每条样本数据记录进行理解与推理,能够实现将结构化数据转换为全局语义连贯长文本,丰富了输入数据推理方式与输出文本表达多样性,有效提升数据到文本生成模型中BLEU与PPL等性能评测指标。
-
-
-