针对非连续实体的实体关系联合抽取方法及装置

    公开(公告)号:CN118551764A

    公开(公告)日:2024-08-27

    申请号:CN202411028372.5

    申请日:2024-07-30

    Abstract: 本发明提供一种针对非连续实体的实体关系联合抽取方法及装置。该方法属于信息抽取和自然语言处理技术领域,包括:利用实体关系抽取模型预测待处理文本中每两个字符间的关系;对实体关系抽取模型的训练,首先将训练文本中的每两个字符作为字符组合存储在表格中,并对表格中的字符组合进行字符间关系的标注;利用该模型中的空洞卷积层和联合分类器对字符组合进行字符间关系标签的预测;基于真实标签信息和预测标签信息计算损失来训练该模型。本发明提供的针对非连续实体的实体关系联合抽取方法及装置,利用空洞卷积和联合分类器对字符组合构成的表格进行标签预测,实现了对非连续实体关系的联合抽取,提高了模型在复杂场景的适应能力。

    基于深度神经网络的新闻流行度预测模型训练方法

    公开(公告)号:CN110083699A

    公开(公告)日:2019-08-02

    申请号:CN201910202638.6

    申请日:2019-03-18

    Abstract: 本发明提出了一种基于深度神经网络的新闻流行度预测模型训练方法,包括:获取特定主题设定时间段的新闻文章数据,用Pandas进行数据清洗后按照设定时间长度进行顺次分组,获取按时间顺序排列得到新闻流行度序列;依据所述新闻流行度序列,从第一个流行度开始依次按照采样长度为w的连续序列作为输入样本,并采样其之后一期的数据作为输出样本,构建训练样本集;随机从训练样本集中选择训练样本对基于LSTM网络的新闻流行度预测模型进行训练,并采用Pearson相关系数进行关联性分析删除不良的训练样本,循环训练过程至训练结束。本发明可以获得用来对无趋势性、无季节性及非线性新闻流行度进行较高准确率预测的新闻流行度预测模型。

    语言命名实体识别方法、语言识别装置、电子设备及介质

    公开(公告)号:CN115358233A

    公开(公告)日:2022-11-18

    申请号:CN202210798992.1

    申请日:2022-07-06

    Abstract: 本发明提供一种语言命名实体识别方法、语言识别装置、电子设备及介质,该方法包括:获取目标语言对应的待标注数据集;根据所述待标注数据集,基于语言预测模型,得到目标预测数据;根据预设的已标注数据集及所述目标预测数据,得到目标数据集;根据所述目标数据集,基于语言识别模型,得到所述目标语言对应的实体识别结果。该方法用以解决现有技术中由于一些目标语言及这些目标语言对应的样本数据集具有一定的局限性,易导致电子设备无法对上述这些目标语言进行准确识别的缺陷,实现电子设备可对这些目标语言进行准确识别,得到准确性较高的实体识别结果。

    神经机器翻译模型的训练方法、翻译方法及装置

    公开(公告)号:CN115345181A

    公开(公告)日:2022-11-15

    申请号:CN202210786892.7

    申请日:2022-07-04

    Abstract: 本发明提供一种神经机器翻译模型的训练方法、翻译方法及装置,所述训练方法包括:构建神经机器翻译模型;将双语平行句对中的源语言句子和目标语言句子,以及知识图谱中每个三元组中的头实体和尾实体进行细粒度切分,得到标准源语言句子序列、标准目标语言句子序列以及知识图谱中每个三元组中的标准头实体‑关系序列和标准尾实体序列;将其输入编解码模块中预测得到目标语言句子序列以及尾实体序列;基于标准目标语言句子序列和预测的目标语言句子序列之间的交叉熵,以及知识图谱中每个三元组中的标准尾实体序列与预测的尾实体序列之间的交叉熵,共同训练该模型。本发明能够有效融合细粒度知识推断,提升神经机器翻译对于实体的翻译质量。

    基于深度神经网络的新闻流行度预测模型训练方法

    公开(公告)号:CN110083699B

    公开(公告)日:2021-01-12

    申请号:CN201910202638.6

    申请日:2019-03-18

    Abstract: 本发明提出了一种基于深度神经网络的新闻流行度预测模型训练方法,包括:获取特定主题设定时间段的新闻文章数据,用Pandas进行数据清洗后按照设定时间长度进行顺次分组,获取按时间顺序排列得到新闻流行度序列;依据所述新闻流行度序列,从第一个流行度开始依次按照采样长度为w的连续序列作为输入样本,并采样其之后一期的数据作为输出样本,构建训练样本集;随机从训练样本集中选择训练样本对基于LSTM网络的新闻流行度预测模型进行训练,并采用Pearson相关系数进行关联性分析删除不良的训练样本,循环训练过程至训练结束。本发明可以获得用来对无趋势性、无季节性及非线性新闻流行度进行较高准确率预测的新闻流行度预测模型。

Patent Agency Ranking