-
公开(公告)号:CN117688168A
公开(公告)日:2024-03-12
申请号:CN202211043064.0
申请日:2022-08-29
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
Abstract: 本申请实施例公开了一种摘要生成的方法以及相关装置,至少涉及人工智能中的自然语言处理、机器学习、计算机视觉等技术。该方法包括对待处理文档中的文本信息进行特征提取处理,得到文本信息对应的文本特征向量,以及对待处理文档中的图片进行特征提取处理,得到图片对应的图片特征向量;对文本特征向量进行自注意力处理,得到第一文本特征向量;对第一文本特征向量与图片特征向量进行自注意力处理,得到目标特征向量;基于摘要生成模型对目标特征向量和第一摘要词进行预测处理,生成待处理文档的目标摘要信息。通过上述方式,能够准确地生成待处理文档的目标摘要信息,使得目标摘要信息精准地表达文档所需表达的主要内容,提高摘要的准确性。
-
公开(公告)号:CN104699263B
公开(公告)日:2018-04-03
申请号:CN201510120023.0
申请日:2015-03-18
Applicant: 北京交通大学
IPC: G06F3/023
Abstract: 本发明公开了一种获取符号串的方法和装置,属于自然语言处理研究领域。所述方法包括:获取输入的信息中包含的第一符号串;根据第二符号串生成与所述第二符号串具有对称性结构的第三符号串,所述第二符号串为所述第一符号串或为所述第一符号串的子符号串;将所述第二符号串和所述第三符号串组成第四符号串。所述装置包括:第一获取模块,生成模块,和组成模块。本发明中能够根据用户当前输入的第一符号串第三符号串,将第二符号串和第三符号串组成第四符号串,从而自动生成和实现符号库中所没有的表情符号,满足用户的个性化需求。
-
公开(公告)号:CN104699263A
公开(公告)日:2015-06-10
申请号:CN201510120023.0
申请日:2015-03-18
Applicant: 北京交通大学
IPC: G06F3/023
CPC classification number: G06F3/0233 , G06F3/0237
Abstract: 本发明公开了一种获取符号串的方法和装置,属于自然语言处理研究领域。所述方法包括:获取输入的信息中包含的第一符号串;根据第二符号串生成与所述第二符号串具有对称性结构的第三符号串,所述第二符号串为所述第一符号串或为所述第一符号串的子符号串;将所述第二符号串和所述第三符号串组成第四符号串。所述装置包括:第一获取模块,生成模块,和组成模块。本发明中能够根据用户当前输入的第一符号串第三符号串,将第二符号串和第三符号串组成第四符号串,从而自动生成和实现符号库中所没有的表情符号,满足用户的个性化需求。
-
公开(公告)号:CN111368079B
公开(公告)日:2024-06-25
申请号:CN202010129553.2
申请日:2020-02-28
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F16/35 , G06F40/289
Abstract: 本申请公开了一种应用于人工智能领域的文本分类方法,包括:获取待分类文本;通过编码器获取待分类文本中每个词语所对应的隐藏状态;根据每个词语所对应的隐藏状态,获取每个词语所对应的深度值;根据每个词语所对应的深度值以及每个词语所对应的词嵌入,生成每个词语所对应的词特征向量;基于每个词语所对应的词特征向量,通过文本分类模型获取待分类文本所对应的文本编码结果;通过文本分类模型获取待分类文本的分类结果。本申请还公开了一种模型训练的方法。本申请可以自适应地获取文本中每个词语所对应的深度值,使得文本分类模型根据不同的深度值对相应的词语进行编码,从而能够对文本中的词语进行执行充分计算。
-
公开(公告)号:CN117473359A
公开(公告)日:2024-01-30
申请号:CN202311178879.4
申请日:2023-09-12
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F18/24 , G06F18/25 , G06F18/22 , G06F40/289 , G06F40/284 , G06N3/08
Abstract: 本申请公开一种摘要生成模型的训练方法及相关装置;方法包括:初始生成模型包括编码器、融合器和解码器,将第一批量样本中第一样本文本、第一样本图像和第一样本摘要输入编码器,编码输出第一文本向量、第一图像向量、第一对象向量和第一摘要分词向量。将第一文本向量和第一图像向量输入融合器,跨模态融合输出第一融合向量;将第一融合向量和第一样本摘要的第一表示向量输入解码器,解码输出第一概率密度。通过最大化第一概率密度、第一对象向量与第一摘要分词向量之间的第一相似度、最小化第一对象向量与多个第二摘要分词向量之间的多个第二相似度,训练初始生成模型的模型参数得到摘要生成模型。该方法提升摘要生成模型的摘要效果。
-
公开(公告)号:CN113836946B
公开(公告)日:2023-11-14
申请号:CN202111069233.3
申请日:2021-09-13
Applicant: 北京交通大学 , 东芝(中国)有限公司
Abstract: 本申请公开了一种训练评分模型的方法、装置、终端及存储介质,属于互联网技术领域。该方法包括:获取样本原文、第一样本译文以及至少一个第二样本译文,其中,第一样本译文的语义和样本原文对应的语义相同,第二样本译文的语义与第一样本译文的语义不同;将样本原文和第一样本译文输入评分模型,得到第一样本译文对应的第一样本分数,将样本原文分别和每个第二样本译文输入评分模型,得到每个第二样本译文对应的第二样本分数;基于第一样本分数以及至少一个第二样本分数,确定损失信息;基于损失信息,对评分模型进行调整。可见,本申请实施例解决了在没有样本译文对应的基准分数下,无法对评分模型进行训练的问题。
-
公开(公告)号:CN116468050A
公开(公告)日:2023-07-21
申请号:CN202310538987.1
申请日:2023-05-12
Applicant: 北京天润融通科技股份有限公司 , 北京交通大学
IPC: G06F40/30 , G06F40/194 , G06F16/35 , G06F16/332 , G06F40/289 , G06N3/08
Abstract: 本发明公开了一种基于深度学习的文本机器人训练方法、系统、设备及介质,所述方法包括:基于原始意图整理预设数量的种子语料,将种子语料导入到文本机器人知识库中;识别所有意图中的问题数据,并对问题数据进行修正;所有意图包括原始意图和种子语料;对所有意图进行批量扩写;识别扩写后的意图中是否包含混淆语料;当包含时,对混淆语料进行修正;通过原始意图、种子语料和扩写后的修正意图训练文本机器人模型;验证文本机器人模型是否符合预期;当不符合预期时,通过对单个意图进行扩写或对单个语料做调整或扩写,再次训练文本机器人模型,直至文本机器人模型符合预期。通过本公开的处理方案,可以高效、准确的对文本机器人进行训练。
-
公开(公告)号:CN115545048A
公开(公告)日:2022-12-30
申请号:CN202110744263.3
申请日:2021-06-30
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
Abstract: 本申请属于人工智能技术领域,具体涉及一种数据处理方法、数据处理装置、计算机可读介质以及电子设备。本申请实施例中的数据处理方法,包括:获取源端输入样本以及与所述源端输入样本相关联的目标输出样本;对源端输入样本进行编码处理得到所述源端输入样本的中间语义特征;按照解码步骤对目标端输入样本和所述中间语义特征进行解码处理得到与所述源端输入样本相对应的实际输出数据,所述目标端输入样本是对所述目标输出样本和所述实际输出数据进行采样得到的混合样本;按照所述解码步骤逐步增大所述实际输出数据在所述目标端输入样本中的分布比例。该方法可以在保证模型训练效率的同时提高模型训练精度。
-
公开(公告)号:CN115392266A
公开(公告)日:2022-11-25
申请号:CN202110567123.3
申请日:2021-05-24
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
Abstract: 本申请提供了一种翻译模型的训练方法、装置和存储介质。该方法包括:获取待训练文本,待训练本文包括至少源输入语句和与源输入语句相对应的标准目标语句;利用翻译模型基于源输入语句对目标语句进行预测,得到第一预测目标语句;基于标准目标语句和预测目标语句计算针对目标语句中每个词语位置处的置信概率;基于置信概率确定标准目标语句和预测目标语句的组合作为翻译模型的目标语句输入。本申请提出的调度采样策略大大减轻了NMT模型的暴露偏差问题,大幅提升了翻译质量,并且可用于对线上翻译系统进行改进。
-
公开(公告)号:CN114528852A
公开(公告)日:2022-05-24
申请号:CN202210140138.6
申请日:2022-02-15
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
Abstract: 本申请实施例公开了一种数据处理方法、装置、计算机设备以及存储介质。其中方法包括:获取样本语料集,样本语料集包括目标样本语料对,目标样本语料对包括第一样本语句和第二样本语句,第二样本语句是第一样本语句翻译后的语句;根据第一样本语句和第二样本语句中j‑1个数据对第二样本语句中第j个数据进行概率预测处理,得到第j个数据的第一预测概率;根据前j‑1个数据对第二样本语句的第j个数据进行概率预测处理,得到第j个数据的第二预测概率;根据第j个数据的第一预测概率和第二预测概率对初始模型进行训练,得到目标模型;获取输入语句,将输入语句输入目标模型,生成翻译后的输出语句。以使得文本翻译更准确,提高数据处理准确性。
-
-
-
-
-
-
-
-
-