-
公开(公告)号:CN111339308A
公开(公告)日:2020-06-26
申请号:CN202010439816.X
申请日:2020-05-22
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提出了一种基础分类模型的训练方法、装置和电子设备,其中,上述方法包括:获取本轮训练语句样本,以进行本轮训练,对所述本轮训练语句样本进行向量转换,得到本轮训练语句向量;将所述本轮训练语句向量与预置业务标签向量输入预置基础分类模型中进行训练,得到本轮训练语句样本的类别概率;根据所述类别概率进行计算,得到本轮训练的损失,根据所述本轮训练的损失更新所述预置业务标签向量,以进行下一轮训练;通过本说明书提供的方法可以实现无监督的训练,由此可以提高训练的效率,并进一步提高分类的准确度。
-
公开(公告)号:CN111339308B
公开(公告)日:2020-09-22
申请号:CN202010439816.X
申请日:2020-05-22
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提出了一种基础分类模型的训练方法、装置和电子设备,其中,上述方法包括:获取本轮训练语句样本,以进行本轮训练,对所述本轮训练语句样本进行向量转换,得到本轮训练语句向量;将所述本轮训练语句向量与预置业务标签向量输入预置基础分类模型中进行训练,得到本轮训练语句样本的类别概率;根据所述类别概率进行计算,得到本轮训练的损失,根据所述本轮训练的损失更新所述预置业务标签向量,以进行下一轮训练;通过本说明书提供的方法可以实现无监督的训练,由此可以提高训练的效率,并进一步提高分类的准确度。
-
公开(公告)号:CN111475635B
公开(公告)日:2023-04-18
申请号:CN202010420180.4
申请日:2020-05-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F40/30 , G06N3/0442
Abstract: 本说明书提出了一种语义补全方法、装置和电子设备,其中,上述方法包括:获取待语义补全的第一语句,对所述第一语句进行向量转换,得到第一语句向量;获取第一文本,对所述第一文本进行向量转换,得到第一文本向量;将所述第一语句向量和所述第一文本向量输入预置注意力模型进行注意力计算,得到所述第一语句向量的注意力分布,根据所述注意力分布计算获得第一语句隐向量;根据所述第一语句隐向量进行归一化计算,得到语义补全后的第二语句;通过上述方法可以对语句进行语义补全,由此可以提高语句的清晰度,进而提高文本的可读性。
-
公开(公告)号:CN111475635A
公开(公告)日:2020-07-31
申请号:CN202010420180.4
申请日:2020-05-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F40/30 , G06N3/04
Abstract: 本说明书提出了一种语义补全方法、装置和电子设备,其中,上述方法包括:获取待语义补全的第一语句,对所述第一语句进行向量转换,得到第一语句向量;获取第一文本,对所述第一文本进行向量转换,得到第一文本向量;将所述第一语句向量和所述第一文本向量输入预置注意力模型进行注意力计算,得到所述第一语句向量的注意力分布,根据所述注意力分布计算获得第一语句隐向量;根据所述第一语句隐向量进行归一化计算,得到语义补全后的第二语句;通过上述方法可以对语句进行语义补全,由此可以提高语句的清晰度,进而提高文本的可读性。
-
公开(公告)号:CN111368081A
公开(公告)日:2020-07-03
申请号:CN202010138480.3
申请日:2020-03-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35
Abstract: 本说明书提供一种精选文本内容确定方法和系统。所述方法包括:获取文本内容;利用编码算法对所述文本内容进行编码,获得每个所述文本内容对应的句向量,计算所述句向量间的语义距离;基于所述语义距离,利用聚类算法对所述文本内容进行聚类,获得一个或多个文本内容类别;对于所述一个或多个文本内容类别中的每一个类别,利用复合评分方法对聚类后的每个文本内容进行评分,基于所述评分确定精选文本内容。
-
-
-
-