-
公开(公告)号:CN115221880A
公开(公告)日:2022-10-21
申请号:CN202210855621.2
申请日:2022-07-20
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F40/295 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种命名实体识别方法及终端,对获取的文本进行分词,得到文字序列,其包括字符文字序列;基于所述字符文字序列使用特征增强算法进行特征增强,并基于增强后的多元特征获取特征向量;使用多头注意力机制对特征向量进行时序编码,输出得到时序特征;对时序特征进行预测,得到最优标注序列,并根据其得到文本对应的命名实体识别结果,能够融合多元特征,利用多元特征有利于模型学习到更多的语义信息,且能够有效地获取字符序列之间的注意力,可在计算过程中将序列中任意两个字符直接联系起来,缩短距离依赖,有效利用特征完整表达整个文本的特征以及上下文特征,且字符之间能够相互关联,从而有效提高了命名实体识别的准确率。
-
公开(公告)号:CN115221322A
公开(公告)日:2022-10-21
申请号:CN202210855619.5
申请日:2022-07-20
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开一种基于联邦学习的文本情感分类方法及终端,通过建立全局模型和多组客户端模型,形成联邦学习的情感分类模型框架,不仅可以避免涉密训练数据外传以及隐私数据交叉外泄等安全问题,而且能节省大数据传输过程所消耗的资源,还具有较高的时效性;同时,分布式模型框架可以使AI模型能学习到来自不同客户的大量样本,极大提升模型泛化能力和效果,即基于联邦学习的情感分类模型框架,让模型在客户本地训练,使得数据只会存在于客户本地,而且又能获得一个强大的AI分类模型的效果。
-