-
公开(公告)号:CN114357158B
公开(公告)日:2024-04-09
申请号:CN202111500332.2
申请日:2021-12-09
Applicant: 南京中孚信息技术有限公司 , 中孚安全技术有限公司 , 中孚信息股份有限公司 , 北京中孚泰和科技发展股份有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/216 , G06F18/241 , G06N3/0442 , G06N3/09
Abstract: 本发明公开了计算机自然语言处理技术领域的基于句粒度语义和相对位置编码的长文本分类技术,包括句粒度语义预测提取和篇章主题预测,在垂直领域内多主题分布的长文本分类业务场景下,从语言语义分析、特征工程出发,运用计算机自然语言处理技术进行流水线、模块化开发,提高长文本分类业务开发的敏捷性和质量;引入流水线机制,将长文本分类分解为句粒度语义预测提取和篇章主题预测两个步骤,采用轻量级预训练模型提取句粒度语义特征,兼顾模型的准确性和效率。
-
公开(公告)号:CN114357158A
公开(公告)日:2022-04-15
申请号:CN202111500332.2
申请日:2021-12-09
Applicant: 南京中孚信息技术有限公司 , 中孚安全技术有限公司 , 中孚信息股份有限公司 , 北京中孚泰和科技发展股份有限公司
Abstract: 本发明公开了计算机自然语言处理技术领域的基于句粒度语义和相对位置编码的长文本分类技术,包括句粒度语义预测提取和篇章主题预测,在垂直领域内多主题分布的长文本分类业务场景下,从语言语义分析、特征工程出发,运用计算机自然语言处理技术进行流水线、模块化开发,提高长文本分类业务开发的敏捷性和质量;引入流水线机制,将长文本分类分解为句粒度语义预测提取和篇章主题预测两个步骤,采用轻量级预训练模型提取句粒度语义特征,兼顾模型的准确性和效率。
-