一种文本分类方法
    2.
    发明授权

    公开(公告)号:CN116127079B

    公开(公告)日:2023-06-20

    申请号:CN202310425424.1

    申请日:2023-04-20

    Abstract: 本发明提供一种文本分类方法,基于待分类文本段的文本特征向量与各个文本类别的支持文本特征向量之间的语义相似度,确定该待分类文本段所属的文本类别,即使部分文本类别的支持文本段数量较少,仍能根据该文本类别的支持文本段的文本特征向量准确地归纳出该文本类别的支持文本特征向量,从而根据上述语义相似度识别出属于该文本类别的待分类文本段,减少多标签分类场景下遗漏类别标签的概率;此外,在进行文本特征提取时,充分运用了对应文本段的语法结构,从而提取更准确、更丰富的上下文信息,以结合各个非停用词本身的语义信息以及上下文语义信息进行整体语义提取,有助于提升政务文本分类的准确性。

    一种文本分类方法
    6.
    发明公开

    公开(公告)号:CN116127079A

    公开(公告)日:2023-05-16

    申请号:CN202310425424.1

    申请日:2023-04-20

    Abstract: 本发明提供一种文本分类方法,基于待分类文本段的文本特征向量与各个文本类别的支持文本特征向量之间的语义相似度,确定该待分类文本段所属的文本类别,即使部分文本类别的支持文本段数量较少,仍能根据该文本类别的支持文本段的文本特征向量准确地归纳出该文本类别的支持文本特征向量,从而根据上述语义相似度识别出属于该文本类别的待分类文本段,减少多标签分类场景下遗漏类别标签的概率;此外,在进行文本特征提取时,充分运用了对应文本段的语法结构,从而提取更准确、更丰富的上下文信息,以结合各个非停用词本身的语义信息以及上下文语义信息进行整体语义提取,有助于提升政务文本分类的准确性。

    一种基于可信数据空间的隐私数据处理系统

    公开(公告)号:CN119292797A

    公开(公告)日:2025-01-10

    申请号:CN202411836277.8

    申请日:2024-12-13

    Abstract: 本发明提供一种基于可信数据空间的隐私数据处理系统,涉及隐私处理技术领域,其系统包括:当监测到可信数据空间处于高负载情况时,获取可信数据空间的待处理隐私数据,构建分布式架构对待处理隐私数据进行分布式隐私处理;获取可信数据空间的配置数据,设定弹性扩展策略,根据处理配置需求进行弹性扩展处理;设定隐私处理层级,获取待处理隐私数据的数据量分布以及隐私数据量,确定待隐私处理层级,结合分布式隐私处理以及弹性扩展处理进行负载均衡处理;当可信数据空间持续处于高负载情况时,优化待处理隐私数据的隐私处理算法;有利于高效处理高负载情况下可信数据空间中的隐私数据。

Patent Agency Ranking