掩蔽文档中的敏感信息
    1.
    发明公开

    公开(公告)号:CN114386085A

    公开(公告)日:2022-04-22

    申请号:CN202111208569.3

    申请日:2021-10-18

    Abstract: 本发明公开涉及掩蔽文档中的敏感信息。示例性实施例公开了一种用于保护敏感信息的方法、计算机程序产品和计算机系统。示例性实施例可以包括:使用倒排文本索引来评估倒排文本索引的索引令牌的一个或多个统计度量,使用一个或多个统计度量来选择候选令牌集合,从所述倒排文本索引中提取元数据,将该候选令牌集合与对应的令牌元数据相关联,对至少一个文档进行令牌化,从而产生一个或多个文档令牌,将一个或多个文档令牌与候选令牌集合进行比较,选择要掩蔽文档令牌集合,根据相关联的令牌元数据来选择包括敏感信息的文档令牌集合的至少一部分,掩蔽文档令牌集合的至少一部分,以及提供一个或多个掩蔽文档。

    掩蔽文档中的敏感信息

    公开(公告)号:CN114386085B

    公开(公告)日:2024-12-20

    申请号:CN202111208569.3

    申请日:2021-10-18

    Abstract: 本发明公开涉及掩蔽文档中的敏感信息。示例性实施例公开了一种用于保护敏感信息的方法、计算机程序产品和计算机系统。示例性实施例可以包括:使用倒排文本索引来评估倒排文本索引的索引令牌的一个或多个统计度量,使用一个或多个统计度量来选择候选令牌集合,从所述倒排文本索引中提取元数据,将该候选令牌集合与对应的令牌元数据相关联,对至少一个文档进行令牌化,从而产生一个或多个文档令牌,将一个或多个文档令牌与候选令牌集合进行比较,选择要掩蔽文档令牌集合,根据相关联的令牌元数据来选择包括敏感信息的文档令牌集合的至少一部分,掩蔽文档令牌集合的至少一部分,以及提供一个或多个掩蔽文档。

Patent Agency Ranking