一种大数据中文文本无载体信息隐藏方法

    公开(公告)号:CN111797409B

    公开(公告)日:2024-03-26

    申请号:CN202010226686.1

    申请日:2020-03-26

    Abstract: 本发明公开了一种大数据中文文本无载体信息隐藏方法,首先,对大数据中文文本进行预处理,主要包括对文本的分词、计算分词后词语的词频及TF‑IDF特征信息、对文本进行LDA主题模型聚类。然后,发送方对秘密信息进行切分,然后通过词语索引表转换为关键词ID,并在大数据文本中搜索包含秘密信息关键词的文本。其次,将搜索到的文本根据对应文本的主题分布和对应文本中的关键词的TF‑IDF特征作为索引标签,同时引入随机数控制秘密信息关键词顺序,最后将随机数与索引一起作为标签加密发送给接收方。实验表明,该方法在提升隐藏容量的同时,提高了秘密信息的隐蔽性与安全性。

    一种大数据中文文本无载体信息隐藏方法

    公开(公告)号:CN111797409A

    公开(公告)日:2020-10-20

    申请号:CN202010226686.1

    申请日:2020-03-26

    Abstract: 本发明公开了一种大数据中文文本无载体信息隐藏方法,首先,对大数据中文文本进行预处理,主要包括对文本的分词、计算分词后词语的词频及TF-IDF特征信息、对文本进行LDA主题模型聚类。然后,发送方对秘密信息进行切分,然后通过词语索引表转换为关键词ID,并在大数据文本中搜索包含秘密信息关键词的文本。其次,将搜索到的文本根据对应文本的主题分布和对应文本中的关键词的TF-IDF特征作为索引标签,同时引入随机数控制秘密信息关键词顺序,最后将随机数与索引一起作为标签加密发送给接收方。实验表明,该方法在提升隐藏容量的同时,提高了秘密信息的隐蔽性与安全性。

Patent Agency Ranking