-
公开(公告)号:CN111797409B
公开(公告)日:2024-03-26
申请号:CN202010226686.1
申请日:2020-03-26
Applicant: 中南林业科技大学
IPC: G06F21/60 , G06F16/31 , G06F16/33 , G06F16/35 , G06F40/289
Abstract: 本发明公开了一种大数据中文文本无载体信息隐藏方法,首先,对大数据中文文本进行预处理,主要包括对文本的分词、计算分词后词语的词频及TF‑IDF特征信息、对文本进行LDA主题模型聚类。然后,发送方对秘密信息进行切分,然后通过词语索引表转换为关键词ID,并在大数据文本中搜索包含秘密信息关键词的文本。其次,将搜索到的文本根据对应文本的主题分布和对应文本中的关键词的TF‑IDF特征作为索引标签,同时引入随机数控制秘密信息关键词顺序,最后将随机数与索引一起作为标签加密发送给接收方。实验表明,该方法在提升隐藏容量的同时,提高了秘密信息的隐蔽性与安全性。
-
公开(公告)号:CN111797409A
公开(公告)日:2020-10-20
申请号:CN202010226686.1
申请日:2020-03-26
Applicant: 中南林业科技大学
IPC: G06F21/60 , G06F16/31 , G06F16/33 , G06F16/35 , G06F40/289
Abstract: 本发明公开了一种大数据中文文本无载体信息隐藏方法,首先,对大数据中文文本进行预处理,主要包括对文本的分词、计算分词后词语的词频及TF-IDF特征信息、对文本进行LDA主题模型聚类。然后,发送方对秘密信息进行切分,然后通过词语索引表转换为关键词ID,并在大数据文本中搜索包含秘密信息关键词的文本。其次,将搜索到的文本根据对应文本的主题分布和对应文本中的关键词的TF-IDF特征作为索引标签,同时引入随机数控制秘密信息关键词顺序,最后将随机数与索引一起作为标签加密发送给接收方。实验表明,该方法在提升隐藏容量的同时,提高了秘密信息的隐蔽性与安全性。
-