-
公开(公告)号:CN109711121B
公开(公告)日:2021-03-12
申请号:CN201811610142.4
申请日:2018-12-27
Applicant: 清华大学
IPC: G06F21/16 , G06F16/332
Abstract: 本发明公开了一种基于马尔可夫模型和哈夫曼编码的文本隐写方法及装置,方法包括:得到训练集,并构建相应的马尔可夫网络模型;按照词频排序生成词典D;构成预设列表;随机从预设列表中选择一个词作为训练好的Marcov网络模型的输入;迭代式计算各个时刻词的动态条件概率分布;选用排序靠前的N个词构成候选词词列表;构建哈夫曼树,并进行哈夫曼编码;根据需要嵌入的码流从哈夫曼树的根结点开始搜索,直到搜索到相应的叶子结点对应的词作为当前时刻的输出;重复执行直到生成完整的隐写文本;发送完整的隐写文本,以使接收方在接收隐写文本后,对隐写文本进行解码并获取机密消息。该方法可以有效提高生成隐写文本的质量,提升系统隐蔽性。
-
公开(公告)号:CN110083785A
公开(公告)日:2019-08-02
申请号:CN201910354376.5
申请日:2019-04-29
Applicant: 清华大学
IPC: G06F16/955 , G06F16/35 , G06F16/36 , G06N3/04
Abstract: 本发明公开了一种基于用户搜索记录的性别年龄判别方法及装置,其中,方法包括:对搜索记录中的词语进行建模,搜索得到每个词语的语义表示向量;对搜索记录进行建模,通过词语级的卷积神经网络捕获词语间上下文依赖关系,并选取满足第一预设条件的词语,以构建搜索记录的上下文表示向量;基于搜索记录对用户建模,通过记录级的卷积神经网络捕获搜索记录间的上下文依赖关系,并选取满足第二预设条件的搜索记录,以构建搜索用户的表示向量;基于用户表示向量的用户分类,通过全连接层对用户向量进行解码,并使用softmax函数对分类概率归一化。该方法有效地提升了用户性别年龄预测的性能,同时有广大的用户覆盖量。
-
公开(公告)号:CN110110318B
公开(公告)日:2021-02-05
申请号:CN201910058680.5
申请日:2019-01-22
Applicant: 清华大学
IPC: G06F40/279 , G06F40/216 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于循环神经网络的文本隐写检测方法及系统,其中,该方法包括:获取词向量矩阵,根据词向量矩阵将待检测文本转化为输入词向量序列;将输入词向量序列输入到预先构建的循环神经网络模型中,生成表示待检测文本词语间相关关系的特征向量;通过分类器对特征向量进行分类,判断待检测文本是否包含隐藏信息;若待检测文本包含隐藏信息,则根据不同嵌入率下隐写文本特征向量的区别估计待检测文本的信息嵌入率。该方法将循环神经网络运用到文本隐写检测中,能有效鉴别文本载体是否含有隐藏信息,并根据抽取特征的统计分布准确估计隐藏信息的容量。
-
公开(公告)号:CN110110318A
公开(公告)日:2019-08-09
申请号:CN201910058680.5
申请日:2019-01-22
Applicant: 清华大学
Abstract: 本发明公开了一种基于循环神经网络的文本隐写检测方法及系统,其中,该方法包括:获取词向量矩阵,根据词向量矩阵将待检测文本转化为输入词向量序列;将输入词向量序列输入到预先构建的循环神经网络模型中,生成表示待检测文本词语间相关关系的特征向量;通过分类器对特征向量进行分类,判断待检测文本是否包含隐藏信息;若待检测文本包含隐藏信息,则根据不同嵌入率下隐写文本特征向量的区别估计待检测文本的信息嵌入率。该方法将循环神经网络运用到文本隐写检测中,能有效鉴别文本载体是否含有隐藏信息,并根据抽取特征的统计分布准确估计隐藏信息的容量。
-
公开(公告)号:CN109711121A
公开(公告)日:2019-05-03
申请号:CN201811610142.4
申请日:2018-12-27
Applicant: 清华大学
IPC: G06F21/16 , G06F16/332
Abstract: 本发明公开了一种基于马尔可夫模型和哈夫曼编码的文本隐写方法及装置,方法包括:得到训练集,并构建相应的马尔可夫网络模型;按照词频排序生成词典D;构成预设列表;随机从预设列表中选择一个词作为训练好的Marcov网络模型的输入;迭代式计算各个时刻词的动态条件概率分布;选用排序靠前的N个词构成候选词词列表;构建哈夫曼树,并进行哈夫曼编码;根据需要嵌入的码流从哈夫曼树的根结点开始搜索,直到搜索到相应的叶子结点对应的词作为当前时刻的输出;重复执行直到生成完整的隐写文本;发送完整的隐写文本,以使接收方在接收隐写文本后,对隐写文本进行解码并获取机密消息。该方法可以有效提高生成隐写文本的质量,提升系统隐蔽性。
-
-
-
-