一种识别用户名缩写现象的方法

    公开(公告)号:CN106168946A

    公开(公告)日:2016-11-30

    申请号:CN201610474472.X

    申请日:2016-06-24

    CPC classification number: G06F17/2765 G06F17/30867

    Abstract: 本发明提供一种识别用户名缩写现象的方法,步骤包括:1)对两个或两个以上的用户名中的字符进行过滤,仅保留英文字母和数字;2)将上述过滤后的用户名各分割成若干个连续片段,各选取每个片段的首字符组成一新字符串;3)根据上述新字符串获取最长缩写词长度,如长度值大于或等于给定阈值ΔL,则判定所述用户名间具有用户名缩写现象;将保留的英文字母统一转换成小写或大写的形式;所述片段为单词或单个字符;所述片段根据指定的字典分割得到;采用动态规划算法根据所述新字符串获取最长缩写词长度。

    一种基于核心网络的数据秘密共享系统及方法

    公开(公告)号:CN103458046B

    公开(公告)日:2016-09-07

    申请号:CN201310418482.8

    申请日:2013-09-13

    Abstract: 本发明涉及一种基于核心网络的数据秘密共享系统及方法,包括信息发布端将待发送的目标信息隐藏在掩体信息中,将掩体信息发布到特定网络应用中,当有无辜用户下载特定网络应用中的资源时,下载的信息流经转发路由器,转发路由器识别下载的信息是否为掩体信息,如果是则复制掩体信息,将原信息发送给无辜用户,将复制的掩体信息通过后台服务器发送给真正的信息接收端;上述隐蔽握手过程只需要信息的发布端和路由器参与,不需要信息接收端参与,这种方式在提高隐蔽通信效率的同时,也增加了敌手检测的难度,并且将待发送的目标信息隐藏在掩体信息中,提高信息传输的隐蔽性。

    一种文档多重数字水印嵌入、提取方法及装置

    公开(公告)号:CN103761459B

    公开(公告)日:2016-08-17

    申请号:CN201410035906.7

    申请日:2014-01-24

    Abstract: 本发明涉及一种文档多重数字水印嵌入、提取方法及装置,文档多重数字水印嵌入方法,包括以下步骤:获取用户输入的原始水印信息、密钥及待处理的文档;计算原始水印信息中的摘要信息,生成新水印信息;将原始水印信息和新水印信息共同作为一条数据库记录存入数据库;将文档中的字符划分为两层,根据文档第一层的字符总数、新水印信息位的长度,得到待嵌入文档第一层的新水印信息的组数,将多组新水印信息按照从前往后的顺序嵌入到文档第一层中的属性位中;按照从后往前的顺序将多组新水印信息嵌入到文档第二层中的属性位中。本发明基于Word格式文档的字符属性,使用密钥提高了安全性,重复嵌入加强了鲁棒性,多重嵌入提高了水印容量。

    一种面向通信网络的用户行为模式挖掘方法及系统

    公开(公告)号:CN103744994A

    公开(公告)日:2014-04-23

    申请号:CN201410030664.2

    申请日:2014-01-22

    CPC classification number: G06F17/30702

    Abstract: 本发明涉及一种面向通信网络的用户行为模式挖掘方法及系统,包括:获取一系列网络快照,根据活跃度确定研究对象,确定M个与研究对象相关的相关特征,并根据相关特征计算每个网络快照的特征矩阵,进而计算基准特征矩阵;对基准特征矩阵和每个网络快照的特征矩阵做标准化处理,分解标准化基准特征矩阵得到模元矩阵和系数矩阵;利用每个网络快照的标准化特征矩阵和模元矩阵计算每个网络快照中所有研究对象的行为模式矩阵,即本发明采用“相关特征-模元-行为模式”的三元对应关系表示用户行为模式,为用户的通信行为模式提供统一的表示方法,在用户量大的情况下用户间的模式对比清晰明了,有助于方便正确地检测数据集中用户行为模式的变化情况。

    一种基于暗网网站综合特征的网站分类方法

    公开(公告)号:CN107341183B

    公开(公告)日:2021-06-22

    申请号:CN201710397901.2

    申请日:2017-05-31

    Abstract: 本发明公开了一种基于暗网网站综合特征的网站分类方法。本方法为:1)爬取目标暗网网站,得到一带标注的暗网网站训练集合;2)提取该集合中每一网站信息进行分词,构建该网站的词的空间向量,并计算每一词的权重;将词与对应权重进行相乘后的空间向量作为网站的文本特征;3)提取该暗网网站训练集合中每一网站的标签,构建该网站的标签的空间向量,并计算每个标签的权重;将标签与对应权重相乘后的空间向量作为网站的结构特征;4)将每一网站的文本特征与结构特征结合得到该网站的综合特征;5)对各网站的综合特征进行训练,得到一分类模型;然后利用该分类模型对待分类网站进行预测,得到该待分类网站的类别。本发明提高了网站分类效率。

    一种面向评价性文本的核心实体识别方法及装置

    公开(公告)号:CN106570179B

    公开(公告)日:2019-11-19

    申请号:CN201610991857.3

    申请日:2016-11-10

    Abstract: 本发明涉及一种面向评价性文本的核心实体识别方法及装置。该方法包括以下步骤:1)输入评价性文本,基于专家规则和行业专有词典识别该评价性文本中的核心实体;2)对步骤1)未识别出核心实体的评价性文本,使用训练好的基于词的双向LSTM模型进行核心实体识别;3)对步骤2)未识别出核心实体的评价性文本,通过对已有实体集的统计并结合文本分词和词性标注,生成候选实体作为核心实体。该装置包括规则匹配模块、模型识别模块和候选实体生成模块。本发明针对多类型混杂的评价性文本,能够准确有效地提取文本中的核心实体,为用户决策判断提供有力依据。

    一种基于视觉的字符串相似度计算方法及相似性判断方法

    公开(公告)号:CN106127222B

    公开(公告)日:2019-06-04

    申请号:CN201610420846.X

    申请日:2016-06-13

    Abstract: 本发明公开了一种基于视觉的字符串相似度计算方法及相似性判断方法。本发明的字符串相似度计算方法为:1)将两待比较字符串中的每一字符分别转化为一对应灰度图片;2)将步骤1)得到的图片的每一行灰度值进行拼接,得到对应图片的一维向量;3)对两待比较字符串中任意两不同字符,计算这两个字符对应的两一维向量的相似度,根据该相似度确定所选两字符的字符相似度;4)基于上述得到的字符相似度和字符位置计算两待比较字符串的视觉相似度。该方法考虑到了不同的字符在人的视觉方法所呈现的不同差异,所计算得到的字符串相似度更加符合人的主观感受。

    一种基于中文字符词性特征的目标实体识别方法及装置

    公开(公告)号:CN108959242A

    公开(公告)日:2018-12-07

    申请号:CN201810431801.1

    申请日:2018-05-08

    CPC classification number: G06F17/278 G06K9/6256

    Abstract: 本发明涉及一种基于中文字符词性特征的目标实体识别方法及装置。该方法包括:1)在训练文本中标记目标实体并进行分词及词性标注;2)将训练文本拆分为字符,得到字符序列,每个字符保留拆分之前的词性;3)将字符的词性与字符在分词中的位置进行拼接作为字符词性,得到字符词性序列;4)将对目标实体的标记映射至目标实体中的各个字符上,得到字符标注序列;5)将字符序列与字符词性序列作为特征,将字符标注序列作为训练目标值,输入机器学习模型中进行训练;6)将待识别文本的字符序列与字符词性序列输入训练好的机器学习模型,得到目标实体识别结果。本发明能够根据需求在中文文本中准确有效地对所需特定目标实体进行识别与提取。

    一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统

    公开(公告)号:CN108881369A

    公开(公告)日:2018-11-23

    申请号:CN201810373966.8

    申请日:2018-04-24

    Abstract: 本发明涉及一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统。该方法包括:1)在不同的管理机站部署基于云消息中间件的节点,由各个所述节点构成消息传输网络;2)在所述消息传输网络的各节点中部署基于数据内容的流触发器;3)通过所述消息传输网络实现跨IDC的数据交换,并通过所述流触发器实现面向内容的数据交换。本发明可以高效、稳定的进行跨IDC数据交换,同时利用基于内容的流触发器进行数据订阅,能根据数据内容进行按需转发,使消费者可以自主决定数据的流向并细粒度地获得所需的数据,提高了网络传输的质量,减小了网络负担。本发明提供的多种工作模式均能稳定使用,能够支撑起不同的应用场景。

Patent Agency Ranking