基于模糊序列模式发掘的网页内容提取方法

    公开(公告)号:CN106547851B

    公开(公告)日:2020-04-07

    申请号:CN201610911400.7

    申请日:2016-10-19

    Abstract: 本发明公开了一种基于模糊序列模式发掘的网页内容提取方法。本发明针对网页内容提取问题,通过相同内容块内容在超文本标记语言中距离较近,不同内容块的内容相距较远的原理,针对网页上的每一个内容模块,分别用一个行文字长度序列的方式来表示,同时越是功能性模块模糊度越低,信息越丰富的内容模块序列模糊度越高。针对不同网站,利用少量给定网页进行训练,得到模糊序列模式,对于来自同一个网站的新页面将利用模糊序列模式来进行匹配,得到不同类型的网页内容。这样的方法能够显著提高内容提取的准确性,同时能够将不同类型的内容分开提取。

    基于代理盲签名的防倒卖的敏感数据交易方法

    公开(公告)号:CN106375097A

    公开(公告)日:2017-02-01

    申请号:CN201610889859.1

    申请日:2016-10-12

    Applicant: 贵州大学

    Inventor: 田有亮 彭巧 陈功

    CPC classification number: H04L9/3257

    Abstract: 本发明公开了一种基于代理盲签名的防倒卖的敏感数据交易方法。本发明引入基于属性的加密方法对数据进行加密,使只有满足属性的数据购买方才能获得数据,从而有效的预防数据购买方拥有数据后对数据进行二手倒卖以获取牟利。基于代理盲签名的防倒卖的敏感数据交易方法中引入第三方作为委托代理签名者利用双线性映射对数据进行盲签名,并由数据购买方对签名的正确性进行验证,若验证通过,使用公钥即可解密出数据,从而保证在数据公平、安全交易的同时,也提高了交易效率,保证了交易双方的利益。

    基于模糊序列模式发掘的网页内容提取方法

    公开(公告)号:CN106547851A

    公开(公告)日:2017-03-29

    申请号:CN201610911400.7

    申请日:2016-10-19

    Applicant: 贵州大学

    Abstract: 本发明公开了一种基于模糊序列模式发掘的网页内容提取方法。本发明针对网页内容提取问题,通过相同内容块内容在超文本标记语言中距离较近,不同内容块的内容相距较远的原理,针对网页上的每一个内容模块,分别用一个行文字长度序列的方式来表示,同时越是功能性模块模糊度越低,信息越丰富的内容模块序列模糊度越高。针对不同网站,利用少量给定网页进行训练,得到模糊序列模式,对于来自同一个网站的新页面将利用模糊序列模式来进行匹配,得到不同类型的网页内容。这样的方法能够显著提高内容提取的准确性,同时能够将不同类型的内容分开提取。

Patent Agency Ranking