一种Web深网查询接口检测方法

    公开(公告)号:CN109086450B

    公开(公告)日:2021-08-27

    申请号:CN201810971193.3

    申请日:2018-08-24

    Abstract: 本发明公开了一种Web深网查询接口检测方法,包括以下步骤:S1、输入网页URL链接地址;S2、进行网页渲染,通过布局渲染引擎,将HTML可视标签的显示方式转化为盒模型;S3、进行布局分块;S4、进行分块剪枝;S5、进行分块重构;S6、输出交互接口。本发明主要利用了网页数据的布局和样式特征,对网页数据进行区域分块,并通过制定相应的处理规则,最终实现网页交互接口的定位;本发明提出了一种组合接口结构特征和文本特征的改进方法,改进了单方面依赖结构特征进行分类,而导致分类准确率不高或适应性不强的问题。在实验测试中,网页交互接口定位方法达到了很高的定位正确性,而改进的接口分类特征集则达到了较高的分类效果。

    基于社交网络拍卖流程的隐私保护方法

    公开(公告)号:CN111859450A

    公开(公告)日:2020-10-30

    申请号:CN202010696443.4

    申请日:2020-07-20

    Abstract: 本发明公开一种基于社交网络拍卖流程的隐私保护方法,应用于电子商务领域,针对现有的基于社交网络的拍卖过程中参与者的隐私无法得到有效保护的问题;本发明在网络中为每个节点添加相应的邻居虚拟节点,这些虚拟节点将会干扰攻击者辨别拿到的数据与真实数据,从而达到对网络中节点的邻居信息的隐私保护,同时,噪音又不影响拍卖流程的正常进行;在网络中为每个添加的虚拟节点添加满足Laplace分布的报价,为报价信息加入相应噪音,从而达到在拍卖流程中的隐私保护的目的。

    一种基于特征词共现图的微博事件演化分析方法

    公开(公告)号:CN110399491A

    公开(公告)日:2019-11-01

    申请号:CN201910653308.9

    申请日:2019-07-19

    Abstract: 本发明公开了一种基于特征词共现图的微博事件演化分析方法,该方法包括对原始事件微博集合进行数据预处理,生成事件微博单词集合;提取事件微博单词集合特征词,基于文本中特征词共现关系构造特征词共现图;对特征词共现图进行特征词社团划分;计算微博与社团中特征词的相似度,进行子事件微博聚类处理。本发明能够帮助用户快速且充分了解整个热门事件的演化过程,进而迅速且准确获取到自己感兴趣的信息。

    基于Netflow的NS3仿真系统流量导入方法

    公开(公告)号:CN106027406B

    公开(公告)日:2019-03-15

    申请号:CN201610346320.1

    申请日:2016-05-23

    Abstract: 本发明公开了一种基于Netflow的NS3仿真系统流量导入方法,基于NS3仿真系统流量建模方法的缺失,利用NS3模块化设计易扩展的优势,为仿真系统添加了真实流量数据导入功能,以真实网络设备上采集的NetFlow信息为原始数据,经过预处理、存储和流量映射后形成仿真任务文件,仿真系统读取仿真任务文件进行模拟仿真,完整的考虑了从数据采集到最后模拟仿真的每个步骤。为大型数据网进行升级改造、网络优化等方案实施提供了一种既接近真实流量又考虑数据量成本的方法。

    基于用户关系的社交网络垃圾账号识别方法

    公开(公告)号:CN109102418A

    公开(公告)日:2018-12-28

    申请号:CN201810894646.7

    申请日:2018-08-08

    Abstract: 本发明公开了一种基于用户关系的社交网络垃圾账号识别方法,其包括获取社交媒体账号的朋友粉丝关系数据,构建局部网络关系图,构建局部对称网络结构图并进行网络结构对称性特征提取,采用监督学习方法进行垃圾账号识别。本发明在构建用户局部网络关系图的基础上,通过从单用户网络关系扩展到了用户本身与其他用户之间双向网络关系,扩充了局部网络关系图,并采用新特征的提取方式,在垃圾账号识别中表现出了更好的稳定性,很大程度上降低了垃圾账号对于识别上表现的内容欺骗性,使得垃圾账号的识别在准确性上有明显的提升。

    一种短文本在线聚类方法

    公开(公告)号:CN107609102A

    公开(公告)日:2018-01-19

    申请号:CN201710816052.X

    申请日:2017-09-12

    Abstract: 本发明公开一种短文本在线聚类方法,对于现有的在线聚类方法准确度不高的问题,本申请通过改进的短文本增量聚类方法,对短文本进行聚类处理,相似度阈值随类中包含的社交短文本数量动态改变,增加了聚类的灵活性;并结合短文本语义相似度,对增量聚类进一步地处理;并引入重聚类、类合并和类修剪,解决在线聚类固有的类中心偏移问题以及短文本聚合性差的问题。

    基于相似文本反馈的社交媒体文本查询扩展方法

    公开(公告)号:CN107544962A

    公开(公告)日:2018-01-05

    申请号:CN201710799836.6

    申请日:2017-09-07

    Abstract: 本发明公开了一种基于相似文本反馈的社交媒体文本查询扩展方法,具体包括:输入原始查询词与原始文本;对原始文本进行预处理与分词;对处理后的文本进行聚类;相关文本筛选;对筛选出这些文本进行查询词扩展,一旦达到收敛条件就输出结果。本发明的方法将具有相同语义的文本进行聚类,筛选与用户查询相似的文本类作为语料库,将传统的逐条文本筛选改为逐类,如果含有较少查询词的相似文本存在于被选取的类中,这些文本也可以被筛选,可以获取到相似性最高的文本进行扩展,并结合使用时序模型对已知的查询词进行扩展,能够有效的提高文本和查询词扩展的准确性。

    基于信息增益的英文社交媒体账号分类方法

    公开(公告)号:CN107463715A

    公开(公告)日:2017-12-12

    申请号:CN201710820897.6

    申请日:2017-09-13

    CPC classification number: G06F16/353 G06F16/9535 G06Q50/01

    Abstract: 本发明公开一种基于信息增益的英文社交媒体账号分类方法,通过信息增益与的方法对特征词进行选取,通过对选取的特证词进行扩展,生成训练样本集,根据支持向量机的学习方法对训练样本进行学习,得到分类模型,从而实现对未知账号的分类;解决了英文社交媒体账号领域类别分类的问题并且本申请利用wordnet寻找特征词的近义词、并人工添加领域类别的专有词这两种方式,对特征词集进行扩充,使特征词集更具有类别代表性和类别区分度,进而能提升分类的准确性。

    基于文本标签特征挖掘的网页正文提取方法

    公开(公告)号:CN106339455A

    公开(公告)日:2017-01-18

    申请号:CN201610729817.1

    申请日:2016-08-26

    CPC classification number: G06F16/9577

    Abstract: 本发明公开了一种基于文本标签特征挖掘的网页正文提取方法,包括以下步骤:S1、进行网页标签预处理及Html标签修复;S2、Html标签特征选择及提取;S3、标签特征聚类挖掘及正文簇选择;S4、正文簇内标签经验性调整;S5、正文簇标签文本提取。本发明通过对网页源码进行标签挖掘,运用层次聚类算法对网页标签进行聚类,提取出正文标签所在的簇,再根据经验对标签簇内的标签进行调整,再根据调整后的正文簇特征进行文本提取。本方法相对于其他新闻网页文本抽取方法而言,具有更好的通用性、高准确率、易用性,不用针对特定网页做任何特殊设定。

    融合社交关系和命名特征的跨社交媒体账户匹配方法

    公开(公告)号:CN109117891B

    公开(公告)日:2022-04-08

    申请号:CN201810985465.5

    申请日:2018-08-28

    Abstract: 本发明公开了一种融合社交关系和命名特征的跨社交媒体账户匹配方法,包括以下步骤:S1、找出在账户信息中给出对应其他平台账号的用户,作为种子用户集合;S2、从种子用户集合取出一对账号信息,分别在对应的平台中提取好友的账号,并将做笛卡尔乘积,作为候选账户对;S3、进行预处理,取特征形成特征向量;S4、将特征向量输入分类器进行判别,将判别为属于同一人物实体的账户加入种子节点集合中;S5、对所有种子节点执行步骤S2~S4的操作,直至种子用户集合中没有新账户加入为止。本发明的方法降低了计算复杂度,将最终判定为不关联的用户的提取特征并进行分类判决的计算称为无效计算,大幅降低了无效计算在整个计算过程中的比例,提高了效率。

Patent Agency Ranking