一种可定制的网络爬虫方法及系统

    公开(公告)号:CN110020062A

    公开(公告)日:2019-07-16

    申请号:CN201910292891.5

    申请日:2019-04-12

    Abstract: 本发明实施例提供了一种可定制的网络爬虫方法及系统,其中可定制的网络爬虫方法,包括:通过人工输入配置界面获取单个待生成爬虫任务的配置项;利用所述配置项中的第一爬虫名称,查找为所述第一爬虫名称预先配置的网站静态配置文件,作为目标静态配置文件;通过所述目标静态配置文件中包含的第一网站运行配置文件名称,查找为所述第一网站运行配置文件名称预先配置的网站运行配置文件,作为目标运行配置文件;基于所述目标静态配置文件、所述目标运行配置文件及所述配置项,生成包含所述配置项的爬虫任务;获取所述目标静态配置文件中包含的爬虫入口链接;执行用于对所述爬虫入口链接进行目标数据抓取的爬虫任务。

    一种查询图分解方法、装置、电子设备及存储介质

    公开(公告)号:CN109241309A

    公开(公告)日:2019-01-18

    申请号:CN201810765837.3

    申请日:2018-07-12

    Inventor: 张熙 刘杨

    Abstract: 本发明实施例提供了查询图分解方法、装置、电子设备、存储介质,方法包括:从查询图中各个待分配节点中确定多个第一节点,第一节点的离心率最大;选择一个第一节点作为第二节点,确定到第二节点的跳数不超过预设跳数的多个节点,作为目标节点,对于每个目标节点,从查询图中,确定以该目标节点为中心节点且半径为预设分解半径的分解子图,从得到的多个分解子图中,选择包含第一节点数目最多的分解子图,作为查询图的查询子图。可见,在分解查询图时,是从离心率较大的节点周围开始分解的,从而在分解过程中,减少对查询图结构的破坏,能够较好的保持查询图内部的连通性,使得分解得到的查询子图的数目较少,提高了子图同构查询技术的整体性能。

    一种支持无缝切换的双系统终端

    公开(公告)号:CN103391374B

    公开(公告)日:2015-07-08

    申请号:CN201310342622.8

    申请日:2013-08-08

    Abstract: 本发明涉及无线通信领域,特别是一种支持无缝切换的双系统终端,包括:非智能子系统和智能子系统,所述非智能子系统和所述智能子系统硬件独立,二者共享无线射频模块、屏幕、语音及其相关I/O接口设备,所述非智能子系统始终保持运行状态,用于进行安全通话和短信通信,所述非智能子系统和所述智能子系统通过硬件开关键完成切换。本发明的目的是通过相互隔离的两个手机系统同时运行并无缝快速切换,给用户提供安全的通信环境,保护用户隐私。

    面向聊天群组的关键人物提取方法及装置

    公开(公告)号:CN116260668B

    公开(公告)日:2024-06-28

    申请号:CN202310070374.X

    申请日:2023-01-12

    Abstract: 本发明提供一种面向聊天群组的关键人物提取方法及装置,包括:获取聊天群组中的消息信息,采用滑动时间窗口算法为消息构建全连接消息图,采用结构感知图神经网络计算消息边的向量值,并通过多层感知器层计算第一权值,构建消息关系图;基于消息关系图确定发送消息的用户,并计算用户边第二权值,构建用户关系图;基于各用户的发言数和各用户边的第二权值设置预设PageRank算法的分数分配权重,对用户关系图采用预设PageRank算法进行迭代,直至收敛,得到各用户的影响力分数;按照影响力分数对各用户进行排序,以提取该聊天群组中的关键人物。本发明构建了有向的用户关系图,并对PageRank算法进行改进,实现了针对聊天群组的关键人物提取。

    基于跨模态感知的敏感图像识别方法、装置、设备及介质

    公开(公告)号:CN113610080B

    公开(公告)日:2023-08-25

    申请号:CN202110892160.1

    申请日:2021-08-04

    Abstract: 本发明公开了一种基于跨模态感知的敏感图像识别方法、装置、设备及介质,所述方法包括:获取网络社区中待识别的图像信息;将所述图像信息输入预设的敏感图像识别模型中的跨模态感知模块,得到所述图像信息的跨模态文本描述;将所述图像信息的跨模态文本描述输入所述敏感图像识别模型中的敏感信息识别模块,得到含有敏感信息的敏感图像。根据本公开实施例提供的敏感图像识别方法,旨在跨模态表达网络社区图像的语义信息内容,并融合大量网络社区敏感文本内容先验知识,对社区图像的内容进行更准确的分析判别,通过获取图像的跨模态文本描述使得对敏感图像信息的传播及追溯成为可能。

    融合立场分析的用户身份对齐方法、装置、设备及介质

    公开(公告)号:CN116167885A

    公开(公告)日:2023-05-26

    申请号:CN202211579541.5

    申请日:2022-12-09

    Abstract: 本申请公开了一种融合立场分析的用户身份对齐方法、装置、设备及存储介质,所述方法包括:获取多个社交网络中用户的特征数据;将所述特征数据输入预训练的身份对齐模型,得到不同社交网络中用户之间的相似度;其中,所述身份对齐模型包括立场分析模块,用于根据所述特征数据识别用户的立场;若用户之间的相似度大于预设阈值,则确定多个用户为同一自然人。根据本申请实施例提供的用户身份对齐方法,通过引入立场分析,能够使用户画像更加立体和丰富,更贴近现实世界中的自然人特征,提高用户身份对齐的准确率。

    一种基于图结构对抗学习的社交媒体谣言检测方法及装置

    公开(公告)号:CN111858928B

    公开(公告)日:2022-11-18

    申请号:CN202010553467.4

    申请日:2020-06-17

    Abstract: 本发明实施例提供了一种基于图结构对抗学习的社交媒体谣言检测方法及装置,其中方法包括:获取社交媒体中待检测消息的内容信息及社交网络结构;将待检测消息的内容信息及社交信息作为检测器的输入,通过检测器得到待检测消息的目标谣言检测结果,其中,目标谣言检测结果为谣言的检测结果或不为谣言的检测结果,检测器是基于样本集,以对抗训练的方式训练得到的,样本集中一个样本为一个原始消息包括原始内容信息和图结构的原始社交网络结构中的节点,通过在对抗训练的方式中增加伪装策略,以完成检测器的训练,这样检测器既考虑了社交网络中的伪装带来的影响,又能让检测器抵御尽可能多的不同的伪装策略,更加有效地检测谣言并且检测流程简单。

    一种联邦学习方法及装置

    公开(公告)号:CN114091356B

    公开(公告)日:2022-05-20

    申请号:CN202210051900.3

    申请日:2022-01-18

    Abstract: 本发明提供一种联邦学习方法及装置,通过在联邦学习过程中加入验证轮,由服务端将待验证客户端上一次返回的模型更新参数发送至辅助客户端,利用辅助客户端的本地数据进行训练,计算验证轮中各辅助客户端训练终止时损失值与以往轮次的偏差,若所述偏差大于设定阈值的辅助客户端数量高于设定比例则标记待验证客户端为异常客户端。能够在各客户端不知情的条件下,快速有效的识别出异常的客户端,进一步的,根据异常客户端对应的各验证轮次中的偏差调节模型聚合过程中的权重,以防止异常客户端对全局模型更新的不良影响。

    一种基于图结构对抗学习的社交媒体谣言检测方法及装置

    公开(公告)号:CN111858928A

    公开(公告)日:2020-10-30

    申请号:CN202010553467.4

    申请日:2020-06-17

    Abstract: 本发明实施例提供了一种基于图结构对抗学习的社交媒体谣言检测方法及装置,其中方法包括:获取社交媒体中待检测消息的内容信息及社交网络结构;将待检测消息的内容信息及社交信息作为检测器的输入,通过检测器得到待检测消息的目标谣言检测结果,其中,目标谣言检测结果为谣言的检测结果或不为谣言的检测结果,检测器是基于样本集,以对抗训练的方式训练得到的,样本集中一个样本为一个原始消息包括原始内容信息和图结构的原始社交网络结构中的节点,通过在对抗训练的方式中增加伪装策略,以完成检测器的训练,这样检测器既考虑了社交网络中的伪装带来的影响,又能让检测器抵御尽可能多的不同的伪装策略,更加有效地检测谣言并且检测流程简单。

Patent Agency Ranking