-
公开(公告)号:CN109753797A
公开(公告)日:2019-05-14
申请号:CN201811503421.0
申请日:2018-12-10
Applicant: 中国科学院计算技术研究所
IPC: G06F21/56
Abstract: 本发明涉及一种针对流式图的密集子图检测方法和系统,包括:持续从社交网络获取三元组,该三元组由用户、对象和时间戳组成,以该三元组作为流式图建模为行增广矩阵;用滑动窗口访问行增广矩阵,并对每个窗口内的行增广矩阵进行奇异值分解,得到奇异矩阵,获取奇异矩阵的奇异向量对,根据向量阈值对该奇异向量对进行筛选,得到候选密集块及其密度;通过对候选密集块利用已有方法进一步进行密集子块筛选;最终密集块的用户为检测的异常用户、其中的目标物为检测的异常目标。本发明根据增广矩阵和滑动窗口对流式图建模,每次只存储一个步长的数据,每次检测一个窗口的数据,性能优于每插入一条新数据都要更新密集块的流式算法。
-
公开(公告)号:CN109753602A
公开(公告)日:2019-05-14
申请号:CN201811473591.9
申请日:2018-12-04
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9535 , G06Q50/00
Abstract: 本发明涉及一种基于机器学习的跨社交网络用户身份识别方法和系统,其中所述方法包括:包含跨网络用户信息的采集、文本分析精准用户身份对齐标注以及用户信息特征抽取模块,基于用户属性信息以及用户社交关系的对齐用户候选集的构建,基于用户属性信息、用户发布内容与用户社交表示特征拼接的精准用户身份对齐模型构建与参数学习,提供跨网络用户身份对齐的查询服务并构建跨网络综合用户画像。本发明通过对不同网络用户的属性集用户关注关系的特征拼接的精准身份对齐模型,实现跨网络用户身份对齐,构建更加详细的用户画像。
-
公开(公告)号:CN109741198A
公开(公告)日:2019-05-10
申请号:CN201811434864.9
申请日:2018-11-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种网络信息传播影响力度量方法、系统,包括:根据社交网络中消息传播的历史传播数据,构建节点和传播源的激活对;将社交网络中的用户作为节点,将给定消息的传播数据中参与时间为0的节点作为给定消息的传播源,通过聚合函数将传播源对节点的影响力进行聚合后通过影响力边际递减函数,得到节点在传播源下被激活的概率;以历史传播数据为训练数据,以概率的对数似然最大作为目标,对所有激活对使用随机梯度下降进行参数学习,得到节点间影响力,以得到传播源集合的影响力度量。本发明提出的基于数据驱动的影响力最大化方法直接基于本发明学习得到的影响力度量,对节点的边际效应进行估计,以高效地进行影响力最大化的节点集合选择。
-
公开(公告)号:CN106503858A
公开(公告)日:2017-03-15
申请号:CN201610958907.8
申请日:2016-10-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种训练用于预测社交网络用户转发消息的模型的方法,包括:确定以社交网络中的每名用户的影响力和易感性为参数的损失函数;收集各名用户以往进行消息转发的样本;根据所述样本和所述损失函数,搜索确定所述各名用户的影响力和易感性。本发明通过根据信息传播过程的不对称性来建立模型,从而提高模型的预测性能,并且可以区分预测用户列表不同位置用户对的重要性差别。
-
公开(公告)号:CN114443820B
公开(公告)日:2025-02-07
申请号:CN202210177000.3
申请日:2022-02-25
Applicant: 中国科学院计算技术研究所
IPC: G06F16/334 , G06F16/3332 , G06F16/31 , G06F40/216 , G06F40/237 , G06F40/284
Abstract: 本发明提供了一种文本聚合方法以及文本推荐方法,该一种文本聚合方法包括获取待处理的文本;利用经改进的SimHash算法计算文本的指纹信息,其中,经改进的SimHash算法在对文本中相应词语的哈希值进行加权时,利用词语在该文本内的权值以及在该文本所处领域中该词语的领域权值进行加权;利用领域权值对文本的领域关联性进行打分,得到文本的领域分值;将文本的指纹信息分为多个指纹段,基于指纹段的数值构建倒排索引,其中,倒排索引对应的键值对中,键存储指纹段的数值,值存储文本相关信息,文本相关信息包括文本的指纹信息和领域分值;通过领域权重对文本进行打分,构建倒排索引,以避免后期推荐相似文本时重复处理数据库内的文本,极大地提升了处理效率。
-
公开(公告)号:CN119068503A
公开(公告)日:2024-12-03
申请号:CN202411015967.7
申请日:2024-07-26
Applicant: 中国科学院计算技术研究所
IPC: G06V30/412 , G06V30/19 , G06V10/774 , G06V10/82
Abstract: 本发明提出一种文本检测方法、装置、介质,该方法包含:对待测文本进行扰动处理,得到扰动文本;对该扰动文本进行语法树分析,识别文本的若干词语及词语间的语法结构,生成语法树;遍历该语法树,将该语法树中的每一个词语构建为图神经网络训练所需的节点,并将词语间的语法结构编码为邻接矩阵;对该扰动文本进行向量化处理,得到文本的高维向量表示;融合该高维向量表示和该邻接矩阵,通过图卷积神经网络进行训练,以预测该待测文本的类别标签。该方法实现了对扰动后生成文本的高精准度检测,同时使检测方法具有很强的鲁棒性。
-
公开(公告)号:CN118070071A
公开(公告)日:2024-05-24
申请号:CN202410353576.X
申请日:2024-03-26
Applicant: 中国科学院计算技术研究所
IPC: G06F18/22 , G06F18/23213 , G06F18/2433 , G06F18/25 , G06N3/0464 , G06N3/042 , G06N3/0455 , G06Q50/00 , G06N3/048
Abstract: 本发明提出一种基于图卷积聚类的社交机器人群体检测方法,包括:使用已知账号的个体特征,训练专家模型;获取目标账号的个体特征,通过该专家模型将该目标账号识别为种子账号或待定账号;以图卷积聚类方法,将该目标账号划分为多个群体,获取每个群体的群体特征;将该目标账号的个体特征,与其所在群体的群体特征进行拼接融合,获得该目标账号的识别特征;将该待定账号的识别特征与其所在群体的种子账号的识别特征进行相似度比较,以相似度大于识别阈值的待定账号为识别账号;将该种子账号和该识别账号标识为社交机器人。本发明还提出一种基于图卷积聚类的社交机器人群体检测装置,以及一种计算机可读存储介质和一种电子设备。
-
公开(公告)号:CN117668857A
公开(公告)日:2024-03-08
申请号:CN202311675503.4
申请日:2023-12-07
Applicant: 中国科学院计算技术研究所
IPC: G06F21/57 , G06F18/22 , G06F18/214
Abstract: 本发明提出一种基于模拟数据投毒攻击的推荐系统安全性测试方法和系统。通过梯度传递技术可以加速替代推荐系统的训练过程,以在有限时间内得到更准确的替代模型。梯度传递技术可以增强现有模拟攻击样本的准确性。通过加速替代模型训练得到更准确的替代模型,可以从替代模型中获得更好的优化指导,从而增强现有模拟攻击样本的准确性。梯度传递可以广泛增强基于替代系统的攻击方法,包括大部分现有的推荐系统模拟投毒攻击,这为后续的研发提供了基础。同时,也可以帮助发现了推荐系统的弱点,为设计更可靠的防御方法提供启示。
-
公开(公告)号:CN116662480A
公开(公告)日:2023-08-29
申请号:CN202310505568.8
申请日:2023-05-06
Applicant: 中国科学院计算技术研究所
IPC: G06F16/33 , G06F40/30 , G06F40/295 , G06N5/022 , G06N3/045
Abstract: 本发明提出一种基于实体增强的文本语义表示方法和系统,包括:获取文本编码模型和实体增强编码模型,实体增强编码模型由串联的外部实体向量表示模块和上下文相关的实体信息编码模块组成;通过文本编码模型提取目标文本的第一表示向量;以外部实体向量表示模块识别目标文本中表示实体的词项序列,并确定词项序列和知识库中的哪些实体相关联,获得词项序列对应实体的在知识库中的实体向量表示;实体信息编码模块包括多个串联的实体适配器层,实体信息编码模块的输入为实体向量表示和文本编码模型中间层的隐状态;最后一个实体适配器层输出的特征作为目标文本的第二表示向量;融合第一表示向量和第二表示向量,得到目标文本的语义表示结果。
-
公开(公告)号:CN116628353A
公开(公告)日:2023-08-22
申请号:CN202310524795.5
申请日:2023-05-10
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9536 , G06Q50/00 , G06F16/36 , G06F16/35 , G06F40/295 , G06F18/24 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明提出一种基于图表示学习的多视角个体观点预测方法,包括:分别构建观点持有者的背景知识图谱、交互行为网络和观点网络;以该观点持有者、目标观点对象和观点生成时刻为要素,构建观点预测任务的目标三元组;从该背景知识图谱、该交互行为网络和该观点网络,分别获取该观点持有者的知识向量、交互行为向量和观点向量;将该知识向量、该交互行为向量和该观点向量通过分类器,输出该目标三元组对应的观点预测结果。本发明还提出一种基于图表示学习的多视角个体观点预测系统,以及一种用于多视角个体观点预测的数据处理装置。
-
-
-
-
-
-
-
-
-