-
公开(公告)号:CN104715037A
公开(公告)日:2015-06-17
申请号:CN201510122267.2
申请日:2015-03-19
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30867
Abstract: 本发明实施例公开了一种网络数据的过滤方法、装置和系统;本发明实施例采用获取目标信息类型的种子库,以及用户行为数据,根据该用户行为数据和预置过滤规则对该种子库进行初步过滤,得到候选集,然后基于该候选集构造转移矩阵,并初始化用户打分向量和页面打分向量,并根据转移矩阵、用户打分向量和页面打分向量对该候选集中的信息进行过滤,得到目标信息,将目标信息加入该种子库;该方案不仅可以大大提高识别的准确率和过滤效果,而且,还可以提高处理效率。
-
公开(公告)号:CN102236652A
公开(公告)日:2011-11-09
申请号:CN201010155773.9
申请日:2010-04-27
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种信息的分类方法和装置,该方法包括:设置具有预设分类属性的种子集合;根据用户行为和所述种子集合获取页面集合和用户集合;确定所述页面集合中的页面是否具有所述预设分类属性;和/或,确定所述用户集合中的用户是否具有所述预设分类属性。本发明中,通过设置具有预设分类属性的种子集合,并根据该种子集合和用户行为确定页面集合中的页面以及用户集合中的用户是否具有该预设分类属性,从而能够准确的确定页面的分类属性。
-
公开(公告)号:CN103593342B
公开(公告)日:2017-10-31
申请号:CN201210286449.X
申请日:2012-08-13
Applicant: 腾讯科技(深圳)有限公司
Inventor: 文勖
IPC: G06F17/30
Abstract: 本发明提出一种基于单向用户关系的专家挖掘方法,包括:步骤S 1:设置第一专家种子集合,所述第一专家种子集合中包括多个专家用户;步骤S2:根据第一专家种子集合中的所有用户的单向用户关系获取用户集合;步骤S3:判断用户集合中的用户是否满足预定条件,并将满足预定条件的用户的集合设置为第二专家种子集合;步骤S4:判断第一专家种子集合与第二专家种子集合的并集中的用户的个数是否达到目标数量,如果判断结果为是,则将第一专家种子集合与第二专家种子集合的并集设置为目标专家种子集合;如果判断结果为否,则将第二专家种子集合去除其与第一专家种子集合的交集的部分设置为第一专家种子集合,重复步骤S2至S4。本发明还提出一种用于实现上述方法的挖掘系统。本发明的专家挖掘方法可以挖掘出其他更多的专家,包括草根专家。
-
公开(公告)号:CN102915306B
公开(公告)日:2016-08-03
申请号:CN201110219368.3
申请日:2011-08-02
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30867 , G06F17/30657 , G06F17/30699
Abstract: 本发明公开了一种搜索方法和系统:获取用户输入的关键词A、关系链类别B以及用户账号C;获取与用户账号C对应的属于关系链类别B的用户账号列表;在用户账号列表中的各用户账号发表的信息中搜索与关键词A对应的信息,得到搜索结果,并显示搜索结果。应用本发明所述的方法和系统,能够提高信息的实用性和可靠性。
-
公开(公告)号:CN102955781B
公开(公告)日:2016-04-20
申请号:CN201110239162.7
申请日:2011-08-19
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30867 , G06Q50/01
Abstract: 本发明公开了一种人物搜索方法及装置,方法包括:接收针对人物的搜索请求,其中包括搜索关键字;获取当前用户的人际关系链数据;从当前用户的人际关系链数据对应的人物信息中,查找与所述搜索关键字匹配的人物;将所匹配的人物作为搜索结果。所述装置包括:搜索请求模块,用于接收针对人物的搜索请求,其中包括搜索关键字;数据获取模块,用于获取当前用户的人际关系链数据;匹配模块,用于从当前用户的人际关系链数据对应的人物信息中,查找与所述搜索关键字匹配的人物;结果模块,用于将所匹配的人物作为搜索结果。利用本发明,可以提高搜索结果与用户的人际相关性,降低对网络资源的占用。
-
公开(公告)号:CN102737027A
公开(公告)日:2012-10-17
申请号:CN201110082369.8
申请日:2011-04-01
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F17/30
Abstract: 一种个性化搜索方法,包括以下步骤:获取用户发表的文档,对文档进行分类,得到文档的分类信息;根据文档的分类信息构建用户模型和文档模型;根据用户输入的检索词进行检索,得到检索结果;根据所述用户模型和文档模型计算所述检索结果排序权值;根据所述排序权值对所述检索结果进行排序。采用上述方法,构建的用户模型和文档模型的维度较低,实现起来简单,从而能够提高运行性能。此外,还提供了一种个性化搜索系统。
-
公开(公告)号:CN100578500C
公开(公告)日:2010-01-06
申请号:CN200610167466.6
申请日:2006-12-20
Applicant: 腾讯科技(深圳)有限公司
Inventor: 文勖
IPC: G06F17/30
Abstract: 本发明公开了一种网页分类方法及装置,用以解决现有技术中采用从网页正文中提取分类特征词的方式对网页进行分类时,分类的准确率较低且计算量较大的问题。所述方法包括步骤:从网页对应的锚文本中选取分类锚文本,确定该分类锚文本中包含的分类关键词,从网页的全部内容中查找至少包含一个所述分类关键词的语句,将查找到的语句组合形成特征文本,对所述特征文本进行文本分类处理,将该特征文本的类别确定为所述网页的类别;所述系统包括分类锚文本选取模块、分类关键词确定模块、查找模块和特征文本分类模块。本发明大大提高了分类的准确率和召回率,同时减小了分类处理过程中的计算量。
-
公开(公告)号:CN100489859C
公开(公告)日:2009-05-20
申请号:CN200710073597.2
申请日:2007-03-21
Applicant: 腾讯科技(深圳)有限公司
Inventor: 文勖
IPC: G06F17/30
Abstract: 本发明公开了一种在搜索引擎中处理悬空网页节点的方法,包括步骤:从互联网上获取网页的同时获取所述网页的从属网站信息;判断所述网页是否为悬空网页,如果是则在计算所述网页的等级时执行步骤:为所述悬空网页增加到至少一个非悬空网页的虚拟出链;该非悬空网页与所述悬空网页从属于同一个网站。本发明还公开了一种在搜索引擎中处理悬空网页节点的系统。本发明通过为每个悬空网页节点增加其站内虚拟链接,有利于pagerank的计算,使悬空节点的pagerank计算合理化,提高搜索引擎搜索结果的质量。
-
公开(公告)号:CN102404240B
公开(公告)日:2015-07-29
申请号:CN201010280249.4
申请日:2010-09-10
Applicant: 腾讯科技(深圳)有限公司
Inventor: 文勖
Abstract: 一种信息搜索系统及方法,该系统包括:个性化信息统计模块,获取用户好友列表,根据所述用户好友列表获取相应的好友互联网信息数据,统计出所述用户好友的个性化信息;查询模块,获取用户查询请求,并根据所述查询请求获取用户好友的个性化信息;展示模块,展示获取的用户好友的个性化信息。上述信息搜索系统及方法,通过获取用户好友列表,并根据好友列表查询到用户好友的互联网信息数据,根据互联网信息数据统计出用户好友的个性化信息,用户通过查询获取到用户好友的个性化信息,了解到用户好友关注的热点信息,有针对性的向用户推荐好友的个性化信息,减少了获取不需要的信息所带来的带宽压力和提高了下载速度。
-
公开(公告)号:CN103294669A
公开(公告)日:2013-09-11
申请号:CN201210040488.1
申请日:2012-02-22
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明公开了一种基于用户行为的反作弊方法和系统,包括:通过基于用户行为的盗号检测方式和/或灌水检测方式和/或热词交叉检测方式,实时检测并采集黑名单用户;在搜索结果中,将黑名单用户发布的文档进行过滤,并将过滤后的搜索结果反馈给用户。通过本发明,解决了现有作弊方式变化快、作弊模式隐蔽等问题导致的反作弊方法效果不好的问题。
-
-
-
-
-
-
-
-
-