-
公开(公告)号:CN106250394B
公开(公告)日:2019-08-02
申请号:CN201610563027.0
申请日:2016-07-15
Applicant: 北京邮电大学
IPC: G06F16/955
Abstract: 本发明提供一种网络资源内容洞察系统及方法。本发明提供的系统,包括:开放接口模块、URL预处理模块、URL洞察库模块以及结果输出模块;开放接口模块接收目标URL;URL预处理模块判断目标URL的协议类型是否为目标协议类型;URL洞察库模块对目标协议类型的目标URL进行查询匹配,URL洞察库模块中被匹配中的参考URL对应的参考标引信息即为目标标引信息;结果输出模块输出目标标引信息。本发明通过URL洞察库模块存储参考URL和参考标引信息的对应关系,参考标引信息对应的标引范围为URL和目标文本本身,扩充了标引范围,实现了全面地对网络资源信息进行标引,从而提高了网络资源标引的准确率。
-
公开(公告)号:CN106250394A
公开(公告)日:2016-12-21
申请号:CN201610563027.0
申请日:2016-07-15
Applicant: 北京邮电大学
IPC: G06F17/30
CPC classification number: G06F16/9566
Abstract: 本发明提供一种网络资源内容洞察系统及方法。本发明提供的系统,包括:开放接口模块、URL预处理模块、URL洞察库模块以及结果输出模块;开放接口模块接收目标URL;URL预处理模块判断目标URL的协议类型是否为目标协议类型;URL洞察库模块对目标协议类型的目标URL进行查询匹配,URL洞察库模块中被匹配中的参考URL对应的参考标引信息即为目标标引信息;结果输出模块输出目标标引信息。本发明通过URL洞察库模块存储参考URL和参考标引信息的对应关系,参考标引信息对应的标引范围为URL和目标文本本身,扩充了标引范围,实现了全面地对网络资源信息进行标引,从而提高了网络资源标引的准确率。
-