一种链接中分词重要度确定方法和装置

    公开(公告)号:CN114330331B

    公开(公告)日:2022-09-16

    申请号:CN202111616516.5

    申请日:2021-12-27

    Abstract: 本申请提供一种链接中分词重要度确定方法和装置,该方法包括对目标链接文本进行分词处理,获得分词序列;根据多个分词生成每个分词对应的邻域信息,其中,每个分词对应的邻域信息通过所述分词和所述分词的排序前N个分词和排序后N个分词构成;根据每个分词对应的邻域信息生成每个分词对应的多个剩余邻域信息;根据每一剩余邻域信息结合对应邻域信息以外的其他分词生成每个分词对应的多个更新链接文本,其中,该多个更新链接文本包括具有分词的更新链接文本和不具有分词的更新链接文本;对每个分词对应的多个更新链接文本进行恶意链接检测,并根据检测结果确定目标链接文本中分词重要度,从而确定目标链接文本中每个分词的重要性。

    一种链接中分词重要度确定方法和装置

    公开(公告)号:CN114330331A

    公开(公告)日:2022-04-12

    申请号:CN202111616516.5

    申请日:2021-12-27

    Abstract: 本申请提供一种链接中分词重要度确定方法和装置,该方法包括对目标链接文本进行分词处理,获得分词序列;根据多个分词生成每个分词对应的邻域信息,其中,每个分词对应的邻域信息通过所述分词和所述分词的排序前N个分词和排序后N个分词构成;根据每个分词对应的邻域信息生成每个分词对应的多个剩余邻域信息;根据每一剩余邻域信息结合对应邻域信息以外的其他分词生成每个分词对应的多个更新链接文本,其中,该多个更新链接文本包括具有分词的更新链接文本和不具有分词的更新链接文本;对每个分词对应的多个更新链接文本进行恶意链接检测,并根据检测结果确定目标链接文本中分词重要度,从而确定目标链接文本中每个分词的重要性。

Patent Agency Ranking