一种基于ITQ算法的印尼语相似新闻推荐方法

    公开(公告)号:CN109992716B

    公开(公告)日:2023-01-17

    申请号:CN201910249807.1

    申请日:2019-03-29

    Abstract: 本发明提供了一种基于ITQ算法的印尼语相似新闻推荐方法,首先,提取每篇印尼新闻中的标题以及正文,保存至对应印尼新闻的字段中;根据所述印尼新闻数据训练Word2Vec模型,得到新闻到向量的映射字典;通过ITQ算法得到最优旋转矩阵下的特征向量的二进制编码;计算当前被浏览的印尼新闻和候选数据集中每篇印尼新闻的二进制数组成的n位签名;计算当前被浏览的新闻与候选数据集中每一篇印尼新闻的汉明距离;根据所述汉明距离进行排序,选取候选数据集中距离最小的前m篇印尼新闻作为推荐新闻。本发明通过以上方法解决了基于内容的新闻推荐效果与计算量平衡的技术问题。本发明灵活性强,能够适用各种语言环境。

Patent Agency Ranking