-
公开(公告)号:CN112100517A
公开(公告)日:2020-12-18
申请号:CN202010977547.2
申请日:2020-09-17
Applicant: 哈尔滨理工大学
IPC: G06F16/9536 , G06F40/211 , G06F40/284
Abstract: 本发明涉及一种基于内容特征抽取的缓解推荐系统冷启动问题的方法。随着互联网技术的高速发展,信息过载的问题愈发明显,新服务在没有用户历史评分的情况下,很难找到合适的用户群进行推荐。一种基于内容特征抽取的缓解推荐系统冷启动问题的方法,在内容特征抽取时,采用自然语言处理中依存句法分析的方法,对项目的描述信息特征进行抽取,并将抽取的内容特征转化为词向量;其次,考虑到在实际情况下,各个词的重要程度有所不同,因此使用基于TF‑IDF优化后的加权词距离算法(Weighted Word Mover’s Distance,WWMD),以此提高对内容特征向量词距离计算的精确度,从而提高物品之间相似度的精确度后,结合使用词距离计算出的相似度与传统相似度计算的方法,进行推荐。本发明应用于互联网领域。