-
公开(公告)号:CN109299256A
公开(公告)日:2019-02-01
申请号:CN201811071285.2
申请日:2018-09-14
Applicant: 成都信息工程大学
IPC: G06F16/35 , G06F16/953
CPC classification number: G06F2216/03
Abstract: 本发明涉及一种在线观点挖掘方法及系统,该方法包括:(1)构建一个定向网络爬虫,以实现自动抓取针对电商的商品属性和商品评论信息数据;(2)对爬取的文本数据采用分词算法进行预处理,以转换成计算机方便处理的格式;(3)对商品细粒度属性和情感进行倾向性分析和观点挖掘;(4)采用启发式规则方法,在大量文本中总结出需要寻找的“属性-观点”这种特定关系的规律,并基于“短评论包含的评价对象应是单一的”基本假设,实现从评论句中获取商品细粒度属性和情感描述信息。该系统包括网络爬虫模块、数据处理模块和观点挖掘模块。本发明能提升用户获取关于商品多粒度的质量信息的速度,能极大提高人们获取商品观点的效率。