基于模式匹配的产品特征提取方法

    公开(公告)号:CN107480257A

    公开(公告)日:2017-12-15

    申请号:CN201710694361.4

    申请日:2017-08-14

    Inventor: 徐新胜 林静

    CPC classification number: G06F17/30864 G06F17/30569 G06F17/30731 G06K9/6201

    Abstract: 本发明提出了一种基于模式匹配的产品特征提取方法,具体步骤如下:1,评论语料库获取;2,中文自然语言处理;3,产品特征提取。整个方法的创新点在步骤3中提出的产品特征必须满足的五个准则,步骤1和2是产品特征提取的基础工作。本发明旨在提供一种便捷、高效的方法提取产品特征,它是对现有的产品特征提取方法的扩充。利用本发明,研究者们可以快速、有效的进行产品特征提取,同时提高了产品特征提取的准确率、召回率和F值。

    基于评论文本挖掘的产品特征结构树构建方法

    公开(公告)号:CN106649260B

    公开(公告)日:2022-01-25

    申请号:CN201610911734.4

    申请日:2016-10-19

    Abstract: 本发明提出了一种基于评论文本挖掘的产品特征结构树构建方法,为数据挖掘研究提供了一种新颖、有效的方法。该方法的步骤如下:1,语料库的获取;2,产品特征的提取;3,产品特征结构树的构建;4,产品特征的定量分析;5,产品特征结构树的扩展。目前,关于评论文本的获取、产品特征的提取等技术都已较为成熟,但对提取的产品特征并没有进行深入的研究。而本发明旨在研究产品特征之间的关系和其对产品质量特性的反应,为产品特征提取之后的研究拓展了方向、提供了思路。利用本发明的方法,制造企业可以快速、有效地了解用户反馈的使用产品信息,有助于企业与消费者之间建立对话,帮助企业进行产品设计的改进,扩大市场占有率。

    基于相似度计算的垃圾评论检测方法

    公开(公告)号:CN106708966A

    公开(公告)日:2017-05-24

    申请号:CN201611092375.0

    申请日:2016-11-29

    Abstract: 本发明提供了一种基于相似度计算的垃圾评论检测方法,包括下述步骤:步骤1,数据获取:利用网络爬虫,抓取与指定产品相关的论坛、电商等网页,然后抽取网页中的评论数据,并将评论数据保存到数据库中;步骤2,虚假评论检测:计算评论时间与购买时间的时间的差T,若T<货物运送时间则该条评论为虚假评论。步骤3,重复评论检测:对每条评论进行分词,然后计算评论间的相似度,当评论间的相似度高于阈值,则该评论和其相似的评论即为重复评论;步骤4,数据处理:对评论进行句法分析、情感标注、特征词提取等处理,并根据产品说明书,构建产品特征词典。步骤5,无关评论检测:计算每条评论的评论目标是否为目标产品及其特征,检测出与目标产品无关的评论。本发明提供了一种的新的垃圾评论检测方法。

    基于评论文本挖掘的产品特征结构树构建方法

    公开(公告)号:CN106649260A

    公开(公告)日:2017-05-10

    申请号:CN201610911734.4

    申请日:2016-10-19

    CPC classification number: G06F17/2775 G06F17/2785 G06F17/30705

    Abstract: 本发明提出了一种基于评论文本挖掘的产品特征结构树构建方法,为数据挖掘研究提供了一种新颖、有效的方法。该方法的步骤如下:1,语料库的获取;2,产品特征的提取;3,产品特征结构树的构建;4,产品特征的定量分析;5,产品特征结构树的扩展。目前,关于评论文本的获取、产品特征的提取等技术都已较为成熟,但对提取的产品特征并没有进行深入的研究。而本发明旨在研究产品特征之间的关系和其对产品质量特性的反应,为产品特征提取之后的研究拓展了方向、提供了思路。利用本发明的方法,制造企业可以快速、有效地了解用户反馈的使用产品信息,有助于企业与消费者之间建立对话,帮助企业进行产品设计的改进,扩大市场占有率。

    基于相似度计算的垃圾评论检测方法

    公开(公告)号:CN106708966B

    公开(公告)日:2023-04-25

    申请号:CN201611092375.0

    申请日:2016-11-29

    Abstract: 本发明提供了一种基于相似度计算的垃圾评论检测方法,包括下述步骤:步骤1,数据获取:利用网络爬虫,抓取与指定产品相关的论坛、电商等网页,然后抽取网页中的评论数据,并将评论数据保存到数据库中;步骤2,虚假评论检测:计算评论时间与购买时间的时间的差T,若T<货物运送时间则该条评论为虚假评论。步骤3,重复评论检测:对每条评论进行分词,然后计算评论间的相似度,当评论间的相似度高于阈值,则该评论和其相似的评论即为重复评论;步骤4,数据处理:对评论进行句法分析、情感标注、特征词提取等处理,并根据产品说明书,构建产品特征词典。步骤5,无关评论检测:计算每条评论的评论目标是否为目标产品及其特征,检测出与目标产品无关的评论。本发明提供了一种的新的垃圾评论检测方法。

Patent Agency Ranking