一种评论观点主题抽取方法、电子设备及存储介质

    公开(公告)号:CN112131863B

    公开(公告)日:2022-07-19

    申请号:CN202010772735.1

    申请日:2020-08-04

    Abstract: 本发明提供了一种评论观点主题抽取方法,包括:采集社交软件中评论,获得评论文本;对所述评论文本进行预处理,将评论文本转换为词向量,形成文本向量;构建观点句分类模型,判断所述评论文本中的句子是否为观点句;聚类所述观点句形成观点主题簇,分别抽取所述观点主题簇中的关键词作为候选观点关键词;在所述候选观点关键词中抽选关键词,并根据词性选择核心词;将与所述核心词匹配的观点句生成主题,形成主题候选集;从每个类别的所述主题候选集中选择一个主题作为最终观点主题。本发明还提供了电子设备和存储介质。从评论文本自动抽取观点主题,以便准确接收网民意见,并判断是否对社会造成舆论,能够直观地了解到社交软件的相关热点话题。

    一种评论观点主题抽取方法、电子设备及存储介质

    公开(公告)号:CN112131863A

    公开(公告)日:2020-12-25

    申请号:CN202010772735.1

    申请日:2020-08-04

    Abstract: 本发明提供了一种评论观点主题抽取方法,包括:采集社交软件中评论,获得评论文本;对所述评论文本进行预处理,将评论文本转换为词向量,形成文本向量;构建观点句分类模型,判断所述评论文本中的句子是否为观点句;聚类所述观点句形成观点主题簇,分别抽取所述观点主题簇中的关键词作为候选观点关键词;在所述候选观点关键词中抽选关键词,并根据词性选择核心词;将与所述核心词匹配的观点句生成主题,形成主题候选集;从每个类别的所述主题候选集中选择一个主题作为最终观点主题。本发明还提供了电子设备和存储介质。从评论文本自动抽取观点主题,以便准确接收网民意见,并判断是否对社会造成舆论,能够直观地了解到社交软件的相关热点话题。

    一种融合情感特征的评论文本细粒度情感分析方法

    公开(公告)号:CN113761910A

    公开(公告)日:2021-12-07

    申请号:CN202110283681.7

    申请日:2021-03-17

    Abstract: 本发明公开了一种融合情感特征的评论文本细粒度情感分析方法,包括以下步骤S1、已有评论数据语料预处理;S2、联合向量构建;S3、ADBC细粒度情感模型训练。有益效果:本发明通过融合情感标签,情感词、方面词来表示文本向量,设计一种针对评论文本的增强语义的高鲁棒性细粒度情感分析框架,更多的挖掘文本中潜在的情感信息,同时在注意力机制之前嵌入CNN卷积神经网络对Bi‑GRU的输出层进行特征的强化学习,从而提高了细粒度情感分析的准确性。能够反映出用户真实的评价信息,使用户对产品的各方面好坏有更加直接的了解。为消费者及供应商们提供高效可靠的反馈结果。

    一种基于弱监督的领域文本标注方法

    公开(公告)号:CN113761911A

    公开(公告)日:2021-12-07

    申请号:CN202110283769.9

    申请日:2021-03-17

    Abstract: 本发明公开了一种基于弱监督的领域文本标注方法,包括以下步骤:S1产品语料预处理过程;S2WCE‑S‑LDA模型训练;S3标注数据。有益效果:本技术提出了字词联合向量改进seeded‑lda方法实现对语料的自动标注。本发明公布了一种针对中文评论文本自动标注框架。设计一种自适应的考虑文本向量改进seeded‑lda模型的文本自动标注方法。通过本方法可以提高文本训练语料的标注速度以及规模。进而为训练模型提供更多的训练资源。本发明的目的在于提供一种面向规模语料评论的自动标注方法与框架,快速生成分类训练样本,降低人工参与,提高工作效率。同时保证一定的标注准确率,为快速分析大规模语料提供有力帮助。

Patent Agency Ranking