一种基于文本挖掘的邮件分析方法

    公开(公告)号:CN115599909A

    公开(公告)日:2023-01-13

    申请号:CN202110781498.X

    申请日:2021-07-09

    Abstract: 一种基于文本挖掘的邮件分析方法,包括邮件解析与预处理模块、邮件话题发现模块、邮件事件抽取模块和分析结果展示模块。邮件解析与预处理模块包括获得用户的邮件进行格式解析和文本预处理。邮件话题发现模块利用聚类算法将描述同一个话题的邮件聚为一类,从话题中提取关键短语来描述该话题。邮件事件抽取模块包括过滤掉不含事件的邮件,从含有事件的邮件中提取事件涉及的事件、实体、三元关系、关键词和高频词作为事件元素,分析事件元素之间的关系以结构化关系图的形式形成事件图谱。分析结果展示模块将提取的话题和事件信息以可视化页面的形式展现给用户,用户可以在页面上直接获取邮件的分析结果。

Patent Agency Ranking