-
公开(公告)号:CN108595389A
公开(公告)日:2018-09-28
申请号:CN201810378038.0
申请日:2018-04-25
Applicant: 华中科技大学
Abstract: 本发明公开一种将Word文档转换为txt纯文本文档的方法,包括以下步骤:提取Word文档中的图片信息和公式信息并保存;将Word文档转换为Html文档,并将所述Html文档中的格式信息去除,所述格式信息为Word文档中格式标签对应的信息;对所述Html进行解析,提取相应的文本信息并存储为txt文档。本发明批量对Word文档进行自动转换,同时优化Word文档转换的结果。
-
公开(公告)号:CN108595389B
公开(公告)日:2021-02-26
申请号:CN201810378038.0
申请日:2018-04-25
Applicant: 华中科技大学
IPC: G06F40/151 , G06F40/109 , G06F16/11
Abstract: 本发明公开一种将Word文档转换为txt纯文本文档的方法,包括以下步骤:提取Word文档中的图片信息和公式信息并保存;将Word文档转换为Html文档,并将所述Html文档中的格式信息去除,所述格式信息为Word文档中格式标签对应的信息;对所述Html进行解析,提取相应的文本信息并存储为txt文档。本发明批量对Word文档进行自动转换,同时优化Word文档转换的结果。
-
公开(公告)号:CN110838072A
公开(公告)日:2020-02-25
申请号:CN201911015056.3
申请日:2019-10-24
Applicant: 华中科技大学 , 武汉烽火技术服务有限公司
Abstract: 本发明公开了一种基于社区发现的社交网络影响力最大化方法及系统,属于数据挖掘领域,包括:(1)对待分析的社交网络进行社区发现,将社交网络划分为多个社区;(2)在社区内部挖掘出k1个节点作为候选种子节点,得到第一候选集合,并识别社交网络中的边界节点,从中挖掘出k2个作为候选种子节点,得到第二候选集合;(3)将第一候选集合和第二候选集合的并集作为候选种子节点集合,并利用贪心算法从候选种子节点集合中筛选出带来最大边际增益的K节点作为种子节点,构成使得社交网络影响力最大化的种子节点集合。本发明能够在降低社交网络影响力最大化的时间复杂度的同时,扩大种子节点集合的影响范围。
-
-