-
公开(公告)号:CN115034217A
公开(公告)日:2022-09-09
申请号:CN202210608239.1
申请日:2022-05-31
Applicant: 哈尔滨工业大学
IPC: G06F40/289 , G06F40/284 , G06F40/30 , G06K9/62 , G06F16/951 , G06F16/9035 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于关键信息指导面向微博文本的生成式自动文本摘要方法,首先需要将微博文本进行清洗,去除其中冗余信息和其他非关键信息;然后通过关键信息提取模块,得到微博文本中的关键词和关键短语;之后针对该任务设计专用的深度学习神经网络并使用公开数据集训练模型;最后将处理好的微博文本和关键信息作为输入,使用关键信息进行指导摘要生成,得到最终的摘要结果;本发明的目的是为了改进根据微博文本生成摘要的精度,进一步提高舆情分析系统在针对微博文本进行分析时内容检索的准确性,更为简要、准确地覆盖微博文本的主要信息,节省人工阅读全文的时间。
-
公开(公告)号:CN113378024B
公开(公告)日:2023-09-01
申请号:CN202110566115.7
申请日:2021-05-24
Applicant: 哈尔滨工业大学
IPC: G06F16/951 , G06F16/9536 , G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06F18/241 , G06N3/0464 , G06N3/048 , G06N3/08 , G06Q50/00
Abstract: 本发明公开一种基于深度学习面向公检法领域的相关事件识别方法。步骤1:采集网络上各种热点信息标题,进行非中文、非英文、非数字字符的清理并存储在数据库中;步骤2:对步骤1数据库中的热点信息标题采用文本分类技术及深度学习进行识别是否与公检法领域相关;步骤3:对步骤1数据库中的热点信息标题做出相应标识并存储。本发明用以解决舆情量过大导致耗费人力物力、系统性能较差的问题。
-
公开(公告)号:CN113312532A
公开(公告)日:2021-08-27
申请号:CN202110608376.0
申请日:2021-06-01
Applicant: 哈尔滨工业大学
IPC: G06F16/951 , G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于深度学习面向公检法领域的舆情等级预测方法。步骤1:从网络上爬取公检法领域相关的舆情信息,提取其中的文本信息存储至数据库中;步骤2:对采集到文本信息利用深度学习模型进行预测,得到舆情等级预测结果;步骤3:将步骤2的舆情等级预测结果存储至系统数据库;步骤4:在数据库中对舆情等级做出相应标识;步骤5:对标识后的数据库中舆情等级提供可访问舆情信息的数据接口;步骤6:通过数据接口在系统中显示舆情等级预测结果。本发明用以解决舆情系统没有针对性的问题,跳出算法的限制。
-
公开(公告)号:CN113312532B
公开(公告)日:2022-10-21
申请号:CN202110608376.0
申请日:2021-06-01
Applicant: 哈尔滨工业大学
IPC: G06F16/951 , G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于深度学习面向公检法领域的舆情等级预测方法。步骤1:从网络上爬取公检法领域相关的舆情信息,提取其中的文本信息存储至数据库中;步骤2:对采集到文本信息利用深度学习模型进行预测,得到舆情等级预测结果;步骤3:将步骤2的舆情等级预测结果存储至系统数据库;步骤4:在数据库中对舆情等级做出相应标识;步骤5:对标识后的数据库中舆情等级提供可访问舆情信息的数据接口;步骤6:通过数据接口在系统中显示舆情等级预测结果。本发明用以解决舆情系统没有针对性的问题,跳出算法的限制。
-
公开(公告)号:CN115114428A
公开(公告)日:2022-09-27
申请号:CN202210673842.8
申请日:2022-06-15
Applicant: 哈尔滨工业大学
IPC: G06F16/34 , G06F16/953 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 一种基于主题信息的新闻文本摘要获取方法、装置、获取器和存储介质,涉及自然语言处理技术领域。解决了现有生成式文本摘要技术在生成的时候并没有主动地去关注这些潜在的主题信息,导致在生成过程中失去部分重要信息的问题。所述方法包括:对新闻文本进行清理,去除所述新闻文本中无用的符号和信息;利用公开语料库进行主题模型的训练,获取主题语义矩阵;根据获取的主题语义矩阵结合深度学习神经网络建立新闻文本的专用生成式摘要模型,并利用公开数据集训练模型,获取数据集训练模型;将新闻文本的清洗步骤中处理的文本输入至数据集训练模型,利用主题信息进行指导摘要生成,获得摘要结果。本发明应用于新闻信息处理技术领域。
-
公开(公告)号:CN113378024A
公开(公告)日:2021-09-10
申请号:CN202110566115.7
申请日:2021-05-24
Applicant: 哈尔滨工业大学
IPC: G06F16/951 , G06F16/9536 , G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明公开一种基于深度学习面向公检法领域的相关事件识别方法。步骤1:采集网络上各种热点信息标题,进行非中文、非英文、非数字字符的清理并存储在数据库中;步骤2:对步骤1数据库中的热点信息标题采用文本分类技术及深度学习进行识别是否与公检法领域相关;步骤3:对步骤1数据库中的热点信息标题做出相应标识并存储。本发明用以解决舆情量过大导致耗费人力物力、系统性能较差的问题。
-
公开(公告)号:CN115034216B
公开(公告)日:2025-05-13
申请号:CN202210606979.1
申请日:2022-05-31
Applicant: 哈尔滨工业大学
IPC: G06F40/289 , G06F40/284 , G06F40/205 , G06F16/953 , G06F18/22 , G06F18/213 , G06F18/24 , G06F18/25 , G06N3/0442 , G06N3/08
Abstract: 本发明提出了一种基于图模型和词嵌入模型面向新闻领域的关键词抽取方法,本发明首先需要将新闻文本进行清洗,去除其中无用信息;然后通过文本处理模块,得到新闻文本中的潜在关键词和词频信息;之后采用图模型和预训练的词嵌入模型对关键词进行语义空间映射,最后融合前述两个模型对关键词的排序分布获得最后关键的分布,从而获得新闻文本关键词;本发明能够改进新闻文本关键词提取的精度,进一步提高舆情分析系统在针对新闻文本分析时内容检索的准确性,更为全面地覆盖新闻文本的主要信息,节省人工复核的时间。
-
公开(公告)号:CN115034216A
公开(公告)日:2022-09-09
申请号:CN202210606979.1
申请日:2022-05-31
Applicant: 哈尔滨工业大学
IPC: G06F40/289 , G06F40/284 , G06F40/205 , G06F16/953 , G06K9/62
Abstract: 本发明提出了一种基于图模型和词嵌入模型面向新闻领域的关键词抽取方法,本发明首先需要将新闻文本进行清洗,去除其中无用信息;然后通过文本处理模块,得到新闻文本中的潜在关键词和词频信息;之后采用图模型和预训练的词嵌入模型对关键词进行语义空间映射,最后融合前述两个模型对关键词的排序分布获得最后关键的分布,从而获得新闻文本关键词;本发明能够改进新闻文本关键词提取的精度,进一步提高舆情分析系统在针对新闻文本分析时内容检索的准确性,更为全面地覆盖新闻文本的主要信息,节省人工复核的时间。
-
-
-
-
-
-
-