-
公开(公告)号:CN115344687A
公开(公告)日:2022-11-15
申请号:CN202210760479.3
申请日:2022-06-30
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F16/34 , G06F16/35 , G06F40/289 , G06F40/30 , G06N3/04
Abstract: 一种基于信息熵和特征提取的时序对话抽取式摘要方法,其包括对聊天记录进行划分并计算信息熵,从而删除无关信息;提取动态词向量并获取文本特征,计算得出文本摘要,其解决了现有的摘要获取方法存在的准确率较低的技术问题,且本发明改善了现有摘要方法无法解决聊天记录短文本、口语化等问题,考虑记录时序性特点,避免了摘要与原记录事实不一致的现象,可广泛应用于大数据处理领域。