-
公开(公告)号:CN114091478B
公开(公告)日:2025-04-01
申请号:CN202111444136.8
申请日:2021-11-30
Applicant: 复旦大学
Abstract: 本发明提供一种基于有监督对比学习与回复生成辅助的对话情感识别方法,首先,由于构建的预训练模型CoG‑BART,采用对话级Transformer模块对待测对话进行上下文建模,从而解决了话语之间的长距离依赖问题,同时由于整体模型架构均由Transformer组成,因此引入了更少的结构先验假设;其次,由于采用了有监督对比学习来训练模型,在充分利用标签信息的情况下,不仅能够增加模型训练时的稳定性并增强模型的泛化性,还使得相同情感的样本间内聚,不同情感的样本相互斥,因此改进了相似情感难以区分的问题;最后,由于辅助性回复生成任务能够根据给定的上文信息获取更准确的下文,从而使得模型在判断话语情感时能考虑更加丰富的上下文信息,提升模型识别对话的情感标签的精确性。
-
公开(公告)号:CN112632969B
公开(公告)日:2022-06-21
申请号:CN202011463306.2
申请日:2020-12-13
Applicant: 复旦大学 , 中国大地财产保险股份有限公司
IPC: G06F40/242 , G06F40/289 , G06F40/30 , G06F40/216 , G06F40/253 , G06F40/268 , G06F16/335 , G06F16/35
Abstract: 本发明属于自然语言处理技术领域,具体为增量式行业词典更新方法和系统。本发明方法包括:基于浅层词汇统计分析的增量式选取候选词;基于深度语义计算的增量式选取行业词汇,包括:采用词语的深度语义计算的过滤和词语上下文分布的过滤从候选词中获取行业词汇;多策略人工验证,从候选行业词汇中,包括:使用不同的人工标注策略对得到的候选行业词汇进行排序,再选取部分词进行人工查看;人工查看进行三类标注:行业词汇、非行业词汇和边界错误字串,对基于浅层词汇统计分析和基于词语上下文分布过滤的参数进行微调,优化候选词选取的性能。本发明可以增量式地处理大规模语料,选择性使用人工标注信息,在低资源环境下更新构建行业词典。
-
公开(公告)号:CN114091478A
公开(公告)日:2022-02-25
申请号:CN202111444136.8
申请日:2021-11-30
Applicant: 复旦大学
Abstract: 本发明提供一种基于有监督对比学习与回复生成辅助的对话情感识别方法,首先,由于构建的预训练模型CoG‑BART,采用对话级Transformer模块对待测对话进行上下文建模,从而解决了话语之间的长距离依赖问题,同时由于整体模型架构均由Transformer组成,因此引入了更少的结构先验假设;其次,由于采用了有监督对比学习来训练模型,在充分利用标签信息的情况下,不仅能够增加模型训练时的稳定性并增强模型的泛化性,还使得相同情感的样本间内聚,不同情感的样本相互斥,因此改进了相似情感难以区分的问题;最后,由于辅助性回复生成任务能够根据给定的上文信息获取更准确的下文,从而使得模型在判断话语情感时能考虑更加丰富的上下文信息,提升模型识别对话的情感标签的精确性。
-
公开(公告)号:CN118153584A
公开(公告)日:2024-06-07
申请号:CN202211563725.2
申请日:2022-12-07
Applicant: 复旦大学
IPC: G06F40/35 , G06F16/332 , G06N3/08 , G06N3/0455
Abstract: 本发明提供了一种基于对比隐变量和风格前缀的混合对话方法,具有这样的特征,以变分编解码器VED作为基础架构,以编码器‑解码器架构的预训练模型T5作为主干模型,构建得到混合对话模型Hy‑Dialog,包括:根据训练数据中的所有历史用户输入和历史系统回复基于整体训练损失#imgabs0#训练混合对话模型Hy‑Dialog;将多轮对话中用户的所有历史用户输入和混合对话模型Hy‑Dialog的的所有历史系统回复,输入训练完成的混合对话模型Hy‑Dialog中,获得系统回复。总之,本方法在有无显式文本风格标签的情况下都能够很好地进行不同风格的回复生成。
-
公开(公告)号:CN108090857B
公开(公告)日:2021-06-22
申请号:CN201711469436.5
申请日:2017-12-29
Applicant: 复旦大学
Abstract: 本发明属于计算机技术领域,具体为一种多模态的学生课堂行为分析系统和方法。本发明系统包括学生注意力检测模块、教师授课内容检测模块、教师授课风格检测模块和相关性分析模块;学生注意力检测模块检测学生的专注率,教师授课内容检测模块检测教师的授课内容,教师授课风格检测模块检测教师的授课风格,相关性分析模块分析学生注意力检测模块测得的学生的专注率和教师授课内容检测模块测得的教师的授课内容、以及教师授课风格检测模块测得的授课风格之间的联系;本发明对学生的专注率与音频特征、授课主题之间的相关性进行分析,能帮助教师调整授课风格,提升学生的专注率。
-
公开(公告)号:CN112632969A
公开(公告)日:2021-04-09
申请号:CN202011463306.2
申请日:2020-12-13
Applicant: 复旦大学 , 中国大地财产保险股份有限公司
IPC: G06F40/242 , G06F40/289 , G06F40/30 , G06F40/216 , G06F40/253 , G06F40/268 , G06F16/335 , G06F16/35
Abstract: 本发明属于自然语言处理技术领域,具体为增量式行业词典更新方法和系统。本发明方法包括:基于浅层词汇统计分析的增量式选取候选词;基于深度语义计算的增量式选取行业词汇,包括:采用词语的深度语义计算的过滤和词语上下文分布的过滤从候选词中获取行业词汇;多策略人工验证,从候选行业词汇中,包括:使用不同的人工标注策略对得到的候选行业词汇进行排序,再选取部分词进行人工查看;人工查看进行三类标注:行业词汇、非行业词汇和边界错误字串,对基于浅层词汇统计分析和基于词语上下文分布过滤的参数进行微调,优化候选词选取的性能。本发明可以增量式地处理大规模语料,选择性使用人工标注信息,在低资源环境下更新构建行业词典。
-
公开(公告)号:CN108090857A
公开(公告)日:2018-05-29
申请号:CN201711469436.5
申请日:2017-12-29
Applicant: 复旦大学
Abstract: 本发明属于计算机技术领域,具体为一种多模态的学生课堂行为分析系统和方法。本发明系统包括学生注意力检测模块、教师授课内容检测模块、教师授课风格检测模块和相关性分析模块;学生注意力检测模块检测学生的专注率,教师授课内容检测模块检测教师的授课内容,教师授课风格检测模块检测教师的授课风格,相关性分析模块分析学生注意力检测模块测得的学生的专注率和教师授课内容检测模块测得的教师的授课内容、以及教师授课风格检测模块测得的授课风格之间的联系;本发明对学生的专注率与音频特征、授课主题之间的相关性进行分析,能帮助教师调整授课风格,提升学生的专注率。
-
公开(公告)号:CN116245113A
公开(公告)日:2023-06-09
申请号:CN202111476754.0
申请日:2021-12-06
Applicant: 复旦大学
IPC: G06F40/35 , G06N3/0455 , G06N3/08
Abstract: 本发明提供一种基于对比学习区分对话摘要与对话者的方法,其特征在于,首先基于BART构建增强序列到序列的神经网络模型,该神经网络模型的编码器‑解码器能够对对话进行编码解码;然后基于训练时生成的训练用对话摘要与目标摘要的交叉熵损失以及采用三种对比学习任务辅助神经网络模型对训练用对话进行对话编码时的对比学习损失,对该神经网络模型进行训练直至生成能够根据对话者来区分对话从而生成摘要的对话者区分模型;由于采用了三种对比学习任务来辅助编码器进行对话编码,因此使得本发明的模型能够更好地理解对话数据,令生成摘要取得了更高的准确率,避免了事实一致性错误。
-
公开(公告)号:CN102053979B
公开(公告)日:2012-12-12
申请号:CN200910210140.0
申请日:2009-10-27
IPC: G06F17/30
Abstract: 本发明提供一种信息收集方法和系统,上述方法包括:获取特定场所信息和事件信息;根据上述特定场所信息和事件信息,获取候选网站;下载上述候选网站的网页;利用上述事件信息对上述候选网站的网页进行过滤,获取包含上述事件信息的网页;对包含上述事件信息的网页进行URL模式学习,获取候选URL模式;利用上述候选URL模式,对上述候选网站的网页再次进行过滤,获取匹配上述候选URL模式的候选网页集合;从上述候选网页集合中,获取大于或等于预置覆盖频率阈值的URL模式;根据上述大于或等于预置覆盖频率阈值的URL模式获取上述URL模式所属的网站信息。本发明降低了相关网站的网页之间可能存在大量冗余信息,使网络负载量减小。
-
公开(公告)号:CN102053979A
公开(公告)日:2011-05-11
申请号:CN200910210140.0
申请日:2009-10-27
IPC: G06F17/30
Abstract: 本发明提供一种信息收集方法和系统,上述方法包括:获取特定场所信息和事件信息;根据上述特定场所信息和事件信息,获取候选网站;下载上述候选网站的网页;利用上述事件信息对上述候选网站的网页进行过滤,获取包含上述事件信息的网页;对包含上述事件信息的网页进行URL模式学习,获取候选URL模式;利用上述候选URL模式,对上述候选网站的网页再次进行过滤,获取匹配上述候选URL模式的候选网页集合;从上述候选网页集合中,获取大于或等于预置覆盖频率阈值的URL模式;根据上述大于或等于预置覆盖频率阈值的URL模式获取上述URL模式所属的网站信息。本发明降低了相关网站的网页之间可能存在大量冗余信息,使网络负载量减小。
-
-
-
-
-
-
-
-
-