-
公开(公告)号:CN118445611A
公开(公告)日:2024-08-06
申请号:CN202410476136.3
申请日:2024-04-19
Applicant: 复旦大学
IPC: G06F18/214 , G06F18/24 , G06F16/332 , G06N5/04
Abstract: 本发明提供了一种基于规则总结的陈述性学习方法及装置,具有这样的特征,包括以下步骤:步骤S1,构建多个分类特征;步骤S2,根据所有所述标签和对应的所有所述分类特征构建包括多个文本测试子集的文本测试集;步骤S3,从所述文本测试集中选取多个所述文本测试子集使所述大模型进行前向推理,经由多次探索得到多条探索轨迹;步骤S4,从所有所述探索轨迹中提取共性总结;步骤S5,将所述共性总结与所述大模型存储的规律进行合并,得到更新的所述规律;步骤S6,重复所述步骤S3至步骤S5,直至达到预设终止条件,则得到完成自我提升的所述大模型。总之,本方法能够能够不引入人为标注的同时,实现大模型的自我提升。
-
公开(公告)号:CN118153584A
公开(公告)日:2024-06-07
申请号:CN202211563725.2
申请日:2022-12-07
Applicant: 复旦大学
IPC: G06F40/35 , G06F16/332 , G06N3/08 , G06N3/0455
Abstract: 本发明提供了一种基于对比隐变量和风格前缀的混合对话方法,具有这样的特征,以变分编解码器VED作为基础架构,以编码器‑解码器架构的预训练模型T5作为主干模型,构建得到混合对话模型Hy‑Dialog,包括:根据训练数据中的所有历史用户输入和历史系统回复基于整体训练损失#imgabs0#训练混合对话模型Hy‑Dialog;将多轮对话中用户的所有历史用户输入和混合对话模型Hy‑Dialog的的所有历史系统回复,输入训练完成的混合对话模型Hy‑Dialog中,获得系统回复。总之,本方法在有无显式文本风格标签的情况下都能够很好地进行不同风格的回复生成。
-
公开(公告)号:CN116663559A
公开(公告)日:2023-08-29
申请号:CN202210147274.8
申请日:2022-02-17
Applicant: 复旦大学
IPC: G06F40/295 , G06F16/33
Abstract: 本发明提供一种基于不确定成分的中文命名实体识别检索增强框架,由于包括命名实体识别模型,能够对输入的中文序列进行不确定成分采样,并基于采样得到的实体集不确定成分进行检索,因此相较于传统的依赖于词典的方法,能够有效地检索得到所需的知识序列,且无需花费高昂的代价进行高质量词典的构建以及动态维护,节省了大量算力,进一步,由于包括知识融合模型,能够基于检索得到的知识序列进行中文命名实体的识别预测,因此能够通过知识序列消除识别过程中的歧义,得到更为准确的预测结果,且相较于传统的采用遍历策略进行检测的方法,效率更高。综上所述,通过本发明的增强框架,能高效地得到准确的中文命名实体识别结果,且能节省大量算力。
-
公开(公告)号:CN113673242A
公开(公告)日:2021-11-19
申请号:CN202110960433.1
申请日:2021-08-20
IPC: G06F40/289 , G06F40/211 , G06K9/62 , G06N3/08
Abstract: 本发明公开了一种基于K邻近结点算法和对比学习的文本分类方法,该方法在训练阶段使用对比学习拉进类内距离,拉远类间距离,并且结合交叉熵损失,辅助对比学习进行联合训练,在推理过程中,通过联合训练好的模型,结合最邻近结点算法,进行联合预测,计算待推断文本的分类;本发明不仅能够在文本分类的准确率上取得比目前业内使用的文本分类方式更高的结果,而且在模型的鲁棒性上也取得了极大的提升。
-
公开(公告)号:CN102722795A
公开(公告)日:2012-10-10
申请号:CN201210184570.1
申请日:2012-06-06
Applicant: 复旦大学 , 东方有线网络有限公司
IPC: G06Q10/06
Abstract: 本发明属于计算机技术领域,具体为一种基于SOA的业务运营支撑系统的服务管理方法。本方法主要涉及3个模块:服务注册中心、服务质量监控中心和工作流引擎。本方法中,注册中心基于UDDI,并且采用e-TOM模型中所提出的聚合商业实体和商业实体的概念对服务进行粒度划分式的注册;服务质量监控中心,根据ISO/IEC9126模型,对一些关键服务进行替换策略;工作流引擎实现从业务到服务映射,驱动业务流程的运作,并为质量监控中心和服务设计人员反馈服务的相关信息,提高系统运行效率。本发明对于实施了基于SOA架构信息系统平台的企业,具有重要意义。
-
公开(公告)号:CN118485077A
公开(公告)日:2024-08-13
申请号:CN202410698310.9
申请日:2024-05-31
Applicant: 复旦大学
IPC: G06F40/295
Abstract: 本发明提供了一种医学文本小样本信息抽取方法及装置,具有这样的特征,包括以下步骤:步骤S1,将待测医学文本与指定任务对应的代码化提示词进行拼接,得到对应的代码字符串片段作为待预测数据;步骤S2,将指定任务对应的预设数据与待预测数据进行拼接,得到输入数据;步骤S3,将输入数据输入信息提取模型,得到输出数据;步骤S4,对输出数据进行反代码化解析,得到指定信息。总之,本方法能够避免结构化错误,并根据不同场景使用对应的代码化提示词实现精准的指定信息提取。
-
公开(公告)号:CN113673241B
公开(公告)日:2024-04-09
申请号:CN202110885791.0
申请日:2021-08-03
IPC: G06F40/289 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于范例学习的文本摘要生成框架及方法,允许在摘要生成的过程中参考一些写作范例,框架包括检索和生成两个阶段,检索阶段,给定一个文本,使用对比学习去数据库中检索一些范例,假定越好的摘要在语义空间应该和原文离得更近,检索器的模型使用了孪生网络的结构;生成阶段,提出了一种结合范例进行摘要生成的方法,可以方便的加在目前所有主流的条件生成模型上,为了更好的学习范例,将待生成的摘要和范例摘要按照句子对齐;通过训练好的模型进行预测,即解码阶段,使用集束搜索算法并鼓励那些和范例更相似的束。
-
公开(公告)号:CN116245113A
公开(公告)日:2023-06-09
申请号:CN202111476754.0
申请日:2021-12-06
Applicant: 复旦大学
IPC: G06F40/35 , G06N3/0455 , G06N3/08
Abstract: 本发明提供一种基于对比学习区分对话摘要与对话者的方法,其特征在于,首先基于BART构建增强序列到序列的神经网络模型,该神经网络模型的编码器‑解码器能够对对话进行编码解码;然后基于训练时生成的训练用对话摘要与目标摘要的交叉熵损失以及采用三种对比学习任务辅助神经网络模型对训练用对话进行对话编码时的对比学习损失,对该神经网络模型进行训练直至生成能够根据对话者来区分对话从而生成摘要的对话者区分模型;由于采用了三种对比学习任务来辅助编码器进行对话编码,因此使得本发明的模型能够更好地理解对话数据,令生成摘要取得了更高的准确率,避免了事实一致性错误。
-
公开(公告)号:CN113221576B
公开(公告)日:2023-01-13
申请号:CN202110608812.4
申请日:2021-06-01
Applicant: 复旦大学(CN)
IPC: G06F40/295 , G06F16/35
Abstract: 本发明涉及识别技术领域,提供了一种基于序列到序列架构的命名实体识别方法,由于构件的命名实体识别模型包括编码器和解码器,解码器的输出为命名实体位置和文本标签,通过预设样本对命名实体识别模型进行训练后,将待测文本输入命名实体识别模型,得到识别结果序列,对命名实体识别模型输出的识别结果序列进行解码,得到多个命名实体以及每个命名实体所对应的文本标签,因此,本发明在不同场景的命名实体识别中不再需要针对不同命名实体设计不同的标签,能够使用完全一样的模型来解决不同场景的命名实体识别任务,设计简单,应用场景广泛。
-
公开(公告)号:CN114564964A
公开(公告)日:2022-05-31
申请号:CN202210172989.9
申请日:2022-02-24
Applicant: 杭州中软安人网络通信股份有限公司 , 复旦大学 , 杭州文图思锐云技术有限公司
Abstract: 本发明提供一种基于k近邻对比学习的未知意图检测方法,其特征在于,包括以下步骤:步骤S1,利用已知意图的语料构建经验风险损失;步骤S2,构建语义表示模型,采用k近邻对比学习与经验风险损失对所述语义表示模型进行训练;步骤S3,将待测文本输入至训练后的语义表示模型,以获取所述待测文本的语义表示;步骤S4,采用下游检测算法检测所述语义表示是否为未知意图,并输出为已知意图的语义表示的类别。该基于k近邻对比学习的未知意图检测方法在语义表示学习阶段和未知检测阶段都不依赖于语义分布的任何假设,而且检测精度高、设计简单且应用场景广泛,解决了现有意图检测方法在现实场景应用受限的缺陷。
-
-
-
-
-
-
-
-
-