基于规则总结的陈述性学习方法及装置

    公开(公告)号:CN118445611A

    公开(公告)日:2024-08-06

    申请号:CN202410476136.3

    申请日:2024-04-19

    Applicant: 复旦大学

    Inventor: 邱锡鹏 王博

    Abstract: 本发明提供了一种基于规则总结的陈述性学习方法及装置,具有这样的特征,包括以下步骤:步骤S1,构建多个分类特征;步骤S2,根据所有所述标签和对应的所有所述分类特征构建包括多个文本测试子集的文本测试集;步骤S3,从所述文本测试集中选取多个所述文本测试子集使所述大模型进行前向推理,经由多次探索得到多条探索轨迹;步骤S4,从所有所述探索轨迹中提取共性总结;步骤S5,将所述共性总结与所述大模型存储的规律进行合并,得到更新的所述规律;步骤S6,重复所述步骤S3至步骤S5,直至达到预设终止条件,则得到完成自我提升的所述大模型。总之,本方法能够能够不引入人为标注的同时,实现大模型的自我提升。

    基于对比隐变量和风格前缀的混合对话方法

    公开(公告)号:CN118153584A

    公开(公告)日:2024-06-07

    申请号:CN202211563725.2

    申请日:2022-12-07

    Applicant: 复旦大学

    Abstract: 本发明提供了一种基于对比隐变量和风格前缀的混合对话方法,具有这样的特征,以变分编解码器VED作为基础架构,以编码器‑解码器架构的预训练模型T5作为主干模型,构建得到混合对话模型Hy‑Dialog,包括:根据训练数据中的所有历史用户输入和历史系统回复基于整体训练损失#imgabs0#训练混合对话模型Hy‑Dialog;将多轮对话中用户的所有历史用户输入和混合对话模型Hy‑Dialog的的所有历史系统回复,输入训练完成的混合对话模型Hy‑Dialog中,获得系统回复。总之,本方法在有无显式文本风格标签的情况下都能够很好地进行不同风格的回复生成。

    基于不确定成分的中文命名实体识别检索增强框架

    公开(公告)号:CN116663559A

    公开(公告)日:2023-08-29

    申请号:CN202210147274.8

    申请日:2022-02-17

    Applicant: 复旦大学

    Abstract: 本发明提供一种基于不确定成分的中文命名实体识别检索增强框架,由于包括命名实体识别模型,能够对输入的中文序列进行不确定成分采样,并基于采样得到的实体集不确定成分进行检索,因此相较于传统的依赖于词典的方法,能够有效地检索得到所需的知识序列,且无需花费高昂的代价进行高质量词典的构建以及动态维护,节省了大量算力,进一步,由于包括知识融合模型,能够基于检索得到的知识序列进行中文命名实体的识别预测,因此能够通过知识序列消除识别过程中的歧义,得到更为准确的预测结果,且相较于传统的采用遍历策略进行检测的方法,效率更高。综上所述,通过本发明的增强框架,能高效地得到准确的中文命名实体识别结果,且能节省大量算力。

    一种对基于SOA的业务运营支撑系统的服务管理方法

    公开(公告)号:CN102722795A

    公开(公告)日:2012-10-10

    申请号:CN201210184570.1

    申请日:2012-06-06

    Abstract: 本发明属于计算机技术领域,具体为一种基于SOA的业务运营支撑系统的服务管理方法。本方法主要涉及3个模块:服务注册中心、服务质量监控中心和工作流引擎。本方法中,注册中心基于UDDI,并且采用e-TOM模型中所提出的聚合商业实体和商业实体的概念对服务进行粒度划分式的注册;服务质量监控中心,根据ISO/IEC9126模型,对一些关键服务进行替换策略;工作流引擎实现从业务到服务映射,驱动业务流程的运作,并为质量监控中心和服务设计人员反馈服务的相关信息,提高系统运行效率。本发明对于实施了基于SOA架构信息系统平台的企业,具有重要意义。

    医学文本小样本信息抽取方法及装置

    公开(公告)号:CN118485077A

    公开(公告)日:2024-08-13

    申请号:CN202410698310.9

    申请日:2024-05-31

    Applicant: 复旦大学

    Abstract: 本发明提供了一种医学文本小样本信息抽取方法及装置,具有这样的特征,包括以下步骤:步骤S1,将待测医学文本与指定任务对应的代码化提示词进行拼接,得到对应的代码字符串片段作为待预测数据;步骤S2,将指定任务对应的预设数据与待预测数据进行拼接,得到输入数据;步骤S3,将输入数据输入信息提取模型,得到输出数据;步骤S4,对输出数据进行反代码化解析,得到指定信息。总之,本方法能够避免结构化错误,并根据不同场景使用对应的代码化提示词实现精准的指定信息提取。

    一种基于范例学习的文本摘要生成框架系统及方法

    公开(公告)号:CN113673241B

    公开(公告)日:2024-04-09

    申请号:CN202110885791.0

    申请日:2021-08-03

    Abstract: 本发明公开了一种基于范例学习的文本摘要生成框架及方法,允许在摘要生成的过程中参考一些写作范例,框架包括检索和生成两个阶段,检索阶段,给定一个文本,使用对比学习去数据库中检索一些范例,假定越好的摘要在语义空间应该和原文离得更近,检索器的模型使用了孪生网络的结构;生成阶段,提出了一种结合范例进行摘要生成的方法,可以方便的加在目前所有主流的条件生成模型上,为了更好的学习范例,将待生成的摘要和范例摘要按照句子对齐;通过训练好的模型进行预测,即解码阶段,使用集束搜索算法并鼓励那些和范例更相似的束。

    一种基于对比学习区分对话摘要与对话者的方法

    公开(公告)号:CN116245113A

    公开(公告)日:2023-06-09

    申请号:CN202111476754.0

    申请日:2021-12-06

    Applicant: 复旦大学

    Abstract: 本发明提供一种基于对比学习区分对话摘要与对话者的方法,其特征在于,首先基于BART构建增强序列到序列的神经网络模型,该神经网络模型的编码器‑解码器能够对对话进行编码解码;然后基于训练时生成的训练用对话摘要与目标摘要的交叉熵损失以及采用三种对比学习任务辅助神经网络模型对训练用对话进行对话编码时的对比学习损失,对该神经网络模型进行训练直至生成能够根据对话者来区分对话从而生成摘要的对话者区分模型;由于采用了三种对比学习任务来辅助编码器进行对话编码,因此使得本发明的模型能够更好地理解对话数据,令生成摘要取得了更高的准确率,避免了事实一致性错误。

    一种基于序列到序列架构的命名实体识别方法

    公开(公告)号:CN113221576B

    公开(公告)日:2023-01-13

    申请号:CN202110608812.4

    申请日:2021-06-01

    Inventor: 邱锡鹏 颜航

    Abstract: 本发明涉及识别技术领域,提供了一种基于序列到序列架构的命名实体识别方法,由于构件的命名实体识别模型包括编码器和解码器,解码器的输出为命名实体位置和文本标签,通过预设样本对命名实体识别模型进行训练后,将待测文本输入命名实体识别模型,得到识别结果序列,对命名实体识别模型输出的识别结果序列进行解码,得到多个命名实体以及每个命名实体所对应的文本标签,因此,本发明在不同场景的命名实体识别中不再需要针对不同命名实体设计不同的标签,能够使用完全一样的模型来解决不同场景的命名实体识别任务,设计简单,应用场景广泛。

Patent Agency Ranking