-
公开(公告)号:CN113536741B
公开(公告)日:2022-10-14
申请号:CN202010303263.5
申请日:2020-04-17
Applicant: 复旦大学
IPC: G06F40/157 , G06F16/242
Abstract: 本发明提供一种中文自然语言转数据库语言的方法及装置,用于根据数据库将用户输入的自然语言文本转换为可以对数据库进行查询的查询语句,其特征在于,包括如下步骤:预处理步骤,对自然语言文本进行规范化修正得到规范文本;列填充步骤,基于规范文本以及数据库中各个数据表的表头进行列填充处理从而生成连接符、SELECT列与对应的聚合函数以及WHERE列与对应的WHERE操作符;条件填充步骤,基于规范文本以及WHERE列对规范文本进行抽取并填充与WHERE列相对应的WHERE内容;组装输出步骤,将连接符、SELECT列与对应的聚合函数、WHERE列与对应的WHERE操作符和WHERE内容组装为查询语句并输出。
-
公开(公告)号:CN113536741A
公开(公告)日:2021-10-22
申请号:CN202010303263.5
申请日:2020-04-17
Applicant: 复旦大学
IPC: G06F40/157 , G06F16/242
Abstract: 本发明提供一种中文自然语言转数据库语言的方法及装置,用于根据数据库将用户输入的自然语言文本转换为可以对数据库进行查询的查询语句,其特征在于,包括如下步骤:预处理步骤,对自然语言文本进行规范化修正得到规范文本;列填充步骤,基于规范文本以及数据库中各个数据表的表头进行列填充处理从而生成连接符、SELECT列与对应的聚合函数以及WHERE列与对应的WHERE操作符;条件填充步骤,基于规范文本以及WHERE列对规范文本进行抽取并填充与WHERE列相对应的WHERE内容;组装输出步骤,将连接符、SELECT列与对应的聚合函数、WHERE列与对应的WHERE操作符和WHERE内容组装为查询语句并输出。
-
公开(公告)号:CN112966091A
公开(公告)日:2021-06-15
申请号:CN201911272709.6
申请日:2019-12-12
Applicant: 复旦大学
IPC: G06F16/335 , G06F16/36
Abstract: 本发明的目的在于提出能够充分利用知识图谱中语义信息以及图结构信息的推荐系统,该系统的主要特点包括:采用了实体的语义相似度的计算方法;采用了针对实体推荐应用的实体嵌入的计算方法;结合了图谱中的语义信息与图结构信息推荐实体。推荐系统具体包括:实体相似度计算模块,获取知识图谱的文本信息输入后计算获得实体的相似度;图谱嵌入式表示学习模块,以知识图谱中实体间的关系作为输入获得实体的嵌入式表示;以及实体推荐生成模块,基于用户的点击反馈数据,将实体相似度计算模块得到的相似度以及图谱嵌入式表示学习模块得到的嵌入式表示融合成最终相似度分数,从而让推荐应用向用户推荐实体。
-
公开(公告)号:CN118673117A
公开(公告)日:2024-09-20
申请号:CN202410780037.4
申请日:2024-06-17
Applicant: 复旦大学
IPC: G06F16/332 , G06F40/30 , G06F16/35
Abstract: 本发明提供了一种大语言模型情感认知能力的评测装置,具有这样的特征,包括评测数据生成模块,用于待评估大语言模型生成各个测试陈述对应的回复语句;关键事件识别评估模块,用于对各个关键事件回复语句分别进行评估,得到关键事件评估分数;混合事件识别评估模块,用于对各个混合事件回复语句分别进行评估,得到混合事件评估分数;隐含情感识别评估模块,用于对各个隐含情感回复语句分别进行评估,得到隐含情感评估分数;意图识别评估模块,用于对各个意图回复语句分别进行评估,得到意图评估分数;综合评估计算模块,用于计算得到综合评估分数。总之,本装置能够得到全面客观的大语言模型情感认知能力的量化结果。
-
公开(公告)号:CN117909442A
公开(公告)日:2024-04-19
申请号:CN202211239666.3
申请日:2022-10-11
Applicant: 复旦大学 , 中国航发四川燃气涡轮研究院
IPC: G06F16/33 , G06F16/332 , G06F40/242 , G06F40/247 , G06F40/30
Abstract: 本发明提供一种面向问答系统鲁棒性的知识丰富型问题生成方法及装置,获取待查询实体蒸馏后的事实描述、释义及近义词作为注入知识,利用编辑机制改写现有的问题来生成知识丰富型问题,即可使用不同类型的知识扩充原始问题,而不改变原始问题的含义,生成更多样化、更有意义的知识丰富型问题。进一步,本发明还启发性地为问答模型提供“诊断”信息,为每个注入知识提供一个动态权重,这使得问答模型更多地关注包含线索信息的问题部分,以预测正确答案,而对包含不相关信息的问题部分减少关注,因此通过动态调整权重,可以有效提升问答模型在知识丰富型问题和原始问题上的性能。
-
公开(公告)号:CN117391216A
公开(公告)日:2024-01-12
申请号:CN202311195451.0
申请日:2023-09-17
Applicant: 复旦大学
Abstract: 本发明属于大规模语言模型技术领域,具体为大规模语言模型自适应提示增强方法。本发明针对NLP领域的LLMs优化原始提示,以使其在各种下游任务中表现更好;包括:针对不同的语言模型,生成最适合其特性的提示,以提高性能;通过引入强化学习等自动化或半自动化方法,实现提示优化流程的简化和高效化;建立训练数据集并利用强化学习等技术优化提示。其中结合有监督的微调、强化学习、PPO和RRHF等方法。本发明具有良好的鲁棒性和泛化性,并能在各种下游任务中改善语言模型的性能,可以有效地提升prompt的质量,使得大模型产生更准确的回答;可与现有的大规模语言模型结合使用,通过微调和优化提升特定任务的表现,具有广泛的可扩展性和适应性。
-
公开(公告)号:CN112989215B
公开(公告)日:2022-06-14
申请号:CN201911279154.8
申请日:2019-12-13
Applicant: 复旦大学
IPC: G06F16/9536 , G06F16/36
Abstract: 本发明提供一种基于稀疏用户行为数据的知识图谱增强的推荐系统,用于在稀疏用户历史行为记录数据场景下,完成高准确率的用户兴趣挖掘从而生成与用户兴趣相关的用户推荐结果并推荐给用户,其特征在于,包括:用户兴趣挖掘模块,用于对各个用户的用户行为数据进行挖掘从而得到对应用户兴趣的初步推荐结果;以及推荐结果重排模块,用于对初步推荐结果进行重排和调整从而得到更契合用户兴趣的用户推荐结果,其中,用户兴趣挖掘模块包括预处理部、用户画像构建部、语义扩展部、标签池构建部、标签过滤部以及标签采样部,推荐结果重排模块包括访问对象扩展部以及推荐结果调整部。
-
公开(公告)号:CN114510610A
公开(公告)日:2022-05-17
申请号:CN202210188998.7
申请日:2022-02-28
Applicant: 复旦大学
IPC: G06F16/901 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种面向多模态知识图谱构建的识别视觉概念的方法,第一次显式地提出在面向多模态知识图谱构建过程中有针对地识别视觉概念这一问题,将该问题建模为一个二分类问题,筛选并设计了解决该分类问题所需的特征数据,从而构建出了一个双流的含BERT模型和图像分类模型的多模态分类模型,用来编码和融合待测概念的文本特征和图像特征,从而达到区分视觉概念和非视觉概念的目的。同时,该多模态分类模型采用了二阶段的PULearning的训练方法,用纯自动化的方式实现了训练数据的初始化,用自训练的思想在迭代中自动化地有效地扩充训练数据集,在扩充的过程中也完全规避了人工的手段且提升了分类网络的准确率。
-
公开(公告)号:CN112989215A
公开(公告)日:2021-06-18
申请号:CN201911279154.8
申请日:2019-12-13
Applicant: 复旦大学
IPC: G06F16/9536 , G06F16/36
Abstract: 本发明提供一种基于稀疏用户行为数据的知识图谱增强的推荐系统,用于在稀疏用户历史行为记录数据场景下,完成高准确率的用户兴趣挖掘从而生成与用户兴趣相关的用户推荐结果并推荐给用户,其特征在于,包括:用户兴趣挖掘模块,用于对各个用户的用户行为数据进行挖掘从而得到对应用户兴趣的初步推荐结果;以及推荐结果重排模块,用于对初步推荐结果进行重排和调整从而得到更契合用户兴趣的用户推荐结果,其中,用户兴趣挖掘模块包括预处理部、用户画像构建部、语义扩展部、标签池构建部、标签过滤部以及标签采样部,推荐结果重排模块包括访问对象扩展部以及推荐结果调整部。
-
公开(公告)号:CN103491165B
公开(公告)日:2017-04-12
申请号:CN201310431787.2
申请日:2013-09-22
Applicant: 复旦大学
Abstract: 本发明属于分布式系统和人工智能技术领域,具体为一种自动检测屏蔽的通用分布式爬虫系统。该系统采用星型网络架构,包括一个核心节点Master和多个从机Slave,核心节点Master控制集群中的从机Slave。本发明中采用全自动检测被屏蔽页面的算法,其通过检测爬虫下载的页面的大小和Token编辑距离的分布的随机性来检测是否出现异常情况,以自动分辨当前获取的页面是否是有效数据。本发明的系统可以自动分辨当前集群中的每台机器是否被屏蔽,以进行更好的任务调度,从而更大程度地利用机器资源和网络资源。
-
-
-
-
-
-
-
-
-