基于内部资源和外部资源的教材智能解析系统

    公开(公告)号:CN118585649A

    公开(公告)日:2024-09-03

    申请号:CN202310191676.2

    申请日:2023-03-02

    Applicant: 复旦大学

    Abstract: 本发明提供了一种基于内部资源和外部资源的教材智能解析系统及平台,用于根据数字教材、外部互联网的开放数据和基于开放数据的类型标签构建得到教材知识图谱,具有这样的特征,包括教材预处理模块、教材结构解析模块、内部资源链接模块、外部资源链接模块和教材知识图谱模块。总之,本方法能够能够构建具有高质量内外部资源的教材知识图谱,构建提供更丰富的数字教材相关信息的平台。

    基于层次注意力机制的工业视频链接方法

    公开(公告)号:CN118277684A

    公开(公告)日:2024-07-02

    申请号:CN202410140964.X

    申请日:2024-02-01

    Applicant: 复旦大学

    Abstract: 本发明提供的一种基于层次注意力机制的工业视频链接方法,用于将工业视频与现有工业知识图谱进行知识概念迭代链接,本发明基于工业视频的语音识别文本和图像文本利用层次注意力机制计算和融合相似度,获取相似度的最高得分作为计算结果,通过迭代链接到工业知识图谱的知识概念中去,充分利用工业视频的图像文本和语音识别文本,通过图像文本所包含的文字信息可以极大帮助预训练语言模型学习和理解相关知识,减少迭代链接中的误差传递。

    面向多模态应用的视频热门评论生成的方法及装置

    公开(公告)号:CN117998156A

    公开(公告)日:2024-05-07

    申请号:CN202410088250.9

    申请日:2024-01-22

    Applicant: 复旦大学

    Abstract: 本发明公开的一种面向多模态应用的视频热门评论生成的方法,用于生成视频热门评论,本发明利用中文视频热门评论生成数据集HOTVCOM,包括视频标题、描述、字幕、音频内容、关键帧和互动信息;利用ComHeat的视频热门评论生成框架,本发明通过监督微调模型生成初步评论,并利用综合评估指标对初始评论进行更全面评估和排序,基于排序后的初始评论利用大语言模型训练奖励模型,有效地模拟了人类的偏好,并强化学习增强这些评论,提高生成评论的热度生成热门评论。

    一种基于高斯分布表示的深度推荐系统

    公开(公告)号:CN110765363B

    公开(公告)日:2023-05-05

    申请号:CN201910920671.2

    申请日:2019-09-27

    Applicant: 复旦大学

    Abstract: 本发明属于人工智能领域,具体为一种基于高斯分布表示的深度推荐模型。本发明推荐模型分为四层:依次为嵌入表示层、特征交互层、特征抽取层与预测层;在嵌入表示层产生目标用户u和待推荐物品v的高斯分布向量;在特征交互层通过蒙特卡洛采样法为u和v各生成同样数量的样本,每个用户样本向量和每个物品样本向量两两配对并组成一个交互特征立方体E;在特征抽取层通过搭建卷积神经网络和多层感知机网络,从E中提取出u和v的交互特征并进行压缩;在预测层用逻辑斯蒂(Sigmoid)函数计算最终的预测分数。本发明模型具有灵活的用户/物品表示特性,可实现对具有不确定偏好用户的精准推荐。

    中文自然语言转数据库语言的方法及装置

    公开(公告)号:CN113536741B

    公开(公告)日:2022-10-14

    申请号:CN202010303263.5

    申请日:2020-04-17

    Applicant: 复旦大学

    Abstract: 本发明提供一种中文自然语言转数据库语言的方法及装置,用于根据数据库将用户输入的自然语言文本转换为可以对数据库进行查询的查询语句,其特征在于,包括如下步骤:预处理步骤,对自然语言文本进行规范化修正得到规范文本;列填充步骤,基于规范文本以及数据库中各个数据表的表头进行列填充处理从而生成连接符、SELECT列与对应的聚合函数以及WHERE列与对应的WHERE操作符;条件填充步骤,基于规范文本以及WHERE列对规范文本进行抽取并填充与WHERE列相对应的WHERE内容;组装输出步骤,将连接符、SELECT列与对应的聚合函数、WHERE列与对应的WHERE操作符和WHERE内容组装为查询语句并输出。

    一种面向中文领域大规模复杂关系数据集构建框架

    公开(公告)号:CN114519092A

    公开(公告)日:2022-05-20

    申请号:CN202210176287.8

    申请日:2022-02-24

    Applicant: 复旦大学

    Abstract: 本发明公开了一种面向中文领域大规模复杂关系数据集构建框架,具有这样的特征,包括:数据收集模块,从原始语料库中筛选表达知识三元组的文本,构建基于远程监督的数据集合;复杂样本特征工程和种子样本选择模块,从基于远程监督的数据集合中选出符合八类特征的复杂样本,组成高优种子样本集合;复杂样本发现模块,基于高优种子样本集合,预测输入数据属于复杂样本的置信度分数,按照分数从高到低排序,并选择头部的样本构建数据集;众包标注模块,对数据集进行数据标注,得到数据集的所有样本的高质量三元组标签。

    中文通用概念图谱纠错装置

    公开(公告)号:CN113535967B

    公开(公告)日:2022-02-22

    申请号:CN202010303271.X

    申请日:2020-04-17

    Applicant: 复旦大学

    Abstract: 本发明提供一种中文通用概念图谱纠错装置,用于对中文通用的概念图谱中实体与概念之间的isA关系进行纠错,其特征在于,包括:概念图谱获取模块,用于获取概念图谱中所有的isA关系以及对应的实体和概念;不兼容概念对构建模块,依次判断每两个概念是否兼容并基于所有不兼容的两个概念构建多组不兼容概念对,每一组不兼容概念对包含一个作为可疑实体的实体、作为待判定概念的两个概念以及作为待纠错isA关系的两个相应的isA关系;错误isA关系判定模块,依次基于每组不兼容概念对中的可疑实体以及待判定概念判定相应的两个待纠错isA关系中错误的一个;以及概念图谱纠错模块,用于在概念图谱中删除被判定错误的待纠错isA关系从而完成对概念图谱的纠错。

    用于验证表述的真实性的方法、设备、装置和介质

    公开(公告)号:CN114065741A

    公开(公告)日:2022-02-18

    申请号:CN202111356625.8

    申请日:2021-11-16

    Abstract: 根据本公开的实现方式,提供了用于验证表述的真实性的方法、设备、装置和介质。在一种方法中,获取包括表述、证据集和标签的训练数据,表述表示被验证的内容,证据集包括用于支持验证表述的真实性的至少一个证据,以及标签表示基于证据集来验证表述的真实性的结果。基于对表述的语法分析,将表述划分为多个短语。基于训练数据和多个短语来训练短语验证模型,以使得短语验证模型基于证据集来分别确定多个短语的多个短语真实性。基于训练数据和多个短语来训练表述验证模型,以使得表述验证模型基于证据集来确定表述的表述真实性,其中多个短语真实性对表述真实性提供解释。以此方式,以更为精细的粒度处理表述并且为表述真实性提供更多解释。

    中文自然语言转数据库语言的方法及装置

    公开(公告)号:CN113536741A

    公开(公告)日:2021-10-22

    申请号:CN202010303263.5

    申请日:2020-04-17

    Applicant: 复旦大学

    Abstract: 本发明提供一种中文自然语言转数据库语言的方法及装置,用于根据数据库将用户输入的自然语言文本转换为可以对数据库进行查询的查询语句,其特征在于,包括如下步骤:预处理步骤,对自然语言文本进行规范化修正得到规范文本;列填充步骤,基于规范文本以及数据库中各个数据表的表头进行列填充处理从而生成连接符、SELECT列与对应的聚合函数以及WHERE列与对应的WHERE操作符;条件填充步骤,基于规范文本以及WHERE列对规范文本进行抽取并填充与WHERE列相对应的WHERE内容;组装输出步骤,将连接符、SELECT列与对应的聚合函数、WHERE列与对应的WHERE操作符和WHERE内容组装为查询语句并输出。

    一种融合实体信息与热度的知识图谱推荐系统

    公开(公告)号:CN112966091A

    公开(公告)日:2021-06-15

    申请号:CN201911272709.6

    申请日:2019-12-12

    Applicant: 复旦大学

    Abstract: 本发明的目的在于提出能够充分利用知识图谱中语义信息以及图结构信息的推荐系统,该系统的主要特点包括:采用了实体的语义相似度的计算方法;采用了针对实体推荐应用的实体嵌入的计算方法;结合了图谱中的语义信息与图结构信息推荐实体。推荐系统具体包括:实体相似度计算模块,获取知识图谱的文本信息输入后计算获得实体的相似度;图谱嵌入式表示学习模块,以知识图谱中实体间的关系作为输入获得实体的嵌入式表示;以及实体推荐生成模块,基于用户的点击反馈数据,将实体相似度计算模块得到的相似度以及图谱嵌入式表示学习模块得到的嵌入式表示融合成最终相似度分数,从而让推荐应用向用户推荐实体。

Patent Agency Ranking