-
公开(公告)号:CN117874257A
公开(公告)日:2024-04-12
申请号:CN202410062445.6
申请日:2024-01-16
Applicant: 复旦大学
IPC: G06F16/36 , G06F16/332 , G06Q50/04 , G06N3/045 , G06F40/151 , G06F40/216 , G06F40/186
Abstract: 本发明提供了一种对制造业知识图谱价值的评估方法及系统,其中方法包括如下步骤:步骤1,基于下游应用提供的信息,将语料库中的文本进行排序,步骤2,通过知识图谱生成问题集,并由文本进行回答,得到每个句子回答问题集的分数;步骤3,基于步骤1和步骤2的计算结果,得到知识图谱对于下游应用的价值评估得分。本发明提出一种基于语料库的制造业知识图谱价值的评估方法及系统,将价值评价、问题发现和价值提升融入到一个框架中,而且更加符合制造业下游应用的实际需求,具有高度可解释性和可重用性,且做到低成本和高效。
-
公开(公告)号:CN117708318A
公开(公告)日:2024-03-15
申请号:CN202311856147.6
申请日:2023-12-29
Applicant: 复旦大学
IPC: G06F16/34 , G06F16/33 , G06F40/289 , G06N20/00 , G06N3/092
Abstract: 本发明提供了一种具有图像子图数量适应性的模因图配文生成方法及装置,具有这样的特征,包括:步骤S1,根据现有的多个模因图构建中文模因数据集,中文模因数据集包括多个图片和配文;步骤S2,根据中文模因数据集对现有的大语言模型进行训练,得到最终大语言模型和强化学习模型;步骤S3,将指定图像输入现有的多模态大模型,得到指定幽默链和指定图像特征;步骤S4,将指定幽默链和指定图像特征输入最终大语言模型,得到初始配文;步骤S5,将初始配文输入强化学习模型,得到最终配文。总之,本方法能够生成更匹配模因图的幽默配文。
-
公开(公告)号:CN116450800A
公开(公告)日:2023-07-18
申请号:CN202310034610.2
申请日:2023-01-10
Applicant: 深圳今日人才信息科技有限公司 , 复旦大学
IPC: G06F16/335 , G06F16/33 , G06N3/0895 , G06Q10/1053
Abstract: 本发明公开了一种基于大规模预训练语言模型和对比学习的简历推荐方法,本发明通过预训练语言模型,利用自监督学习方式在大量无标注语料上学习文本表示,相对传统的词向量模型可以更好地理解语言,获得更好的文本特征向量。通过充分利用预训练语言模型的这一优势,将简历和岗位描述文本分别使用预训练语言模型进行表示,得到文本特征向量后再进行基于对比学习的微调训练,优化特征向量所在的隐式特征空间内的分布情况,进而增强文本表示,可以在相同或较小的标注数据集大小上取得远胜于传统模型的表示效果与匹配准确度。
-
公开(公告)号:CN116205211A
公开(公告)日:2023-06-02
申请号:CN202211643987.X
申请日:2022-12-20
Applicant: 深圳今日人才信息科技有限公司 , 复旦大学
IPC: G06F40/205 , G06F40/103 , G06F40/30 , G06F40/151 , G06F40/284
Abstract: 本发明公开了一种基于大规模预训练生成模型的文档级简历解析方法,步骤S1:采用文档格式解析模块识别简历文档,提取出简历文档中的文字数据,分析文字数据的逻辑流,并根据逻辑流将文字数据组织成统一的文本格式;步骤S2:采用区块划分模块输入简历文档的统一文本格式文字数据,并通过所述区块划分模型将文字数据划分到对应的信息区块中;步骤S3:采用细粒度信息抽取模块输入简历文档的区块划分结果,输出以键值对形式存储的细粒度抽取信息。本发明实现了处理不同格式的简历文档,实现端到端的基于滑动窗口的生成式大模型简历解析,实现包含长文本的文档级信息抽取,提升了简历解析的鲁棒性和泛化能力。
-
公开(公告)号:CN112966091B
公开(公告)日:2022-10-14
申请号:CN201911272709.6
申请日:2019-12-12
Applicant: 复旦大学
IPC: G06F16/335 , G06F16/36
Abstract: 本发明的目的在于提出能够充分利用知识图谱中语义信息以及图结构信息的推荐系统,该系统的主要特点包括:采用了实体的语义相似度的计算方法;采用了针对实体推荐应用的实体嵌入的计算方法;结合了图谱中的语义信息与图结构信息推荐实体。推荐系统具体包括:实体相似度计算模块,获取知识图谱的文本信息输入后计算获得实体的相似度;图谱嵌入式表示学习模块,以知识图谱中实体间的关系作为输入获得实体的嵌入式表示;以及实体推荐生成模块,基于用户的点击反馈数据,将实体相似度计算模块得到的相似度以及图谱嵌入式表示学习模块得到的嵌入式表示融合成最终相似度分数,从而让推荐应用向用户推荐实体。
-
公开(公告)号:CN114547250A
公开(公告)日:2022-05-27
申请号:CN202210181458.6
申请日:2022-02-25
Applicant: 复旦大学
Abstract: 本发明公开了一种面向运维领域的配置命令知识抽取的框架,包括:知识模板构建模块,根据运维领域配置命令的业务需求,定义配置命令关系集合,并在用户手册中构造包含预定义关系的文本,将其泛化为知识描述模板;实体抽取模块,结合字符串的编辑距离,对配置命令实体进行模糊匹配,以抽取文本中的命令实体;关系分类模块,利用深度学习模型对文本的语义进行建模,通过习得文本中的配置命令关系来泛化规则;基于bootstrap的数据增强模块,利用槽位替换文本中提及的配置命令实体,将泛化后的文本视为高质量知识描述模板,并将高质量知识描述模板添加到模板库,当新产生的高质量知识描述模板少于阈值时,Bootstrap数据扩充和增强迭代收敛。
-
公开(公告)号:CN114091414A
公开(公告)日:2022-02-25
申请号:CN202111400842.2
申请日:2021-11-19
Applicant: 北京有竹居网络技术有限公司 , 复旦大学
IPC: G06F40/166 , G06F40/197 , G06F40/211
Abstract: 根据本公开的实施例,提供了改写叙事性文本的方法、设备、装置和介质。该方法包括确定对叙事性文本中的一个语句的改变。改变前的语句的初始上下文与改变后的语句的目标上下文不同。该方法还包括基于叙事性文本中在语句之后的文本部分与目标上下文的不一致性,对文本部分执行至少一个编辑操作,以生成文本部分的至少一个经编辑版本。该方法进一步包括用至少一个经编辑版本中的经编辑版本替换文本部分,作为经改写的叙事性文本。以此方式,能够在保证上下文连贯性的同时以较少的编辑量改写叙事性文本。
-
公开(公告)号:CN113672737A
公开(公告)日:2021-11-19
申请号:CN202010401139.2
申请日:2020-05-13
Applicant: 复旦大学
IPC: G06F16/36 , G06F40/211 , G06F40/284 , G06F40/186 , G06N3/08
Abstract: 本发明提供一种知识图谱实体概念描述生成系统,用于根据知识图谱中实体所对应的包含属性以及值的信息框生成该实体的概念描述文本,其特征在于,包括:词模板生成模块,存储有一个预训练完成的第一序列到序列模型,该第一序列到序列模型包括信息框编码器以及模板解码器,信息框编码器用于将待处理实体所对应的信息框重建为单词序列并编码为第一隐状态,模板解码器用于根据第一隐状态输出模板序列;概念描述文本生成模块,存储有一个预训练完成的第二序列到序列模型,第二序列到序列模型包括模板编码器以及概念描述解码器,模板编码器用于将模板序列编码为第二隐状态,概念描述解码器用于根据第一隐状态以及第二隐状态输出概念描述文本。
-
公开(公告)号:CN113535967A
公开(公告)日:2021-10-22
申请号:CN202010303271.X
申请日:2020-04-17
Applicant: 复旦大学
Abstract: 本发明提供一种中文通用概念图谱纠错装置,用于对中文通用的概念图谱中实体与概念之间的isA关系进行纠错,其特征在于,包括:概念图谱获取模块,用于获取概念图谱中所有的isA关系以及对应的实体和概念;不兼容概念对构建模块,依次判断每两个概念是否兼容并基于所有不兼容的两个概念构建多组不兼容概念对,每一组不兼容概念对包含一个作为可疑实体的实体、作为待判定概念的两个概念以及作为待纠错isA关系的两个相应的isA关系;错误isA关系判定模块,依次基于每组不兼容概念对中的可疑实体以及待判定概念判定相应的两个待纠错isA关系中错误的一个;以及概念图谱纠错模块,用于在概念图谱中删除被判定错误的待纠错isA关系从而完成对概念图谱的纠错。
-
公开(公告)号:CN110765363A
公开(公告)日:2020-02-07
申请号:CN201910920671.2
申请日:2019-09-27
Applicant: 复旦大学
IPC: G06F16/9536 , G06N3/04 , G06N3/08
Abstract: 本发明属于人工智能领域,具体为一种基于高斯分布表示的深度推荐模型。本发明推荐模型分为四层:依次为嵌入表示层、特征交互层、特征抽取层与预测层;在嵌入表示层产生目标用户u和待推荐物品v的高斯分布向量;在特征交互层通过蒙特卡洛采样法为u和v各生成同样数量的样本,每个用户样本向量和每个物品样本向量两两配对并组成一个交互特征立方体E;在特征抽取层通过搭建卷积神经网络和多层感知机网络,从E中提取出u和v的交互特征并进行压缩;在预测层用逻辑斯蒂(Sigmoid)函数计算最终的预测分数。本发明模型具有灵活的用户/物品表示特性,可实现对具有不确定偏好用户的精准推荐。
-
-
-
-
-
-
-
-
-