一种基于稀疏用户行为数据的知识图谱增强的推荐系统

    公开(公告)号:CN112989215B

    公开(公告)日:2022-06-14

    申请号:CN201911279154.8

    申请日:2019-12-13

    Applicant: 复旦大学

    Abstract: 本发明提供一种基于稀疏用户行为数据的知识图谱增强的推荐系统,用于在稀疏用户历史行为记录数据场景下,完成高准确率的用户兴趣挖掘从而生成与用户兴趣相关的用户推荐结果并推荐给用户,其特征在于,包括:用户兴趣挖掘模块,用于对各个用户的用户行为数据进行挖掘从而得到对应用户兴趣的初步推荐结果;以及推荐结果重排模块,用于对初步推荐结果进行重排和调整从而得到更契合用户兴趣的用户推荐结果,其中,用户兴趣挖掘模块包括预处理部、用户画像构建部、语义扩展部、标签池构建部、标签过滤部以及标签采样部,推荐结果重排模块包括访问对象扩展部以及推荐结果调整部。

    面向多模态知识图谱构建的识别视觉概念的方法

    公开(公告)号:CN114510610A

    公开(公告)日:2022-05-17

    申请号:CN202210188998.7

    申请日:2022-02-28

    Applicant: 复旦大学

    Abstract: 本发明提供一种面向多模态知识图谱构建的识别视觉概念的方法,第一次显式地提出在面向多模态知识图谱构建过程中有针对地识别视觉概念这一问题,将该问题建模为一个二分类问题,筛选并设计了解决该分类问题所需的特征数据,从而构建出了一个双流的含BERT模型和图像分类模型的多模态分类模型,用来编码和融合待测概念的文本特征和图像特征,从而达到区分视觉概念和非视觉概念的目的。同时,该多模态分类模型采用了二阶段的PULearning的训练方法,用纯自动化的方式实现了训练数据的初始化,用自训练的思想在迭代中自动化地有效地扩充训练数据集,在扩充的过程中也完全规避了人工的手段且提升了分类网络的准确率。

    文档生成系统
    33.
    发明公开

    公开(公告)号:CN113673210A

    公开(公告)日:2021-11-19

    申请号:CN202010401491.6

    申请日:2020-05-13

    Applicant: 复旦大学

    Abstract: 本发明提供一种文档生成系统,用于根据高相关性的历史文档材料自动生成新的文档,其特征在于,包括:输入数据获取模块,用于获取训练数据以及用户输入的待分析文档材料,该训练数据包括多个高重复性的历史文档材料以及与该历史文档材料的文本内容相关的多种相关材料;论据信息抽取组合模块,用于对待分析文档材料进行论据信息的抽取并组合为相应的论据段,存储有预先根据训练数据训练完成并且用于识别句子的类型的分类器以及用于抽取相应类型的句子的模板规则;论点信息匹配生成模块,用于根据论据段生成相应的论点信息,存储有预先根据训练数据训练完成的论点生成模型;文档生成模块,用于根据论据段以及论点信息生成新的文档材料。

    政府治理领域下融合主题知识的深度关系抽取方法

    公开(公告)号:CN113282758A

    公开(公告)日:2021-08-20

    申请号:CN202010101678.4

    申请日:2020-02-19

    Applicant: 复旦大学

    Abstract: 本发明提供一种政府治理领域下融合主题知识的深度关系抽取方法,用于基于政府领域的主题知识为包含实体对的句子抽取与该实体对相匹配的关系标签,其特征在于,包括如下步骤:步骤S1,构建用于判定句子以及关系标签之间的匹配程度的关系匹配模型;步骤S2,通过预设的主题模型提取与关系标签对应的主题知识;步骤S3,将句子、关系标签以及对应的主题知识分别输入关系匹配模型从而得到句子与关系标签之间的匹配分数;步骤S4,基于匹配分数对句子与对应的关系标签进行匹配从而完成对该句子的关系抽取。

    一种基于稀疏用户行为数据的知识图谱增强的推荐系统

    公开(公告)号:CN112989215A

    公开(公告)日:2021-06-18

    申请号:CN201911279154.8

    申请日:2019-12-13

    Applicant: 复旦大学

    Abstract: 本发明提供一种基于稀疏用户行为数据的知识图谱增强的推荐系统,用于在稀疏用户历史行为记录数据场景下,完成高准确率的用户兴趣挖掘从而生成与用户兴趣相关的用户推荐结果并推荐给用户,其特征在于,包括:用户兴趣挖掘模块,用于对各个用户的用户行为数据进行挖掘从而得到对应用户兴趣的初步推荐结果;以及推荐结果重排模块,用于对初步推荐结果进行重排和调整从而得到更契合用户兴趣的用户推荐结果,其中,用户兴趣挖掘模块包括预处理部、用户画像构建部、语义扩展部、标签池构建部、标签过滤部以及标签采样部,推荐结果重排模块包括访问对象扩展部以及推荐结果调整部。

    一种融合用户微观行为和知识图谱的会话推荐模型

    公开(公告)号:CN112101984A

    公开(公告)日:2020-12-18

    申请号:CN202010822297.5

    申请日:2020-08-16

    Applicant: 复旦大学

    Abstract: 本发明属于人工智能与信息检索技术领域,具体为一种融合用户微观行为和知识图谱的会话推荐模型,简称MKM‑SR。本发明模型首先使用不同的深度学习模型对用户的交互操作序列和交互物品序列分别进行编码,并将操作和物品的嵌入表示向量组合成用户的微观行为表示(向量),再采用注意力机制基于的用户的微观行为表示生成会话的综合表示(向量),从而实现对下一个交互物品的准确预测。此外,本模型还基于TransH知识表示模型调优物品表示,将其与会话推荐任务共同融入多任务学习框架,从而进一步提升会话推荐的效果,并有效缓解用户历史交互数据稀疏带来的问题。

    一种基于事务日志数据的社会网络构建方法

    公开(公告)号:CN104199828B

    公开(公告)日:2017-07-07

    申请号:CN201410358497.4

    申请日:2014-07-26

    Applicant: 复旦大学

    Inventor: 陈创 肖仰华 汪卫

    Abstract: 本发明属于社会网络分析数据挖掘领域,具体为一种基于事务日志数据的社会网络构建方法。本发明通过对现代软件系统如ERP,MIS,CRM等系统产生的事务日志数据进行挖掘,构建出基于真实环境的系统用户之间的社会网络,以供社会网络分析使用。本发明包括数据预处理模块、共现矩阵生成模块、社会网络构建模块。本发明首先将现代软件系统产生的事务日志数据进行预处理,包括清洗数据杂质、确定时间标识、确定空间标识等;然后共现矩阵生成模块根据事务用户使用系统行为特征计算出系统用户的加权共现矩阵。最后,定义一个基于边权重和JACCARD相关性系数的社会关系存在系数,用来判断真实的社会关系,从共现矩阵中构建出可信的社会网络。

    一种基于语义空间映射的知识图谱管理方法和系统

    公开(公告)号:CN104035917B

    公开(公告)日:2017-07-07

    申请号:CN201410253673.8

    申请日:2014-06-10

    Applicant: 复旦大学

    Abstract: 本发明属于文本语义处理、语义网技术领域,具体为一种基于语义空间映射的知识图谱管理方法和系统。本发明方法包括:语义向量构建、语义空间映射、知识图谱管理;知识图谱管理又包括三个分为:语义聚类、语义去重、语义标注。对于知识图谱的边/结点,首先将描述其的文本单元向语义空间投影,并通过向量累积获得其在语义空间上的向量表示;在此基础上,实现知识图谱的多项管理任务;系统包括对应的语义向量构建、语义空间映射、知识图谱管理3个模块。本发明克服了传统知识图谱管理方法在进行语义比较时对词语变形、同义词变化、语法形式变化等因素敏感的缺点,并且向量累积的方式使其能轻松应对词语个数的不同,易于实现进一步的诸如语义聚类、语义去重、语义标注等知识图谱管理任务。

    自动检测屏蔽的通用分布式爬虫系统

    公开(公告)号:CN103491165B

    公开(公告)日:2017-04-12

    申请号:CN201310431787.2

    申请日:2013-09-22

    Applicant: 复旦大学

    Abstract: 本发明属于分布式系统和人工智能技术领域,具体为一种自动检测屏蔽的通用分布式爬虫系统。该系统采用星型网络架构,包括一个核心节点Master和多个从机Slave,核心节点Master控制集群中的从机Slave。本发明中采用全自动检测被屏蔽页面的算法,其通过检测爬虫下载的页面的大小和Token编辑距离的分布的随机性来检测是否出现异常情况,以自动分辨当前获取的页面是否是有效数据。本发明的系统可以自动分辨当前集群中的每台机器是否被屏蔽,以进行更好的任务调度,从而更大程度地利用机器资源和网络资源。

    一种基于语义空间映射的语义关系表征、聚类及识别的方法和系统

    公开(公告)号:CN104008092B

    公开(公告)日:2017-01-18

    申请号:CN201410255166.8

    申请日:2014-06-10

    Applicant: 复旦大学

    Abstract: 本发明属于文本语义处理技术领域,具体为一种基于语义空间映射的语义关系表征、聚类及识别的方法和系统。本发明对于待抽取关系的实体对:首先对包含二者的语句进行语法依存分析;然后将分析结果视作Graph,并计算Graph中对应这两个实体的结点间最短路径,来抽取出实体间关系;继而将路径上的词语向语义空间投影并进行累积,获得该关系在语义空间上的向量表示;对于多组实体对的场景,使用聚类方法对关系进行聚类并构建关系模型;依据表征输入实体对间关系的语义向量与关系模型之间的语义相似度实现关系的识别。本发明克服了传统方法在进行实体间关系比较时对词语变形、同义词变化、语法形式变化等因素敏感的缺点,提高了关系比较准确性和处理的灵活性。

Patent Agency Ranking