提取文字图片及其描述的方法和系统

    公开(公告)号:CN113111869B

    公开(公告)日:2022-12-09

    申请号:CN202110368879.5

    申请日:2021-04-06

    Abstract: 本发明提供了一种提取文字图片及其描述的方法和系统,包括:从文件中抽取图片及其相关描述;判断图片中是否包含子图,若不包含子图则返回图片及其描述并结束;若包含子图则基于YOLO4模型进行目标检测,对子图进行识别切割;基于YOLO4目标检测模型检测子图的图片序号;基于CRNN算法,识别检测到的图片序号;根据图片序号信息对文本描述进行拆分及重新组合;将切割好的图片与其对应的文本描述匹配并返回。本发明可抽取文件中的图片及其描述,若图片中包含子图,则将子图进行切割并与其对应描述对齐,实现了将文件中的图片数据进行整理的目的。

    基于互强化框架和排序学习的学术文献未来影响力动态排序方法及系统

    公开(公告)号:CN111949771A

    公开(公告)日:2020-11-17

    申请号:CN202010864916.7

    申请日:2020-08-25

    Abstract: 本发明提供了一种基于互强化框架和排序学习的学术文献未来影响力动态排序方法及系统,包括:步骤A:基于学术实体和实体间关系抽取论文的元信息;步骤B:引入基于超图延伸定义的同构有向超图和异构二部超图,构造一个异构学术超网;步骤C:基于一种互强化排名框架HSHMRR,在异构学术超网上给不同类型的学术实体实现评分;步骤D:在互强化排名框架的基础上,结合排序学习方法MART,从历史时段中学习潜在的动态特性,并将所学知识应用到目标时段,形成评价结果;本发明采用了一种通用而有效的方法,它能够自适应地学习不同学术文献数据集的潜在动态性质,并将所学知识应用于排名。

    基于会议期刊星系图的超大规模学术网络可视化方法及系统

    公开(公告)号:CN111309917A

    公开(公告)日:2020-06-19

    申请号:CN202010167905.3

    申请日:2020-03-11

    Abstract: 本发明提供了一种基于会议期刊星系图的超大规模学术网络可视化方法及系统,包括:步骤M1:从数据库中获取论文相关数据,并将数据存储在文件中;步骤M2:根据论文的相关数据,对论文按照会议或期刊聚类,并生成包含相应聚类的节点和连边参数的图文件;步骤M3:使用自动化布局工具对相应聚类的节点和连边参数的图文件快速布局,得到聚类内部布局,并生成包含节点位置信息的图文件;步骤M4:根据聚类之间的引用关系,等效聚类之间力的大小,并使用力引导算法生成聚类间星系结构;步骤M5:根据聚类间星系结构对聚类进行融合,得到可视化结果。本发明以图的方式展示大量论文之间的引用关系,使得原本抽象的论文引用关系变得清晰可见。

    提取文字图片及其描述的方法和系统

    公开(公告)号:CN113111869A

    公开(公告)日:2021-07-13

    申请号:CN202110368879.5

    申请日:2021-04-06

    Abstract: 本发明提供了一种提取文字图片及其描述的方法和系统,包括:从文件中抽取图片及其相关描述;判断图片中是否包含子图,若不包含子图则返回图片及其描述并结束;若包含子图则基于YOLO4模型进行目标检测,对子图进行识别切割;基于YOLO4目标检测模型检测子图的图片序号;基于CRNN算法,识别检测到的图片序号;根据图片序号信息对文本描述进行拆分及重新组合;将切割好的图片与其对应的文本描述匹配并返回。本发明可抽取文件中的图片及其描述,若图片中包含子图,则将子图进行切割并与其对应描述对齐,实现了将文件中的图片数据进行整理的目的。

    基于带权时序文本网络的时序社区以及话题的检测方法

    公开(公告)号:CN107515854B

    公开(公告)日:2021-06-04

    申请号:CN201710625669.3

    申请日:2017-07-27

    Abstract: 本发明公开了一种基于带权时序文本网络的时序社区以及话题的检测方法,包括:基于原始数据构建带权时序文本网络;针对带权时序文本网络,构建基于主题模型的生成模型;利用吉布斯采样方法构建生成模型的推断过程;根据模型的推断过程,对带权时序文本网络进行训练,提取出社区信息,主题信息,社区与主题的对应关系,用户在社区内影响力与参与度随时间变化特性;根据提取出的信息,对用户行为进行预测。本发明对时序文本网络中的时间信息和权重信息了进行全新建模,考虑了网络中边的时间信息并对其进行了连续性建模,对带权时序网络进行了全面建模,有利于了解社区在时间尺度上的变化与发展与个人关于社区在时间尺度上的发展。

    基于规则推理和句法图式的图嵌入方法及系统

    公开(公告)号:CN110245238A

    公开(公告)日:2019-09-17

    申请号:CN201910314357.X

    申请日:2019-04-18

    Abstract: 本发明提供一种基于规则推理和句法图式的图嵌入方法及系统,步骤1使用条件随机场算法-双向长短期记忆网络从原始问题中提取实体/值;步骤2基于第一步中的实体/值信息和特定领域知识图的图式,采用传统的规则推理方法检测查询子图的可能结构;步骤3使用第一步的类标签结果来替换原问题中的实体/值;步骤4根据第二步结构检测步骤和第三步链接/属性提取步骤的结果,使用传统的规则推断方法对所有原始问题形成查询子图;步骤5对于不能形成连接查询子图的原始问题,构建句型示意图,使用Node2Vec学习表示句子模式图,利用双向长短期记忆网络的输出来模拟原始问题中隐藏的链接。使得用户可以快速地将自然语言转化为数据库查询语句。

Patent Agency Ranking