一种Logisim电路图的查重方法及系统

    公开(公告)号:CN113836863B

    公开(公告)日:2024-05-28

    申请号:CN202111157834.X

    申请日:2021-09-30

    Applicant: 安徽大学

    Abstract: 一种Logisim电路图的查重方法及系统,属于数据处理技术领域,解决如何有效地捕捉到Logisim电路图的关键信息,减少拖拽电路图的部分元件或部分最大连通子图对查重的干扰的问题,包括以下步骤:将Logisim电路图视作以元件为节点、以导线为边的无向图,然后将无向图划分为若干最大连通子图,得到最大连通子图集合,从而创建最大连通子图集合数据集;通过计算最大连通子图的相似度,从而计算最大连通子图集合的重复率;根据计算的重复率采用阈值过滤或聚类的方法从Logisim电路图数据集找到重复的Logisim电路图;本发明的技术方案将Logisim电路图表示为最大连通子图集合,有效地捕捉到Logisim电路图的关键信息,减少多种作弊手段对查重的干扰,从而提高查重的效果。

    文档信息抽取方法及系统
    2.
    发明公开

    公开(公告)号:CN117787258A

    公开(公告)日:2024-03-29

    申请号:CN202311177727.2

    申请日:2023-09-12

    Abstract: 本发明公开了一种文档信息抽取方法及系统,用于文档信息抽取,该方法包括:遍历文档的页面,根据关键字匹配目录页和/或正文页;提取目录页中的标题,形成第一标题集合;识别并提取正文页内容中的图表后,将正文页内容根据元数据的位置分布聚类形成行或段;提取正文页内容中的标题,形成第二标题集合,建立第二标题集合中标题与正文页内容的第一映射;将第一标题集合中的标题与第二标题集合中的标题进行匹配,建立第一标题集合中的标题与第二标题集合中的标题的第二映射。本发明提出的技术方案在现有文档信息处理技术的基础上,规避了图表对提取正文内容的干扰,实现了正文内容的自动分段,以及文档正文内容与目录的匹配。

    一种主题约束表示的关键词抽取方法及装置

    公开(公告)号:CN115687576B

    公开(公告)日:2023-04-07

    申请号:CN202211706894.7

    申请日:2022-12-29

    Applicant: 安徽大学

    Abstract: 本发明提出一种主题约束表示的关键词抽取方法,包括,获取目标文本并对目标文本进行预处理,获得字序列;将所述字序列输入到预训练语言模型,获得目标文本中每个字的向量和文本主题向量;计算所述每次字向量与文本主题向量的相似度,得到相似性权重,根据相似性权重获得每个字的主题约束表示向量;将主题约束表示向量输入到序列标注分类器,得到每个字对应各个标签的概率;对目标文本进行滑动窗口采样,获取所有的候选词语,根据每个字对应各个标签的概率对候选词语进行排序,选择排序后的候选词语获得目标关键词。通过本发明提出的主题约束表示的关键词抽取方法,解决了如何从文本中抽取多个关键词问题。

    一种主题约束表示的关键词抽取方法及装置

    公开(公告)号:CN115687576A

    公开(公告)日:2023-02-03

    申请号:CN202211706894.7

    申请日:2022-12-29

    Applicant: 安徽大学

    Abstract: 本发明提出一种主题约束表示的关键词抽取方法,包括,获取目标文本并对目标文本进行预处理,获得字序列;将所述字序列输入到预训练语言模型,获得目标文本中每个字的向量和文本主题向量;计算所述每次字向量与文本主题向量的相似度,得到相似性权重,根据相似性权重获得每个字的主题约束表示向量;将主题约束表示向量输入到序列标注分类器,得到每个字对应各个标签的概率;对目标文本进行滑动窗口采样,获取所有的候选词语,根据每个字对应各个标签的概率对候选词语进行排序,选择排序后的候选词语获得目标关键词。通过本发明提出的主题约束表示的关键词抽取方法,解决了如何从文本中抽取多个关键词问题。

    一种Logisim电路图的查重方法及系统

    公开(公告)号:CN113836863A

    公开(公告)日:2021-12-24

    申请号:CN202111157834.X

    申请日:2021-09-30

    Applicant: 安徽大学

    Abstract: 一种Logisim电路图的查重方法及系统,属于数据处理技术领域,解决如何有效地捕捉到Logisim电路图的关键信息,减少拖拽电路图的部分元件或部分最大连通子图对查重的干扰的问题,包括以下步骤:将Logisim电路图视作以元件为节点、以导线为边的无向图,然后将无向图划分为若干最大连通子图,得到最大连通子图集合,从而创建最大连通子图集合数据集;通过计算最大连通子图的相似度,从而计算最大连通子图集合的重复率;根据计算的重复率采用阈值过滤或聚类的方法从Logisim电路图数据集找到重复的Logisim电路图;本发明的技术方案将Logisim电路图表示为最大连通子图集合,有效地捕捉到Logisim电路图的关键信息,减少多种作弊手段对查重的干扰,从而提高查重的效果。

    PDF文档图表提取方法、装置、电子设备及存储介质

    公开(公告)号:CN117765557A

    公开(公告)日:2024-03-26

    申请号:CN202311175987.6

    申请日:2023-09-12

    Abstract: 本申请公开了一种PDF文档图表提取方法、装置、电子设备及存储介质,属于计算机技术领域,其中,PDF文档图表提取方法包括:获取目标PDF文档;提取目标PDF文档中的题注;根据题注定位图表所在的PDF页面,并确定图表区域;当图表区域为独立页面,根据正则表达式提取图表区域的图表,当图表区域为跨页区域,则对图表进行合并操作,得到完整图表,根据正则表达式提取完整图表。该方法利用了题注对图表进行定位,从而可以准确地确定图表所在区域,进而可以准确提取PDF文档中的图表数据。

    基于科技文档的领域趋势分析方法及系统

    公开(公告)号:CN116204608A

    公开(公告)日:2023-06-02

    申请号:CN202310228033.0

    申请日:2023-03-10

    Applicant: 安徽大学

    Abstract: 本发明涉及数据信息处理技术领域,公开了基于科技文档的领域趋势分析方法,包括:收集论文和专利数据后进行整理,形成科技文档后储存;自定义查询属性值生成科技文档筛选规则;将筛选规则划分为三种类别并按照顺序对所述科技文档进行操作;根据最终得到的所述科技文档的数据分析查询属性在历年的发展趋势。可以通过成熟的爬虫方案获取两种科技文档,并且对文档进行元数据识别和存储,方便后续的属性查询和趋势分析;从多种角度、多种属性进行对科技文档进行分析,最后得出领域趋势分析,能够实现领域趋势分析功能,并且结果展示效果丰富,结果完整。

    一种景区用景区用共享无人机管理平台和服务方法

    公开(公告)号:CN109102433A

    公开(公告)日:2018-12-28

    申请号:CN201810914370.4

    申请日:2018-08-12

    Applicant: 安徽大学

    Abstract: 本发明提供了一种景区用共享无人机管理平台,包括无人机本体、客户端、无人机飞行控制器、机载计算机服务器、后台服务器,所述无人机飞行控制器和机载计算机服务器均安装在无人机本体上,客户端处理模块与服务器4通过WebSocket方式经由互联网双向连接;无人机控制器2与机载计算机3通过PWM电信号双向连接;机载计算机3与服务器4通过WebSocket方式经由互联网双向连接。本发明同时提供了一种景区用共享无人机管理平台的服务方法,包括商家放置贴有固定标志的二维码的无人机、用户通过手机客户端扫码租用无人机等步骤。

Patent Agency Ranking