基于叙词表的信息检索方法及装置

    公开(公告)号:CN103778262B

    公开(公告)日:2017-07-21

    申请号:CN201410080938.9

    申请日:2014-03-06

    Abstract: 一种基于叙词表的信息检索方法和装置,所述方法包括根据叙词表,对用户输入的检索词进行规范化,获得规范化检索词K;利用规范化检索词K,通过通用搜索引擎对规范化检索词K进行检索,对结果的网址进行分析,提取要素信息;利用相似度计算的方法求出叙词表中K的相关词的相似度,将相似度大于阈值的相关词加入查询扩展集合N;将与K的相似度作为对应相关词的权值,利用相关词对每个网页中的要素信息进行加权求和计算,得到网页的权值,将网页按照权值由从大到小排序。本发明利用叙词表的词间关系,提出语义相似度计算方法,实现对叙词表词间关系的量化分析,并将计算相似度的叙词用于检索后结果的加权排序。本发明信息检索方法和装置显著提高了查询效果。

    一种文件信息的提取方法
    13.
    发明授权

    公开(公告)号:CN103500216B

    公开(公告)日:2017-02-15

    申请号:CN201310462931.9

    申请日:2013-09-30

    Abstract: 本发明提供一种文件信息的提取方法,包括:依次以段落方式获取文件信息;查找所述段落内是否包括至少一个标识字符;如果查找到所述标识字符,则将所述段落作为信息块的起始段。通过对文件信息的所述至少一个标识符进行识别,能够快速而准确从文件信息中切割出需要的信息块。因为不需要对文件内容中的公式、表格和/或图片等信息进行识别,所以该方法还适用于包含公式等信息的文件,扩大了该方法的适用范围。本方法结合支持向量机和浅层句法分析,在进行初步识别之后,还可对错误结果进行修正,提高了识别的正确率。

    多通道均匀进气溶胶实验检测系统

    公开(公告)号:CN105388255A

    公开(公告)日:2016-03-09

    申请号:CN201510747073.1

    申请日:2015-11-05

    CPC classification number: Y02A50/25 G01N33/0004 G01N33/0009

    Abstract: 本发明公开了一种多通道均匀进气溶胶实验检测系统,包括进气部分,用于产生均匀的且具有特定粒径的气溶胶,并通过通风管道输送到实验气室部分;实验气室部分包括:多个实验气室,以及分别设置在每一实验气室前端和后端的检测室,通过检测室来检测进入实验气室前后的气溶胶浓度;所述多个实验气室中至少有一个空白实验气室,用于测量空白背景值,剩余的实验气室中均放置不同的实验材料,用于测量实验前后对应的材料实验值;根据每一实验气室测量的材料实验值、空白背景值及对应实验材料的面积计算所述对应实验材料的气溶胶吸附能力。本发明公开的系统,可以准确测量气溶胶在不同物质上的滞留吸附特性,对大气环境污染治理有重要的实践意义。

    一种文件信息的提取方法
    15.
    发明公开

    公开(公告)号:CN103500216A

    公开(公告)日:2014-01-08

    申请号:CN201310462931.9

    申请日:2013-09-30

    CPC classification number: G06F17/274

    Abstract: 本发明提供一种文件信息的提取方法,包括:依次以段落方式获取文件信息;查找所述段落内是否包括至少一个标识字符;如果查找到所述标识字符,则将所述段落作为信息块的起始段。通过对文件信息的所述至少一个标识符进行识别,能够快速而准确从文件信息中切割出需要的信息块。因为不需要对文件内容中的公式、表格和/或图片等信息进行识别,所以该方法还适用于包含公式等信息的文件,扩大了该方法的适用范围。本方法结合支持向量机和浅层句法分析,在进行初步识别之后,还可对错误结果进行修正,提高了识别的正确率。

Patent Agency Ranking