-
公开(公告)号:CN102693311A
公开(公告)日:2012-09-26
申请号:CN201210168671.X
申请日:2012-05-28
Applicant: 中国人民解放军信息工程大学
CPC classification number: H04L9/3236
Abstract: 本发明涉及一种基于随机化视觉词典组和上下文语义信息的目标检索方法。首先采用精确欧氏位置敏感哈希函数对训练图像库的局部特征点进行聚类,生成一组支持动态扩充的随机化视觉词典组;然后选取查询图像并用矩形框界定目标区域,提取查询图像和图像数据库的SIFT特征并对其进行E2LSH映射,实现特征点与视觉单词的匹配;在语言模型的基础上利用查询目标区域及其周围视觉单元的图像显著度,计算查询图像中各视觉单词的检索得分,构造包含目标上下文语义信息的目标模型;最后将图像库的特征向量存为索引文件,并引入K-L散度对目标的语言模型与图像库中任一图像的语言模型进行相似性度量,得到检索结果。
-
公开(公告)号:CN101876987A
公开(公告)日:2010-11-03
申请号:CN200910227303.6
申请日:2009-12-04
Applicant: 中国人民解放军信息工程大学
IPC: G06F17/30
Abstract: 本发明公开了一种面向类间交叠的两类文本分类方法,该方法首先形成训练样本向量,对类间交叠区域内的训练样本进行识别,判断其是否处于类间交叠区域内;然后,重新划分训练样本向量集合,在新划分的训练样本向量集合上构建第一层分类器;在各类处于类间交叠区域的训练样本集合上,提取相邻两个词性为动词或名词构成的二元词串作为特征,构建第二层分类器;最后对测试样本进行第一层分类,如果满足条件则进入第二层分类器进行识别,最终合并两层分类器结果为最终分类结果;本发明适用于类间交叠程度较高的文本分类、信息过滤和信息监管等领域,能够保证类间交叠程度较高的文本分类准确性。
-
公开(公告)号:CN105629225A
公开(公告)日:2016-06-01
申请号:CN201511018701.9
申请日:2015-12-30
Applicant: 中国人民解放军信息工程大学
IPC: G01S13/66
CPC classification number: G01S13/66
Abstract: 本发明公开了一种基于改进K最短路径的多假设目标跟踪方法,克服了现有技术中,多假设跟踪的算法依赖于大量的假设,计算量和存储量随着跟踪目标和观测帧的增多,呈现爆炸性增长的问题。该发明包括以下步骤:步骤1):给定多个时间点的传感器观测序列步骤2):初始化,构造图中节点node。本发明利用多目标跟踪问题中大部分路径无公共节点的特点,得到了首先求解K条最短路径,然后根据路径间是否存在公共节点进行K最短路径计算,得到了K个目标的最可能观测序列和利用该观测序列所计算出的目标状态,从而具有抗杂波能力强、跟踪精度高,计算速度快的效果。
-
公开(公告)号:CN102722554B
公开(公告)日:2014-07-02
申请号:CN201210170014.9
申请日:2012-05-28
Applicant: 中国人民解放军信息工程大学
IPC: G06F17/30
Abstract: 本发明涉及一种位置敏感哈希随机性减弱方法;具体为:首先对数据点进行随机映射,然后进行相似计算得出L个检索向量,再将L个哈希表对应的L个检索向量构造成矩阵,最后对该矩阵列元素进行频次投票得出最终索引;每个哈希函数对数据点在一个方向上进行映射,通过增加哈希函数的数量来提高发现真实近邻的概率,哈希函数的数量为L个;L个哈希函数对应L个哈希表,使用L个哈希表进行检索需要对检索结果进行融合;采用频繁项投票的方法对检索结果进行融合,选取L个哈希表对应的检索结果出现次数最多的图像;本发明能综合利用多个哈希表的信息并得出与真实近似程度相当的结果,利用多表投票的方法能够达到降低检索结果随机性的目的。
-
公开(公告)号:CN101727486A
公开(公告)日:2010-06-09
申请号:CN200910227300.2
申请日:2009-12-04
Applicant: 中国人民解放军信息工程大学
IPC: G06F17/30
Abstract: 本发明公开了一种Web论坛信息抽取系统,该系统包括如下模块:网页采集模块,用于根据用户指定的论坛站点和相应的版块自动下载论坛网页;网页解析模块,用于对网页内容进行清洗,形成网页的文档对象模型(DOM)以便信息抽取算法的实施;在线抽取模块,用于根据论坛网页的布局结构特点对网页中的指定信息进行抽取;数据库存储模块,用于将所抽取的内容存储在数据库系统中以便进行其它的应用;本发明的能对互联网上多种论坛的指定信息进行自动抽取,且有很高的准确率。
-
公开(公告)号:CN102722554A
公开(公告)日:2012-10-10
申请号:CN201210170014.9
申请日:2012-05-28
Applicant: 中国人民解放军信息工程大学
IPC: G06F17/30
Abstract: 本发明涉及一种位置敏感哈希随机性减弱方法;具体为:首先对数据点进行随机映射,然后进行相似计算得出L个检索向量,再将L个哈希表对应的L个检索向量构造成矩阵,最后对该矩阵列元素进行频次投票得出最终索引;每个哈希函数对数据点在一个方向上进行映射,通过增加哈希函数的数量来提高发现真实近邻的概率,哈希函数的数量为L个;L个哈希函数对应L个哈希表,使用L个哈希表进行检索需要对检索结果进行融合;采用频繁项投票的方法对检索结果进行融合,选取L个哈希表对应的检索结果出现次数最多的图像;本发明能综合利用多个哈希表的信息并得出与真实近似程度相当的结果,利用多表投票的方法能够达到降低检索结果随机性的目的。
-
公开(公告)号:CN101727487A
公开(公告)日:2010-06-09
申请号:CN200910227304.0
申请日:2009-12-04
Applicant: 中国人民解放军信息工程大学
Abstract: 本发明公开了一种面向网络评论的观点主题识别方法和系统,其方法包括步骤:a.文本输入,输入评论源和所有评论文本;b.文本预处理,对输入的文本进行词语切分和词性标注,去除停用词、标点符号和特定虚词,并统计词语的词频信息;c.主题词判决,计算词语权重值,如果词语权重值大于设定的阈值,则该词语判断为观点主题词;d.主题构建,将零散的观点主题词合并成为完整的观点主题;e.主题筛选,通过观点主题过滤确定有效的观点主题;本发明克服观点分析方法和系统的领域限制,不需构建本体库,从整体的角度识别观点主题,有效避开了单句观点分析存在的困难,在面对宽领域和随时间动态改变的网络评论数据实现自动识别短语模式的观点主题。
-
公开(公告)号:CN105629225B
公开(公告)日:2018-05-11
申请号:CN201511018701.9
申请日:2015-12-30
Applicant: 中国人民解放军信息工程大学
IPC: G01S13/66
Abstract: 本发明公开了一种基于改进K最短路径的多假设目标跟踪方法,克服了现有技术中,多假设跟踪的算法依赖于大量的假设,计算量和存储量随着跟踪目标和观测帧的增多,呈现爆炸性增长的问题。该发明包括以下步骤:步骤1):给定多个时间点的传感器观测序列步骤2):初始化,构造图中节点node。本发明利用多目标跟踪问题中大部分路径无公共节点的特点,得到了首先求解K条最短路径,然后根据路径间是否存在公共节点进行K最短路径计算,得到了K个目标的最可能观测序列和利用该观测序列所计算出的目标状态,从而具有抗杂波能力强、跟踪精度高,计算速度快的效果。
-
公开(公告)号:CN102693311B
公开(公告)日:2014-07-23
申请号:CN201210168671.X
申请日:2012-05-28
Applicant: 中国人民解放军信息工程大学
CPC classification number: H04L9/3236
Abstract: 本发明涉及一种基于随机化视觉词典组和上下文语义信息的目标检索方法。首先采用精确欧氏位置敏感哈希函数对训练图像库的局部特征点进行聚类,生成一组支持动态扩充的随机化视觉词典组;然后选取查询图像并用矩形框界定目标区域,提取查询图像和图像数据库的SIFT特征并对其进行E2LSH映射,实现特征点与视觉单词的匹配;在语言模型的基础上利用查询目标区域及其周围视觉单元的图像显著度,计算查询图像中各视觉单词的检索得分,构造包含目标上下文语义信息的目标模型;最后将图像库的特征向量存为索引文件,并引入K-L散度对目标的语言模型与图像库中任一图像的语言模型进行相似性度量,得到检索结果。
-
公开(公告)号:CN101719122A
公开(公告)日:2010-06-02
申请号:CN200910227302.1
申请日:2009-12-04
Applicant: 中国人民解放军信息工程大学
Abstract: 本发明公开了一种从文本数据中提取中文命名实体的方法,该方法包括以下步骤:中文词语切分;中文停用词去除;分析中文分词结果中命名实体错误类型及原因;针对错误类型及原因分别制定修正规则;根据标注标准语料匹配结果,将正确的命名实体输出,对出现错误的命名实体进一步对规则修正,并将修正后的规则输入到规则集,更新规则集;根据标注标准不断进行规则修正,直到输出结果最优,并确定最优规则集;该发明方法提高命名实体提取准确率,并且能保证提取效率;适用于网络信息处理、网络数据挖掘及信息安全等领域,可以为后期的各种处理提供良好的预处理基础。
-
-
-
-
-
-
-
-
-