一种视觉词汇的上下文描述子生成方法

    公开(公告)号:CN105678349A

    公开(公告)日:2016-06-15

    申请号:CN201610005159.1

    申请日:2016-01-04

    CPC classification number: G06K9/723

    Abstract: 本发明涉及一种视觉词汇的上下文描述子生成方法。本发明包括离线学习、上下文描述子生成和上下文描述子相似性计算。离线学习用于视觉词汇词典的构建和视觉词汇的评价。上下文描述子生成步骤如下:1.局部特征点的提取和特征描述子的量化;2.上下文的选择;3.上下文中局部特征点的特征提取和上下文描述子的生成。上下文描述子相似性计算依据上下文描述子中局部特征点的方位、主方向和视觉词汇一致性来验证两个上下文描述子中的局部特征点是否匹配,并通过匹配的视觉词汇的反文档频率的和来评价两个上下文描述子的相似性。本发明构建的上下文描述子能够适应图像裁剪、旋转、尺度缩放等变换带来的影响,可用于基于视觉词汇的图像检索和分类等应用中。

    基于启发信息的行人流量统计方法

    公开(公告)号:CN102194270A

    公开(公告)日:2011-09-21

    申请号:CN201110147358.3

    申请日:2011-06-02

    Abstract: 本发明涉及一种基于启发信息的行人流量统计方法。本发明首先在输入视频的第一帧图像中的任意位置设定一个虚拟门;然后采用混合高斯背景建模方法分割前景,并对结果后处理,去除噪声;接着,将原图转换到HSV空间,去除前景中的阴影部分;在学习阶段,采用基于梯度方向直方图的方法进行行人检测,并将若干检测结果通过最小二乘法拟合成直线后,作为启发信息确定虚拟门上各点与其所在位置行人模型的前景点象素总数的比值,来为每个点赋予权重;在计数阶段,采用稀疏光流LK算法对门上的点进行运动补偿,确定运动矢量的大小和方向,并通过累加这些具有权重的、经过运动补偿了的前景点以达到行人流量统计的目的。本发明复杂度低、计数精度高。

    一种基于语义匹配和密度聚类的中文隐喻释义方法

    公开(公告)号:CN114021575B

    公开(公告)日:2025-03-04

    申请号:CN202111223636.9

    申请日:2021-10-20

    Abstract: 本发明公开了一种基于语义匹配和密度聚类的中文隐喻释义方法,包括步骤:对于一个隐喻句,我们首先确定源域和目标域;针对目标域和源域构建候选词集合;将候选词集合中的候选词、目标域和源域获取词向量表示,然后分别计算候选词与目标域与源域的语义相似度,并分别计算候选词与目标域和源域互信息,再统计候选词在已有语料库中出现的频率;最后利用候选词的语义相似度、互信息和频率信息获取最终匹配得分,采用DBSCAN聚类方法对候选词进行聚类,并按最终匹配得分进行排序,得到最佳释义词列表。本发明解决了目前专门的中文隐喻释义的数据比较匮乏的问题,能够利用无监督学习方法对中文文本中出现的隐喻进行合理的解释。

    基于政府工作报告的中文隐喻信息知识库构建方法、装置

    公开(公告)号:CN112632963A

    公开(公告)日:2021-04-09

    申请号:CN202011501395.5

    申请日:2020-12-17

    Abstract: 本发明提供了一种基于政府工作报告的中文隐喻信息知识库构建方法,属于自然语言处理技术领域。本发明能够提高利用深度学习模型进行中文隐喻识别分类,其能够提取对应人工标签下每个训练文本中话语的隐喻特征,并对多个隐喻特征进行拼接,将拼接后的隐喻特征输入到分类器中,得到词表中的词语是否属于隐喻的分类结果。同时本发明能根据识别结果进行词性分类,并按照分类结果分别确定其源域和目标域,形成隐喻知识文本,从而实现中文隐喻知识库的自动构建。本发明针对政府工作报告的隐喻特点,通过预先对文本数据进行合并和人工标签分类,能够大大降低模型噪声,提高政府工作报告中中文隐喻识别准确度以及识别效率。

    一种生涯规划知识图谱构建及查询方法和系统

    公开(公告)号:CN112417165A

    公开(公告)日:2021-02-26

    申请号:CN202011299588.7

    申请日:2020-11-18

    Abstract: 本发明提供一种生涯规划知识图谱的构建及查询方法和系统。该方法包括:从招聘网站中获取招聘信息,收集本科以及专科的专业分类以及名称,收集网络资料中职业对应专业的相关资料,以及收集各高校毕业生的就业去向;将获得的数据进行去噪、分类以及存储等操作;知识图谱构建模块,通过命名实体识别等操作进行生涯规划知识图谱的构建;将用户在终端选择的职业或筛选条件利用生涯规划知识图谱将结果展示出来。本发明利用生涯规划知识图谱分析得到职业与相关专业的对应关系,为用户选择专业提供了参考,为用户提供了便捷。使用了相关的自然语言处理技术,提高了数据获取及数据预处理的效率;从招聘网站获取相应的数据,保证了数据的实时性以及可靠性。

    基于内容的复制图像检测方法

    公开(公告)号:CN101887457A

    公开(公告)日:2010-11-17

    申请号:CN201010218350.7

    申请日:2010-07-02

    Abstract: 本发明涉及一种基于内容的复制图像检测方法。现有的方法处理速度慢、无法处理大规模的图像库。本发明方法步骤首先将输入图像进行预处理操作;其次对预处理后的图像计算图像中每个像素的哈希值,根据获得的像素哈希值计算图像的相似哈希值;然后根据获得的图像相似哈希值检索图像数据表,确定图像数据表中有无复制图像;最后更新图像数据表,将输入图像的相似哈希值添加到图像数据表,等待下一个输入图像。本发明方法处理速度快,能够适应图像变换带来的影响。

Patent Agency Ranking