基于图像和文本语义相似度的图像语义消歧方法和装置

    公开(公告)号:CN108647705B

    公开(公告)日:2019-04-05

    申请号:CN201810368937.2

    申请日:2018-04-23

    Abstract: 本发明提供了一种基于图像和文本语义相似度的图像语义消歧方法和装置。该方法包括:将一个多义词的一个意思用一个均值向量表示,使用图像显著性标签对待处理图像进行标注,得到待处理图像的标签,将待处理图像的标签和图像内容转换成向量的形式,得到待处理图像的融合向量;使用余弦相似度分别计算出待处理图像的融合向量与每个均值向量之间的相似度,找出相似度最大的均值向量,将该相似性最高的均值向量对应的意思确定为待处理图像的正确解释。本发明采用图像、文本结合的方法,将图像转换为向量,解决了图像翻译和图像查询歧义的问题,并开创性地实现了有效消除图像歧义性。大大提高了图像查询和解释的准确性,降低了图像解释的错误率。

    一种行人分心行为检测方法

    公开(公告)号:CN108960029A

    公开(公告)日:2018-12-07

    申请号:CN201810247186.9

    申请日:2018-03-23

    CPC classification number: G06K9/00369 G06K9/6256 G06K9/6269

    Abstract: 本发明提供了一种行人分心行为检测方法。该方法包括:采用梯度和纹理特征集成方法对行人图像进行行人检测处理,获取所述行人图像中的行人位置信息;根据所述行人的位置区域采用选择性搜素的方法对所述行人图像进行区域分割和合并处理,检测出行人敏感部位图像,对所述行人敏感部位图像进行特征提取,得到所述行人图像的敏感特征矩阵;利用行人图像数据集中所有行人图像的敏感部位特征矩阵训练Adaboost分类器,将待检测的行人图像输入训练好的Adaboost分类器,所述Adaboost分类器输出所待检测的行人图像的检测结果。本发明的方法可以准确及时地对行人行为进行分析,判断该行人是否为使用手机的危险行人并及时反馈给行人、司机以及交管部门,起到安全警示作用。

    基于图像和文本语义相似度的图像语义消歧方法和装置

    公开(公告)号:CN108647705A

    公开(公告)日:2018-10-12

    申请号:CN201810368937.2

    申请日:2018-04-23

    Abstract: 本发明提供了一种基于图像和文本语义相似度的图像语义消歧方法和装置。该方法包括:将一个多义词的一个意思用一个均值向量表示,使用图像显著性标签对待处理图像进行标注,得到待处理图像的标签,将待处理图像的标签和图像内容转换成向量的形式,得到待处理图像的融合向量;使用余弦相似度分别计算出待处理图像的融合向量与每个均值向量之间的相似度,找出相似度最大的均值向量,将该相似性最高的均值向量对应的意思确定为待处理图像的正确解释。本发明采用图像、文本结合的方法,将图像转换为向量,解决了图像翻译和图像查询歧义的问题,并开创性地实现了有效消除图像歧义性。大大提高了图像查询和解释的准确性,降低了图像解释的错误率。

Patent Agency Ranking