一种基于图神经网络节点特征传播优化的文本分类方法

    公开(公告)号:CN112163069A

    公开(公告)日:2021-01-01

    申请号:CN202011033194.7

    申请日:2020-09-27

    Abstract: 本发明提出一种基于图神经网络节点特征传播优化的文本分类方法,解决了现有文本分类方法不能兼顾分类准确度和分类效率的问题,包括:获取文本数据集,构成以文本节点、单词节点为基础的二元异构图,利用二元异构图形成对应的邻接矩阵A;将邻接矩阵A拆解,构建图神经网络节点特征传播优化模型;对图神经网络节点特征传播优化模型进行训练;利用训练好的图神经网络节点特征传播优化模型对文本数据集进行分类。本发明将文本分类问题转换为节点分类问题,在保持节点分类的准确度下,提高节点特征传播的效率,从而提高文本分类的速度,同时减少文本标注数量,从而减少标注成本。

    一种面向家庭用户的网络电视节目推荐方法及装置

    公开(公告)号:CN111935513A

    公开(公告)日:2020-11-13

    申请号:CN202010676222.0

    申请日:2020-07-14

    Abstract: 本发明公开一种面向家庭用户的网络电视节目推荐方法及装置,通过对各时刻下的家庭用户历史观看节目记录判别出用户角色,重点关注用户的长短期偏好随时间的动态变化,考虑用户的每一次行为内部的有序性和多个行为之间的关联性,能够考虑包含多类用户角色的复杂时序数据形式,将用户角色的嵌入向量输入至用户偏好预测模型,输出用户对所有节目的偏好预测值,利用预测值的大小输出电视节目推荐结果,在考虑节目标签关联性的前提下,提高了推荐的精准性和速度。

    基于图度量学习的行人重识别方法及系统

    公开(公告)号:CN111310720A

    公开(公告)日:2020-06-19

    申请号:CN202010165320.8

    申请日:2020-03-11

    Abstract: 本发明公开了基于图度量学习的行人重识别方法及系统,通过姿态估计深度学习网络提取行人姿态关键点,利用残差神经网络和人体姿态关键点提取局部特征向量,再使用图卷积神经网络融合局部特征和局部结构信息得到图形表示特征向量,从而提取行人图像更细粒度的特征,并在结点层面对比图与图之间的相似度;使用图度量损失函数和分类损失函数,更准确地拉近同个行人图形特征向量之间的距离,拉大不同行人图形特征向量之间的距离,从而提高了网络的特征表示能力和判别能力,进而提高行人重识别的首位命中率(Rank-1)和平均准确率均值(mAP)。

    一种基于非线性增强子空间聚类的图像识别方法

    公开(公告)号:CN111027624A

    公开(公告)日:2020-04-17

    申请号:CN201911259835.8

    申请日:2019-12-10

    Abstract: 本发明公开了一种基于非线性增强子空间聚类的图像识别方法,首先获取图像数据集;利用局部线性嵌入算法求解图像数据集的局部线性表达矩阵,以提取图像数据集的非线性流形结构;构建基于块对角约束及非线性流形结构的非线性增强子空间聚类目标函数;对非线性增强子空间聚类目标函数进行初始化并求解出最优解;基于最优解构建拉普拉斯矩阵,并通过NCut或K-means得到最终图像数据集的聚类结果,完成图像识别。本发明通过预先学习图像的非线性流形结构,即局部线性结构拟合非线性流形从而在提高图像识别效果;同时强制构造块对角作为约束条件,通过迭代求解出的邻接矩阵的块对角结构更加契合子空间聚类的目标效果。

    一种面向金融事件的混合型因果关系发现方法

    公开(公告)号:CN111026852A

    公开(公告)日:2020-04-17

    申请号:CN201911193643.1

    申请日:2019-11-28

    Inventor: 林海涛 蔡瑞初

    Abstract: 本发明公开了一种面向金融事件的混合型因果关系发现方法,首先对文本事件因果关系进行抽取;然后结合文本事件所对应的关键词在百度指数上找出事件对应时间序列的关注指数的变化趋势,即搜索指数曲线,并运用传递熵进行时序事件因果关系的推断;最后用最大似然估计方法融合因果关系抽取结果和基于搜索指数曲线的时序数据进行因果关系推断所得的结果,生成一种因果关系发现。本发明方法可以对金融事件对所蕴含的因果关系进行快速的甄别与发现。

    一种识别刷单的方法
    57.
    发明公开

    公开(公告)号:CN110599195A

    公开(公告)日:2019-12-20

    申请号:CN201910713859.X

    申请日:2019-08-02

    Abstract: 本发明涉及一种识别刷单的方法,包括以下步骤:获取大量用户的大量有效评论文本集合,并训练出各评论文本每个词的词向量;多次随机组合两个评论文本与其是否属于同一用户的标识值构成训练集;搭建并训练卷积神经网络,用于预测两个评论文本是否为同一人所写;一个商家若存在大量不同用户的两个评论文本却被预测为同一人所评论的情况,则预测该商家存在刷单行为。本发明利用了人说话、打字具有一定个性的语言、格式风格习惯的特点,利用该思路进而识别刷单,借助神经网络模型通过细节特征、学习评论文本中所带有的语言习惯,进而识别评论文本是否由同一个人所写,最后再基于该模型通过一定方法识别某个网店是否具有刷单行为。

    基于搜索引擎的语言处理信息检索系统及方法

    公开(公告)号:CN109683725A

    公开(公告)日:2019-04-26

    申请号:CN201811468743.6

    申请日:2018-12-03

    CPC classification number: G06F3/0237

    Abstract: 本发明属于语言处理技术领域,涉及基于搜索引擎的语言处理信息检索系统及方法,包括用户单元、处理单元、检索单元、数据库、学习单元、数据库和反馈单元,其中所述学习单元包括记忆模块和训练模块,所述反馈单元包括第一反馈模块和第二反馈模块。本发明通过设置反馈单,使用户通过反馈单元反馈搜索引擎搜索内容的准确性,使搜索引擎根据用户反馈不断为用户提供所搜结果,直到用户反馈搜索结果准确,使搜索引擎更好的为人们服务;通过设置学习单元,使搜索引擎通过学习单元学习用户的搜索语言,并通过学习单元记录用户反馈的搜索结果的准确性,使搜索引擎能更快更好的帮助人们搜索。

    基于基因大数据的小样本基因表达数据分类方法

    公开(公告)号:CN105825078B

    公开(公告)日:2019-02-26

    申请号:CN201610150049.4

    申请日:2016-03-16

    Abstract: 本发明公开了基于基因大数据的小样本基因表达数据分类方法,其技术步骤为:确定训练样本基因表达数据和类标签,构建矩阵;根据L阶频数统计结果和2阶频数统计结果,计算L+1阶估分,去除估分小于阈值的非频繁集;计算到最大阶数Lmax;计算不同类别差异化的缺失情况;对各阶评分表进行排序,建立决策表;根据决策表对测试样本进行判别并输出类别。本发明基于基因大数据的跨平台分类器训练模型,结合基因表达数据公共储存库中海量的数据与小规模基因表达样本混合训练,有效的提高了分类效果。同时,该方法解决了跨平台所带来的缺失值的影响。

    基于资源信息增益的Hadoop集群瓶颈检测方法

    公开(公告)号:CN105897503B

    公开(公告)日:2019-02-19

    申请号:CN201610192350.1

    申请日:2016-03-30

    Abstract: 本发明公布了基于资源信息增益的Hadoop集群瓶颈检测算法。该算法包括三部分:监测集群中每个节点的响应满意度RS,当RS下降到一定阈值时,则判断该节点出现瓶颈;针对出现瓶颈的节点采集样本,并对样本进行离散化处理;根据样本,计算出各资源的在样本中的信息增益,将信息增益较大的作为瓶颈资源。本发明方法可清楚地了解各个组件运行情况,优化资源利用率,提高Hadoop系统的可扩展性。

Patent Agency Ranking