一种基于WT-GloVe词向量构建的文本表示方法

    公开(公告)号:CN110348497A

    公开(公告)日:2019-10-18

    申请号:CN201910573695.5

    申请日:2019-06-28

    Abstract: 本发明公开了一种基于WT-GloVe词向量构建的文本表示方法,首先通过对网络文本自身特征的词间距计算评估其重要程度,根据特征的类间分布判别自身对类别的贡献度,将二者结合作为词间距和类间分布的特征加权模型,称为WDID-TFIDF;然后根据GloVe模型的自身缺点进行过滤无关词,以提高词向量训练质量;最后根据结果选择对应词间距和类间分布的特征加权值并进行点乘,得到加权词向量模型,即为最终得到的文本表示方法。本发明解决了现有技术中存在的传统的文本表示方法计算复杂或者文本信息表示不够全面的问题。

    基于贝叶斯网络的动态数据流分类方法

    公开(公告)号:CN110334811A

    公开(公告)日:2019-10-15

    申请号:CN201910571906.1

    申请日:2019-06-28

    Abstract: 本发明公开了一种基于贝叶斯网络的动态数据流分类方法,从互联网应用中采集关于用户点击新闻的批量数据,将所有数据分为若干数据块,所有数据块以流的形式呈现并留待之后处理,先在第一个数据块上使用朴素贝叶斯算法建立朴素贝叶斯模型,将数据块放入数据集中并进行分类取得数据块中每条数据的权重并校正、剔除,直到数据流的分类过程完成。本发明解决了现有技术中存在的朴素贝叶斯分类器处理存在概念漂移和数据转移的动态数据流时分类性能大大降低的问题。

    基于拓扑特征的图拓扑结构的相似度计算方法

    公开(公告)号:CN110334758A

    公开(公告)日:2019-10-15

    申请号:CN201910571716.X

    申请日:2019-06-28

    Abstract: 本发明公开了一种基于拓扑特征的图拓扑结构的相似度计算方法,首先定义图Ga和图Gb由不同数量的顶点和边所构成,从图Ga和图Gb中提取图的全局拓扑特征,采用特征向量构建方法构建全局拓扑特征向量,然后使用向量的距离度量方法,得到全局特征向量的距离值;从图Ga和图Gb中提取图的顶点拓扑特征,采用特征值分布的数值特征构建顶点特征向量,然后使用向量的距离度量方法,得到顶点特征向量的距离值;通过距离与相似度转化公式,将全局特征向量的距离值与顶点特征向量的距离值转化为全局和顶点拓扑特征相似度,最终使用加权求和的方法对两种相似度进行加权求和,得到图相似度,本发明解决了现有技术中存在的相似度度量问题计算成本过高的问题。

    一种结合社会生成对抗网络的意图轨迹预测方法

    公开(公告)号:CN111930110A

    公开(公告)日:2020-11-13

    申请号:CN202010482632.1

    申请日:2020-06-01

    Abstract: 本发明公开了一种结合社会生成对抗网络的意图轨迹预测方法,具体按照以下步骤实施:步骤1、预处理车辆轨迹数据;步骤2、基于步骤1预处理后的数据识别驾驶意图并进行数据标记,生成特征向量;步骤3、由社会生成对抗网络构成轨迹输出模块,轨迹输出模块中的编码层将历史轨迹信息编码为上下文向量,解码层结合上下文向量和已识别的驾驶意图信息预测未来轨迹。本发明解决了现有技术中存在的社会生成对抗网络车辆间交互特征简单,没有考虑驾驶员自身行为对车辆轨迹的影响的问题。

    一种基于PCA降维的多分类器融合方法

    公开(公告)号:CN109447099A

    公开(公告)日:2019-03-08

    申请号:CN201810989020.4

    申请日:2018-08-28

    Abstract: 本发明公开了一种基于PCA降维的多分类器融合方法,对数据特征集应用特征选择方法,涉及(逐步向前选择方法和)主成分分析方法,该方法通过构造出少量新特征来替代原始特征进行建模,并在多分类器上应用stacking算法,最终在用户鼠标行为的身份认证实验中取得目前最优的分类效果,本发明解决了现有技术中存在的基于用户鼠标行为的身份认证时针对用户鼠标行为特征空间维数过多的问题。

    一种基于WT-GloVe词向量构建的文本表示方法

    公开(公告)号:CN110348497B

    公开(公告)日:2021-09-10

    申请号:CN201910573695.5

    申请日:2019-06-28

    Abstract: 本发明公开了一种基于WT‑GloVe词向量构建的文本表示方法,首先通过对网络文本自身特征的词间距计算评估其重要程度,根据特征的类间分布判别自身对类别的贡献度,将二者结合作为词间距和类间分布的特征加权模型,称为WDID‑TFIDF;然后根据GloVe模型的自身缺点进行过滤无关词,以提高词向量训练质量;最后根据结果选择对应词间距和类间分布的特征加权值并进行点乘,得到加权词向量模型,即为最终得到的文本表示方法。本发明解决了现有技术中存在的传统的文本表示方法计算复杂或者文本信息表示不够全面的问题。

    一种面向实体检索查询的目标类型标识方法

    公开(公告)号:CN110347701A

    公开(公告)日:2019-10-18

    申请号:CN201910573649.5

    申请日:2019-06-28

    Abstract: 本发明公开了一种面向实体检索查询的目标类型标识方法,首先构造目标实体类型标识任务训练集,采用DBpedia本体作为类型分类树,通过众包的形式收集查询集DBpedia-Entity v1中全部查询的目标类型注释;然后对现有自动标识类型方法的语言模型特征、类型标签特征及类型与查询相似性度量方法特征进行分析,共提取N个用于类型学习排序LTR方法的特征;通过学习排序方法对N个特征组成的训练数据进行监督学习,确定查询测试集,进行目标类型标识,输出类型排序结果,本发明解决了现有技术中存在的类型自动标识准确率低以及标识的类型不具有代表性的问题。

    一种基于深度学习的感性词向量及情感分类方法

    公开(公告)号:CN108038492A

    公开(公告)日:2018-05-15

    申请号:CN201711183892.3

    申请日:2017-11-23

    Abstract: 本发明公开的一种基于深度学习的感性词向量及情感分类方法,首先构建词的上下文模型,其次,向词的上下文模型中加入情感信息,构建出感性词向量,最后,通过主动深度置信网络方法并结合感性词向量进行评论文档的半监督情感的分类,解决了现有的词向量学习算法通常只使用单词的上下文,而忽略了文本的情感信息的问题。

    一种面向实体检索查询的目标类型标识方法

    公开(公告)号:CN110347701B

    公开(公告)日:2021-07-20

    申请号:CN201910573649.5

    申请日:2019-06-28

    Abstract: 本发明公开了一种面向实体检索查询的目标类型标识方法,首先构造目标实体类型标识任务训练集,采用DBpedia本体作为类型分类树,通过众包的形式收集查询集DBpedia‑Entity v1中全部查询的目标类型注释;然后对现有自动标识类型方法的语言模型特征、类型标签特征及类型与查询相似性度量方法特征进行分析,共提取N个用于类型学习排序LTR方法的特征;通过学习排序方法对N个特征组成的训练数据进行监督学习,确定查询测试集,进行目标类型标识,输出类型排序结果,本发明解决了现有技术中存在的类型自动标识准确率低以及标识的类型不具有代表性的问题。

    基于自注意力机制的情感分类方法

    公开(公告)号:CN110347831A

    公开(公告)日:2019-10-18

    申请号:CN201910573709.3

    申请日:2019-06-28

    Abstract: 本发明公开了一种基于自注意力机制的情感分类方法,以双向长短期记忆神经网络模型为基础,结合自注意力机制构建SA-BiLSTM模型,SA-BiLSTM模型共包含五层结构:第一层为输入层,将句子输入到模型中;第二层为词向量构造层,将每个词映射到低维向量;第三层为Bi-LSTM网络层,使用Bi-LSTM从词向量层获取高级特征;第四层为自注意力机制层,生成一个权重向量,通过与这个权重向量相乘,使每一次迭代中的词汇级的特征合并为句子级的特征;第五层为输出层,将句子级的特征向量用于情感分类任务。本发明解决了现有技术中传统情感分类算法大多存在耗时长、训练难、人工成本高的问题。

Patent Agency Ranking