一种利用主元分析计算汉语词向量的方法

    公开(公告)号:CN113627176B

    公开(公告)日:2024-04-19

    申请号:CN202110942291.6

    申请日:2021-08-17

    Abstract: 本发明涉及一种利用主元分析计算汉语词向量的方法,属于语言处理领域。本发明选择汉语中有代表性的词语,作为主元分析的基准;将汉字用数值组成的向量表示;用汉语词中的汉字点阵向量组合成词本身的合成向量,词也变换成数值向量形式;计算基准词汇的全部词的平均合成向量;基准词汇中各个词的合成向量减去平均合成向量后,互乘,得到词之间差异的协方差矩阵;得到协方差矩阵的特性;根据协方差矩阵特性,计算一个对词的合成向量进行变换的矩阵;对于任意汉语词的合成向量,减去平均合成向量后,乘以投影矩阵,得到词的词向量。本发明计算简单,可以避免汉语词向量化时常见的“未登录词”问题,在汉语的自然语言处理中具有重要的应用价值。

    一种利用正交变换计算汉语词向量的方法

    公开(公告)号:CN113627175B

    公开(公告)日:2024-05-28

    申请号:CN202110941722.7

    申请日:2021-08-17

    Abstract: 本发明涉及一种利用正交变换计算汉语词向量的方法,属于语言处理领域。本发明将单个汉字用数值矩阵表示;用一个汉语词中的汉字的数值矩阵合成这个汉语词本身的数值矩阵;对单个汉语词的数值矩阵进行正交变换,得到正交变换后的系数矩阵;将汉语词正交变换系数矩阵归一化,使得正交变换系数矩阵的元素平方和等于1.0;在经过归一化的正交变换系数矩阵的左上角子矩阵或整个矩阵的元素按行或按列的顺序排列,得到汉语词的词向量。本发明先将汉语词表示为数值矩阵,再进行正交变换和归一化,最后截取低频系数作为汉语词的词向量,计算简单,可以避免汉语词向量化时常见的“未登录词”问题,在汉语的自然语言处理中具有重要的应用价值。

    一种利用主元分析计算汉语词向量的方法

    公开(公告)号:CN113627176A

    公开(公告)日:2021-11-09

    申请号:CN202110942291.6

    申请日:2021-08-17

    Abstract: 本发明涉及一种利用主元分析计算汉语词向量的方法,属于语言处理领域。本发明选择汉语中有代表性的词语,作为主元分析的基准;将汉字用数值组成的向量表示;用汉语词中的汉字点阵向量组合成词本身的合成向量,词也变换成数值向量形式;计算基准词汇的全部词的平均合成向量;基准词汇中各个词的合成向量减去平均合成向量后,互乘,得到词之间差异的协方差矩阵;得到协方差矩阵的特性;根据协方差矩阵特性,计算一个对词的合成向量进行变换的矩阵;对于任意汉语词的合成向量,减去平均合成向量后,乘以投影矩阵,得到词的词向量。本发明计算简单,可以避免汉语词向量化时常见的“未登录词”问题,在汉语的自然语言处理中具有重要的应用价值。

    一种无线电信号分类神经网络的设计方法

    公开(公告)号:CN118747306A

    公开(公告)日:2024-10-08

    申请号:CN202410886436.9

    申请日:2024-07-03

    Abstract: 本发明涉及一种无线电信号分类神经网络的设计方法,属于无线电信号智能处理领域。本发明根据无线电信号的类别确定输出层节点数目,输出层节点的数目等于无线电类别的数目;根据无线电信号样本的傅里叶变换特征确定隐层节点数目,隐层节点的数目等于无线电信号样本傅里叶变换后的能量集中度的平均值;根据无线电信号样本的维数确定输入层节点数目。本发明的无线电信号分类神经网络的设计方法,利用无线电信号的特性设计神经网络的节点数目,不需要多次试验各种隐层节点的数目,减少了设计时间,并能快速设计出适合边缘计算的无线电信号分类神经网络,在无线电信号分类等复数时间序列数据分类中能发挥重要作用。

    一种声音信号分类神经网络的设计方法

    公开(公告)号:CN118737190A

    公开(公告)日:2024-10-01

    申请号:CN202410849139.7

    申请日:2024-06-27

    Abstract: 本发明涉及一种声音信号分类神经网络的设计方法,属于声音信号智能处理领域。本发明的方法包括:根据声音信号的类别确定输出层节点数目,输出层节点的数目等于声音类别的数目;根据声音信号样本的离散余弦变换特征确定隐层节点数目,隐层节点的数目等于声音信号样本离散余弦变换后的能量集中度的平均值;根据声音信号样本的维数确定输入层节点数目。本发明的声音信号分类神经网络的设计方法,利用声音信号的特性设计神经网络的节点数目,不需要多次试验各种隐层节点的数目,减少了设计时间,并能快速设计出适合边缘计算的声音信号分类神经网络,在声音信号分类等实数时间序列数据分类中能发挥重要作用。

    一种利用正交变换计算汉语词向量的方法

    公开(公告)号:CN113627175A

    公开(公告)日:2021-11-09

    申请号:CN202110941722.7

    申请日:2021-08-17

    Abstract: 本发明涉及一种利用正交变换计算汉语词向量的方法,属于语言处理领域。本发明将单个汉字用数值矩阵表示;用一个汉语词中的汉字的数值矩阵合成这个汉语词本身的数值矩阵;对单个汉语词的数值矩阵进行正交变换,得到正交变换后的系数矩阵;将汉语词正交变换系数矩阵归一化,使得正交变换系数矩阵的元素平方和等于1.0;在经过归一化的正交变换系数矩阵的左上角子矩阵或整个矩阵的元素按行或按列的顺序排列,得到汉语词的词向量。本发明先将汉语词表示为数值矩阵,再进行正交变换和归一化,最后截取低频系数作为汉语词的词向量,计算简单,可以避免汉语词向量化时常见的“未登录词”问题,在汉语的自然语言处理中具有重要的应用价值。

    一种基于深度表征技术和三支决策的句子情感分类方法

    公开(公告)号:CN112364162A

    公开(公告)日:2021-02-12

    申请号:CN202011143024.4

    申请日:2020-10-23

    Abstract: 本发明涉及一种本发明一种基于深度表征技术和三支决策的句子情感分类方法,其中,包括:(1)进行句子预处理,删除句子中的标点符号,对句子进行中文分词;(2)将中文分词后的词语序列输入到深度学习训练模型,生成句子词向量矩阵;(3)将深度学习训练模型中生成的词向量矩阵输入三支决策分类器,从而得到模型预测的情感分类结果。本发明可以依据以往的判断来预测新的情感句子的判断结果,在社交媒体评论的情感分类方面有广泛应用。

Patent Agency Ranking