-
公开(公告)号:CN119294356A
公开(公告)日:2025-01-10
申请号:CN202411322753.4
申请日:2024-09-23
Applicant: 河南科技大学
IPC: G06F40/126 , G06F40/284 , G06F40/30 , G06F40/16
Abstract: 本发明公开了一种基于词嵌入的词汇稀疏分布式编码方法,涉及计算机科学与自然语言处理领域,包括分位数转换模块、非线性映射模块和二值化处理模块,其特征是:分位数转换模块、非线性映射模块和二值化处理模块之间的连接和交互来实现词向量稀疏分布式编码的方法及其具体结构形式;本发明降低计算复杂性和存储成本,通过将高维度、稠密的连续词向量转换为稀疏的二值向量,本发明在降低计算复杂性和存储成本方面表现出色,使得在计算相似度或进行其他数学运算时所需的资源大大减少,从而提高了处理效率;适应多种机器学习模型,保持词向量的语义信息,减少编码精度损失,适用性广泛,本发明的编码方法能够广泛适用于不同语料库和应用场景。