用于自然语言处理的基于解析树的向量化

    公开(公告)号:CN111695325B

    公开(公告)日:2023-03-10

    申请号:CN202010023196.1

    申请日:2020-01-09

    Abstract: 本公开的实施例涉及用于自然语言处理的基于解析树的向量化。与叙述性文本的部分相对应的解析树被构造。解析树包括数据结构,数据结构根据语法将叙述性文本的部分的语义结构表示为一组标签。使用解析树中的标签作为焦点词,生成上下文窗口,上下文窗口包括在离焦点词的规定距离内的一组词,根据解析树的链路数目而确定的距离使一组词内的焦点词和上下文词分离。为焦点词和上下文词生成权重。使用权重,生成第一词的第一向量表示,第一词在叙述性文本的第二部分中。

    用于自然语言处理的基于解析树的向量化

    公开(公告)号:CN111695325A

    公开(公告)日:2020-09-22

    申请号:CN202010023196.1

    申请日:2020-01-09

    Abstract: 本公开的实施例涉及用于自然语言处理的基于解析树的向量化。与叙述性文本的部分相对应的解析树被构造。解析树包括数据结构,数据结构根据语法将叙述性文本的部分的语义结构表示为一组标签。使用解析树中的标签作为焦点词,生成上下文窗口,上下文窗口包括在离焦点词的规定距离内的一组词,根据解析树的链路数目而确定的距离使一组词内的焦点词和上下文词分离。为焦点词和上下文词生成权重。使用权重,生成第一词的第一向量表示,第一词在叙述性文本的第二部分中。

    文档的矢量化
    4.
    发明公开

    公开(公告)号:CN110717013A

    公开(公告)日:2020-01-21

    申请号:CN201910387551.0

    申请日:2019-05-10

    Abstract: 本发明的实施例包括用于文档矢量化的方法、系统和计算机程序产品。各方面包括由处理器接收多个文档,每个文档具有多个词语。处理器利用矢量嵌入引擎来生成表示多个文档中的多个词语中的每一个词语的矢量。创建针对多个文档中的每个文档的图像表示,并且生成针对多个文档中的多个词语中的每个词语的词语概率。基于与每个词语相关联的矢量在图像中确定每个词语概率的位置,并且执行对图像的压缩操作以产生针对多个文档的紧凑表示。

    文档的矢量化
    5.
    发明授权

    公开(公告)号:CN110717013B

    公开(公告)日:2023-09-19

    申请号:CN201910387551.0

    申请日:2019-05-10

    Abstract: 本发明的实施例包括用于文档矢量化的方法、系统和计算机程序产品。各方面包括由处理器接收多个文档,每个文档具有多个词语。处理器利用矢量嵌入引擎来生成表示多个文档中的多个词语中的每一个词语的矢量。创建针对多个文档中的每个文档的图像表示,并且生成针对多个文档中的多个词语中的每个词语的词语概率。基于与每个词语相关联的矢量在图像中确定每个词语概率的位置,并且执行对图像的压缩操作以产生针对多个文档的紧凑表示。

Patent Agency Ranking