一种基于稠密检索的代码注释生成方法

    公开(公告)号:CN116974625A

    公开(公告)日:2023-10-31

    申请号:CN202310839398.7

    申请日:2023-07-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于稠密检索和关系建模的代码注释生成方法,该方法使用稠密检索来检索相关的注释作为额外输入,并抽取代码和额外注释输入的关系,从而提高注释生成质量。本方法主要用检索器在检索集中检索输入代码的相关注释,将代码和检索到的注释拼接后输入到鉴别器,得到融合表征向量和得到关系表征向量和关系分类将融合表征向量和关系表征向量输入第二多层解码器,生成代码注释。本发明首次将额外输入与原始输入的关系考虑在内,能够有效避免生成器被误导,进而提高生成效果。

    一种基于词性注意力机制的神经机器翻译方法

    公开(公告)号:CN107590138B

    公开(公告)日:2020-01-31

    申请号:CN201710711118.9

    申请日:2017-08-18

    Applicant: 浙江大学

    Inventor: 付晗 孙建伶

    Abstract: 本发明公开了一种基于词性注意力机制的神经机器翻译方法,首先对源语言进行词性标注,然后对于编码器和解码器的输入,采用词性和词两部分向量级联构成;对于注意力机制,根据词性,在生成每个目标句子中的词时,只根据源句子中与该目标句子中的词具有相同词性的词,以及这些词周围一定数量的词。本发明引入了语义作为先验知识,将词性与词共同作为编码器与解码器的输入,从而增加了额外信息,词典外的词也仍然保留了词性信息。同时创新地提出了基于词性的注意力机制,提出了具有相同词性的词具有更大的对齐的概率的理论,与典型的神经机器翻译模型相比,拥有更好的针对性,对于机器翻译具有重要意义。

    一种基于词性注意力机制的神经机器翻译方法

    公开(公告)号:CN107590138A

    公开(公告)日:2018-01-16

    申请号:CN201710711118.9

    申请日:2017-08-18

    Applicant: 浙江大学

    Inventor: 付晗 孙建伶

    Abstract: 本发明公开了一种基于词性注意力机制的神经机器翻译方法,首先对源语言进行词性标注,然后对于编码器和解码器的输入,采用词性和词两部分向量级联构成;对于注意力机制,根据词性,在生成每个目标句子中的词时,只根据源句子中与该目标句子中的词具有相同词性的词,以及这些词周围一定数量的词。本发明引入了语义作为先验知识,将词性与词共同作为编码器与解码器的输入,从而增加了额外信息,词典外的词也仍然保留了词性信息。同时创新地提出了基于词性的注意力机制,提出了具有相同词性的词具有更大的对齐的概率的理论,与典型的神经机器翻译模型相比,拥有更好的针对性,对于机器翻译具有重要意义。

Patent Agency Ranking