-
公开(公告)号:CN117493481A
公开(公告)日:2024-02-02
申请号:CN202311310422.4
申请日:2023-10-11
Applicant: 哈尔滨工业大学 , 无锡睿文科技有限公司
IPC: G06F16/33 , G06F16/332 , G06N3/0455 , G06N3/0499 , G06N3/08
Abstract: 一种基于自注意力机制的后交互专利检索方法及装置,涉及专利信息检索技术领域,方法包括:获取查询文本和待检索专利文本并进行预处理;将经过预处理的所述查询文本和待检索专利文本输入BERT编码器,得到查询向量和待检索专利向量,其中,所述BERT编码器为BERT模型基于专利语料预训练得到;将所述查询向量和待检索专利向量进行拼接,并输入多头自注意力模型,得到各个所述待检索专利文本对应的自注意力结果;将所述自注意力结果拼接后输入多层感知机,得到各个所述待检索专利文本的相似度评分并排序;该方法及装置将多头自注意力机制用于查询和文档的后交互,在专利检索平均准确率以及归一化折损累计增益指标上均有较大提升。