一种面向多种检索场景的专利检索方法、装置、设备

    公开(公告)号:CN116303989A

    公开(公告)日:2023-06-23

    申请号:CN202310212099.0

    申请日:2023-02-28

    Abstract: 本说明书公开了一种面向多种检索场景的专利检索方法、装置、设备。以专利文档各字段作为训练数据,对通用语言模型进行训练得到专利领域语言模型。针对多种检索场景,通过基于不同权重多路召回与随机采样的方式筛选各专利文档正、负样本,并以此构建各检索场景的专利语义表示模型的训练数据,对专利领域语言模型进行训练,进而得到各检索场景的专利语义表示模型并以此生成专利各字段的语义向量,并存储在各检索场景的专利检索向量数据库中,根据检索字段的语义向量,从目标检索场景的专利检索向量数据库中,查找与检索字段相似的专利文档。通过上述方案,提升了专利语义表示模型针对不同检索场景的专利字段的语义表示能力,提升检索精度。

    一种基于知识图谱的问答对生成方法

    公开(公告)号:CN116822530A

    公开(公告)日:2023-09-29

    申请号:CN202310034743.X

    申请日:2023-01-10

    Inventor: 徐小良 张吉锋

    Abstract: 本发明公开了一种基于知识图谱的问答对生成方法。本发明包含以下内容:首先抽取领域知识图谱中实体、关系、属性词,利用知识图谱标注策略,得到实体、关系、属性词对应的同义词;抽取连通子图,通过基于DPT‑Loss的问句生成模型生成标准问句;将匹配到的同义词通过槽位填充替换到标准问句中,得到相似问句,最后与原答案组成问答对集合。本发明根据给定领域知识图谱生成领域问答对,使用知识图谱标注策略扩展问答对多样性,增强了知识图谱在问句理解中的领域性和专业性,提高了模板匹配的准确度,同时解决了在神经网络训练时领域问答对语料不足的问题。

    一种面向权利要求点的检索方法和装置

    公开(公告)号:CN115238083A

    公开(公告)日:2022-10-25

    申请号:CN202210702865.7

    申请日:2022-06-21

    Inventor: 朱亚光 徐小良

    Abstract: 本发明属于人工智能领域,公开了一种面向权利要求点的检索方法和装置,包括如下步骤:步骤1:专利权利要求点语义化模型生成:流水线生成模型包括专利数据采集、数据预处理、迭代训练、模型生成、模型部署;步骤2:专利权利要求点检索方法;该检索方法包括了前期专利数据生成向量,向量插入向量数据库,构建索引和检索;步骤3:利用专利权利要求点的检索系统,调用后端检索接口得到Top K检索结果,显示到界面上。本发明针对权利要求点的向量检索,大大缩短了专利检索时间,能够以较短的时间提供给用户高质量的专利检索结果。

    一种面向专利问答服务的意图识别方法及对话系统

    公开(公告)号:CN116795948A

    公开(公告)日:2023-09-22

    申请号:CN202310222860.9

    申请日:2023-03-02

    Abstract: 本发明公开了一种面向专利问答服务的意图识别方法及对话系统,该方法包括:根据专利相关法律法规数据半自动化抽取专利问答对,构造专利问答知识库;根据专利数据库训练获得专利服务语义模型,通过该模型将专利问答数据库内数据向量化构造近邻图,并训练重排模型;对于查询文本,通过字词级召回和语义级召回获得近似问句,合并问句并计算相似度,并根据重排模型重新排序,以获取最终的意图。本发明能够利用专利审查指南、专利法实施细则等专利领域相关法律法规半自动化构建专利问答知识库,同时使用字词特征与语义特征融合的问句意图识别方法,更好地进行问句意图识别,并据此给出更合适的回答,从而更好地服务专利从业人员与专利申请人。

Patent Agency Ranking