-
公开(公告)号:CN118627506A
公开(公告)日:2024-09-10
申请号:CN202411110723.7
申请日:2024-08-14
Applicant: 北京北大软件工程股份有限公司
IPC: G06F40/284 , G06F18/22 , G06N3/0499 , G06N3/0464
Abstract: 本申请公开了一种答案文段提取方法、装置、设备、介质及产品,涉及自然语言处理技术领域,该方法包括:接收用户问题和对应答案所在的文档;分别获取用户问题中词元的词向量、文档中词元的词向量和全局词元的词向量;获取文档中词元的词向量对应的所有候选答案文段的表示向量;获取用户问题中词元的词向量对应的问题表示向量和全局词元的词向量对应的全局阈值表示向量;获取各个候选答案文段的表示向量与问题表示向量之间的第一相似度,以及全局阈值表示向量与问题表示向量之间的第二相似度;获取第一相似度中大于第二相似度的目标相似度;输出目标相似度对应的目标候选答案文段。本申请可以处理文档中的答案文段是由多个文段组成的任务。
-
公开(公告)号:CN117421609A
公开(公告)日:2024-01-19
申请号:CN202311722719.1
申请日:2023-12-15
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明公开了一种应用于社交媒体的图像与文本语义相似度计算方法及系统,涉及语义相似度计算技术领域,该方法包括:通过图像场景图生成模型和文本场景图生成模型分别将图像和文本转化为图像场景图和文本场景图;根据图像场景图和文本场景图中物体‑关系‑物体三元组分别构建图像高层语义子图和文本高层语义子图;基于图像场景图和文本场景图中的物体节点和关系节点,利用向量点积计算局部细节匹配分数;基于高层语义子图和文本高层语义子图计算高层语义匹配分数;基于局部细节匹配分数和高层语义匹配分数计算图像与文本的语义相似度。本发明从底层局部细节到高层语义信息来衡量两个模态语义的相关程度,得到更加准确的图像与文本的语义相似度。
-
公开(公告)号:CN111797221B
公开(公告)日:2023-12-08
申请号:CN202010549298.7
申请日:2020-06-16
Applicant: 北京北大软件工程股份有限公司
IPC: G06F16/335 , G06F16/35 , G06F40/284 , G06F18/2411 , G06N3/04 , G06Q50/18
Abstract: 本发明涉及一种类似案件推荐方法及装置,包括提取目标案例的案例特征并对案例特征进行预处理;预处理后的案例特征转换为非结构化信息和结构化信息,并分别对非结构化信息和结构化信息进行处理,利用处理后的非结构化信息构建第一特征向量,利用处理后的结构化信息构建第二特征向量,联合第一特征向量和第二特征向量获取案例的最终特征向量;将目标案件输入案由预测模型中,获取目标案件的案由,根据案由获取相同案由的同案由案件集合;采用最终特征向量获取同案由案件集合中的最相似案件并输出。本发明将词语通过神经网络向量化再计算相似度的方法比传统的文本相似度算法效果更好。
-
公开(公告)号:CN114897504A
公开(公告)日:2022-08-12
申请号:CN202210546548.0
申请日:2022-05-20
Applicant: 北京北大软件工程股份有限公司
IPC: G06Q10/10 , G06F16/35 , G06F40/279 , G06N3/04 , G06N3/08
Abstract: 本申请实施例提供一种处理重复信件的方法、装置、存储介质和电子设备,该方法包括:获取待处理重复信件;对待处理重复信件进行实体抽取,得到实体抽取结果;将实体抽取结果输入到预先训练好的分类模型中,得到待处理重复信件的分类结果;基于待处理重复信件的分类结果,对待处理重复信件执行相应的处理。借助于上述技术方案,本申请实施例至少能够实现降低人工审核压力,以及还能够提高审核效率的技术效果。
-
-
-