-
公开(公告)号:CN116842109B
公开(公告)日:2024-09-13
申请号:CN202310766394.0
申请日:2023-06-27
Applicant: 北京大学
IPC: G06F16/28
Abstract: 本申请涉及一种信息检索知识图谱嵌入方法、装置和计算机设备。方法包括:获取信息检索知识图谱,并采集信息检索知识图谱的各子图信息;将各子图信息,转换为每个子图信息对应的文本序列,并对各文本序列进行编码转换处理,得到每个文本序列对应的掩盖实体向量、以及每个文本序列的掩盖关系向量;针对每个文本序列,基于文本序列对应的子图信息的图结构信息,更新文本序列的掩盖实体向量、以及文本序列的掩盖关系向量,并重建上述各向量得到信息检索知识图谱对应的各实体向量、以及信息检索知识图谱对应的各关系向量。采用本方法能够提升生成该信息检索知识图谱的实体向量和关系向量的精准度。
-
公开(公告)号:CN118485141A
公开(公告)日:2024-08-13
申请号:CN202410949277.2
申请日:2024-07-16
Applicant: 北京大学 , 北京六元空间信息科技有限责任公司
IPC: G06N5/02 , G06F40/295 , G06N20/00
Abstract: 本申请公开了一种中文医学大语言模型训练方法及装置,涉及自然语言处理技术领域,所述的方法包括:通过医学文本对预设大语言模型进行预学习训练,使得大语言模型在语义层面上理解专业医学知识。根据开源中文医学考试数据集对预训练后的模型进行监督微调训练,从而降低计算复杂度和内存需求,这使得在保持模型性能的同时,能够在有限的计算资源下进行高效的微调。最后根据构建的知识图谱和强化学习数据集进行知识反馈的强化学习,有助于解决监督微调后由于模型过度拟合而出现的“幻觉”现象,从而将大语言模型的输出与相关的专业医学知识进行充分对齐,提高大语言模型在医学领域回答的准确度。
-
公开(公告)号:CN118467707A
公开(公告)日:2024-08-09
申请号:CN202410919350.1
申请日:2024-07-10
Applicant: 北京大学 , 北京六元空间信息科技有限责任公司
IPC: G06F16/332 , G16H80/00 , G06F18/25 , G06F16/583 , G06N3/0455 , G06N20/00 , G06N5/04
Abstract: 本发明公开了一种医学视觉问答方法、装置、设备及存储介质,该方法包括:获取用户输入的目标图像和用户指令,并判断所述目标图像和所述用户指令是否符合医学视觉问答要求;在所述目标图像符合医学视觉问答要求时,将所述目标图像和所述用户指令输入至目标医学多模态大语言模型生成对应的目标答复,所述目标医学多模态大语言模型包括视觉编码器、文本编码器、基于注意力的图像分块选择器、上下文信息融合器和基于大语言模型的文本解码器;将所述目标答复返回至所述用户。相比于现有技术,由于本发明通过基于注意力的图像分块选择器和上下文信息融合器,提升了模型对图像关键区域的关注度和模型对上下文细节的理解能力,进而提升了答复准确性。
-
公开(公告)号:CN117235665B
公开(公告)日:2024-06-25
申请号:CN202311199403.9
申请日:2023-09-18
Applicant: 北京大学
IPC: G06F18/25 , G06F18/214 , G06F18/213 , G06N3/045 , G06N3/08 , G06F21/62
Abstract: 本申请涉及一种自适应隐私数据合成方法、装置、计算机设备和存储介质。包括:根据原始数据的连续特征与离散特征以及特征融合网络生成原始数据对应的融合向量;将融合向量中的目标序列以及离散特征输入特征分布提取网络,提取对应的特征分布参数;基于对应的特征分布参数计算得到第一损失;对特征分布提取网络全连接层的权重值得到对应的正样本与负样本,并根据其相似性,得到第二损失;基于特征分布参数,通过数据合成网络生成初始合成数据,并基于初始合成数据与原始数据间的差异程度,生成第三损失;将第一损失、第二损失以及第三损失进行融合,得到融合损失;基于融合损失进行网络训练,得到目标合成数据,能够提高合成数据的准确性。
-
公开(公告)号:CN117726879A
公开(公告)日:2024-03-19
申请号:CN202410032387.2
申请日:2024-01-09
Applicant: 北京大学
IPC: G06V10/764 , A61B5/055 , A61B5/00 , G06V10/80 , G06V10/40 , G06V10/74 , G06N3/0895 , G06N3/042 , G06N3/0464 , G06T7/00
Abstract: 本申请涉及一种脑部异常分析模型的训练方法、装置和计算机设备。方法包括:获取不同用户的大脑磁共振图像、以及每个用户的脑部异常标签信息,并将每个用户的脑部功能连接图转化为各用户的每个大脑图谱对应的各脑部视图,再通过对比学习策略,训练得到脑部特征识别器,从而识别各用户的每个大脑图谱对应的各脑部视图的脑部特征,并分别融合得到每个用户对应的脑部特征集合;识别每两个用户的各相似脑部特征,从而训练初始脑部异常分类器,得到脑部异常分类器,并将脑部特征识别器、以及脑部异常分类器,作为脑部异常分析模型。采用本方法能够提升训练的脑部异常分析模型的分析精准度。
-
公开(公告)号:CN117409211A
公开(公告)日:2024-01-16
申请号:CN202311419589.4
申请日:2023-10-30
Applicant: 北京大学
IPC: G06V10/44 , G06V10/74 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及一种质量特征提取方法、装置、计算机设备和存储介质。所述方法包括:将目标图像输入至目标保真特征提取模型中,得到目标图像的目标保真特征,并将目标图像输入至目标结构特征提取模型中,得到目标图像的目标结构特征;将目标保真特征和目标结构特征进行拼接处理,得到目标图像的质量特征;其中,目标保真特征提取模型是基于多个样本失真图像训练得到的,目标结构特征提取模型是基于多个样本失真图像和各样本失真图像对应的相似测度训练得到的。采用本方法能够使得提取到的目标保真特征和目标结构特征更加准确,进一步使得目标图像的质量特征更加准确,从而使得后续基于质量特征对目标图像进行质量评估时更加精准。
-
公开(公告)号:CN116029474A
公开(公告)日:2023-04-28
申请号:CN202310092055.9
申请日:2023-02-10
Applicant: 国网上海能源互联网研究院有限公司 , 国网浙江省电力有限公司宁波供电公司 , 国网浙江省电力有限公司 , 北京大学 , 国家电网有限公司
IPC: G06Q10/047 , G06Q50/06
Abstract: 本发明涉及一种面向模型扩展的配网信息模型搜索展示方法和系统,其中,方法包括:确定目标节点,基于广度优先搜索算法得到初始节点与目标节点之间的最短路径;根据所述最短路径中各相邻节点之间的关系简化所述最短路径,得到初始节点与目标节点之间最简的连接关系,并进行展示。本发明能够实现对配网信息模型中有效信息的提取以及隐含信息的挖掘。
-
公开(公告)号:CN115358235A
公开(公告)日:2022-11-18
申请号:CN202210875752.7
申请日:2022-07-25
Applicant: 北京大学
IPC: G06F40/295 , G06F40/242 , G06F16/33 , G06F16/36 , G06N5/02
Abstract: 本申请涉及一种医学知识图谱的质控方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:将医学数据输入至目标医学命名实体识别模型,得到医学数据对应的识别结果数据集;在识别结果数据集的容量大于预设第一阈值的情况下,对识别结果数据集中相同的识别数据进行汇总,得到目标数据;在目标数据的计数值大于预设第二阈值的情况下,根据目标数据,在医学知识图谱中进行检索,得到目标数据对应的目标检索结果,并确定目标数据与目标检索结果的相似度;根据预设的质控策略、以及相似度,对医学知识图谱进行质控处理。提高医学知识图谱的质控效果。
-
公开(公告)号:CN114996461A
公开(公告)日:2022-09-02
申请号:CN202210839075.3
申请日:2022-07-18
Applicant: 北京大学
Abstract: 本发明提供一种医学不良事件文本分类方法、装置、电子设备及介质,属于深度学习技术领域。所述方法包括:构建文本分类模型,所述文本分类模型包括:深度金字塔卷积神经网络、循环卷积神经网络和分类层,所述分类层用于基于所述深度金字塔卷积神经网络和循环卷积神经网络的特征融合结果进行分类;将医学不良事件文本输入所述文本分类模型,经过所述文本分类模型处理后,获得医学不良事件文本分类结果。本发明构建的文本分类模型融合了深度金字塔卷积神经网络和循环卷积神经网络,可以基于深度金字塔卷积神经网络和循环卷积神经网络的特征融合结果对医学不良事件文本进行有效分类。
-
公开(公告)号:CN101625742A
公开(公告)日:2010-01-13
申请号:CN200910087478.1
申请日:2009-06-25
Applicant: 北京大学
Abstract: 本发明公开了一种分布式RFID发现服务的实现方法,包括:跟踪步骤,是沿物流流向,从每个供应链节点获取部分信息,然后将全部节点信息拼接出完整物流信息链;以及追溯步骤,是逆物流流向,同样从供应链每个节点获取部分信息,然后将全部节点信息拼接出完整的物流信息链,从中定位特定物品所在的位置。
-
-
-
-
-
-
-
-
-