-
公开(公告)号:CN109448808A
公开(公告)日:2019-03-08
申请号:CN201810992868.2
申请日:2018-08-29
Applicant: 北京大学
IPC: G16H20/10 , G16H70/40 , G06F16/335 , G06K9/62
Abstract: 本发明公开一种基于多视图主题建模技术的异常处方筛选方法,其步骤为:1)将来自医疗系统的数据整理成处方数据,其中每条处方数据中包含诊断特征和用药特征;2)将处方数据输入MV-LDA模型进行训练;其中,MV-LDA模型包括K个主题,每个主题中包含诊断特征视图和用药特征视图;主题k中的诊断特征视图由一个诊断特征集合和在每个诊断特征的所对应的概率值组成,用药特征视图由一个用药特征集合和集合中每个用药特征所对应的概率值组成;3)利用训练好的MV-LDA模型对待识别处方数据进行推断,得到其基于诊断特征的主题分布和基于用药特征的主题分布;然后计算两主题分布的相似度,判断该待识别处方数据是否为异常处方。
-
公开(公告)号:CN108710663A
公开(公告)日:2018-10-26
申请号:CN201810455882.9
申请日:2018-05-14
Applicant: 北京大学
Abstract: 本发明涉及一种基于本体模型的数据匹配方法及系统。该方法包括:1)对数据库和本体模型中的所有待匹配元素对进行相似度计算,得到其相似度;2)利用步骤1)得到的相似度进行相似度传播,以对相似度进行补全;3)利用步骤2)得到的相似度,对所有待匹配元素对进行匹配仲裁,若待匹配元素对的相似度达到阈值,则认为待匹配元素对相互匹配。所述匹配仲裁是循环迭代的过程,利用匹配仲裁后的所有匹配元素对,通过多轮迭代获取优化的相似度匹配结果。本发明能够将多源异构的数据库和本体模型建立映射,将不同的数据库用相同的本体进行表达,为上层服务提供一个统一的视图,使得上层应用可以更方便地管理和使用数据。
-
公开(公告)号:CN119416878A
公开(公告)日:2025-02-11
申请号:CN202411417952.3
申请日:2024-10-11
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 燕溪智能(无锡)技术有限公司
Abstract: 本发明属于计算机自然语言技术领域,公开了一种面向政务领域大语言模型的训练数据筛选法、电子设备和存储介质,面向政务领域大语言模型的训练数据筛选法包括:获取基于政务领域的原始数据集;基于原始数据集训练得到打分模型;调用打分模型对原始数据集进行质量评估,得到质量数据集;根据质量数据集得到种子数据集;根据种子数据集得到训练数据集。本发明基于原始数据集训练打分模型,使得打分模型对大语音模型有更好的适应性,通过打分模型用于评估指令的质量,使得筛选出的训练数据更为精准。
-
公开(公告)号:CN117555985A
公开(公告)日:2024-02-13
申请号:CN202311320229.9
申请日:2023-10-12
Applicant: 北京大学
IPC: G06F16/33 , G06F16/901 , G06F16/36 , G06F16/332 , G06F40/295 , G06N3/042 , G06N3/045
Abstract: 本发明公开了一种融合预训练语言模型的知识图谱检索方法与系统。本方法为:1)从用户输入的自然语言查询语句中识别出关键实体涉及到的概念;然后对识别到的概念在知识图谱的概念模型上进行扩展,将该概念以及所述知识图谱中与该概念相邻的一跳邻居以及关系进行汇总,作为与用户查询相关的概念集合;2)根据概念集合构造提示词;3)将提示词输入大规模预训练语言模型,生成能在知识图谱上直接执行的形式语言查询语句;4)根据形式语言查询语句生成一查询图,用于用户更新形式语言查询语句;5)根据形式语言查询语句构建一查询计划;6)根据查询计划在知识图谱上执行;7)将查询结果呈现给用户。本发明提高了知识图谱检索的灵活性。
-
公开(公告)号:CN113792114A
公开(公告)日:2021-12-14
申请号:CN202110890875.3
申请日:2021-08-04
Abstract: 本发明公开了一种城市领域知识图谱可信评估方法及系统,方法包括:S100、从领域知识可信证据模型获取知识获取阶段、知识推理阶段和知识验证阶段的可信证据;S200、基于获取的可信证据以及领域知识可信属性模型中可信属性特征值的计算方法,计算知识实体和知识模型的可信属性特征值;S300、基于知识实体的可信属性特征值计算知识实体的可信度,或者基于知识模型的可信属性特征值计算知识模型的可信度;S400、对知识实体或知识模型划分可信等级。本发明能够量化知识或知识模型的可信性,保障了城市领域知识模型的质量,满足了不同领域不同用户的知识需求。
-
公开(公告)号:CN108959358A
公开(公告)日:2018-12-07
申请号:CN201810457363.6
申请日:2018-05-14
Applicant: 北京大学
Abstract: 本发明涉及一种基于本体模型的终端用户数据访问方法及系统。该方法包括:1)根据查询元模型和基于所述查询元模型的本体推理规则,对用户要查询的本体模型进行预处理,推理出其中的“向内共享”关系和“向外共享”关系;2)将用户输入转换为本体查询SPARQL语句;3)根据所述本体查询SPARQL语句生成SQL语句,通过对所述本体模型进行SQL查询实现数据的访问和查询。本发明充分利用本体模型的语义元素和推理能力来优化终端用户的查询构造流程,帮助用户脱离数据库的实际存储模式细节,同时对终端用户的分组统计需求提供了完整的支持,填补了现有相关工作的不足,具备更强的系统可用性和表达能力。
-
公开(公告)号:CN101448025A
公开(公告)日:2009-06-03
申请号:CN200810240458.9
申请日:2008-12-19
Applicant: 北京大学
Abstract: 本发明公开了一种度量服务质量的方法。该方法包括构造服务质量模型,所述服务质量模型包括至少两个与该服务质量关联的属性,每个属性对应至少两个度量算法,即该服务质量模型具有多维多尺度性;确定待度量的服务质量;根据构造的服务质量模型,获取所述服务质量的数值。通过本发明可以利用多维多尺度的具有扩展性的QoS模型,更好地描述软件服务的质量信息,更好地度量Web服务。
-
-
-
-
-
-