-
公开(公告)号:CN111666734B
公开(公告)日:2021-08-10
申请号:CN202010334370.4
申请日:2020-04-24
Applicant: 北京大学
IPC: G06F40/117 , G06F40/289 , G06F40/205 , G06N3/04 , G06N3/08
Abstract: 本发明实施例提供一种序列标注方法及装置。其中,方法包括:获取待分析的句子;将待分析的句子输入至序列标注模型,输出句子的分词结果及每个词的标注结果;其中,序列标注模型是基于样本句子及样本句子对应的分词和标注数据进行基于强化学习的训练获得的。本发明实施例提供的序列标注方法及装置,通过强化学习技术隐式地学习文本的分词信息,能缓解中文序列标注中分词与目标的不匹配。
-
公开(公告)号:CN119848825A
公开(公告)日:2025-04-18
申请号:CN202411601713.3
申请日:2024-11-11
Applicant: 北京大学
Abstract: 本发明提供一种基于图大模型的区块链系统高中心性智能合约识别方法,包括:以区块链系统中的各智能合约为节点,以各智能合约间的实时调用关系为边,构建智能合约调用图,确定对应的邻接矩阵;对每一节点的源代码进行解释,得到每一节点的代码解释文本,对每一节点的代码解释文本和原始描述文本进行向量化处理,得到每一节点的代码语义特征向量和原始描述特征向量;将其融合,得到每一节点的第一融合特征向量;将每一节点的第一融合特征向量和邻接矩阵输入至预先构建的图注意力网络,得到图注意力网络输出的每一节点的嵌入向量;基于每一节点的嵌入向量和邻接矩阵,识别高中心性智能合约。本发明提高了高中心性智能合约识别的效率和准确性。
-
公开(公告)号:CN114357144B
公开(公告)日:2022-08-09
申请号:CN202210221233.9
申请日:2022-03-09
Applicant: 北京大学
IPC: G06F16/332 , G06F40/216 , G06K9/62 , G16H50/70 , G06F40/289
Abstract: 本发明提供一种基于小样本的医疗数值抽取和理解方法及装置,该方法包括:基于正则化表达式,对目标医疗文本进行数值抽取;基于prompt函数,获取每一数值对应的问句;将每一数值对应的问句和所述目标医疗文本输入问答模型中,得到每一数值对应的属性信息;其中,每一数值对应的属性信息为每一数值对应的问句的答案;所述问答模型,基于第一数量的其他类的第一样本文本、第一样本问句和第一样本问句对应的真实答案,以及第二数量的医疗类的第二样本文本、第二样本问句和第二样本问句对应的真实答案进行训练获取;所述第一数量大于第二数量。本发明实现在节约医疗类标注数据资源的同时,达到较好的数值抽取和属性信息抽取效果。
-
公开(公告)号:CN114329455B
公开(公告)日:2022-07-29
申请号:CN202210218182.4
申请日:2022-03-08
Applicant: 北京大学
Abstract: 本发明提供一种基于异构图嵌入的用户异常行为检测方法及装置,该基于异构图嵌入的用户异常行为检测方法包括:获取用户的操作日志信息;从所述操作日志信息中获取多个类别节点数据,并基于多个所述类别节点数据,确定用户异构图;基于所述用户异构图,确定嵌入映射信息;基于所述操作日志信息和所述嵌入映射信息,确定用户行为属性。本发明提供的基于异构图嵌入的用户异常行为检测方法及装置,能够根据多个从操作日志信息中得到的类别节点数据构建用户异构图,从用户异构图中确定嵌入映射信息,根据操作日志信息和嵌入映射信息,确定用户行为属性,能够提高用户异常行为检测的准确率和效率,实现对异常行为的及时检测。
-
公开(公告)号:CN114169869A
公开(公告)日:2022-03-11
申请号:CN202210131714.0
申请日:2022-02-14
Applicant: 北京大学
Abstract: 本发明提供一种基于注意力机制的岗位推荐方法及装置,包括:确定目标个体的目标任职序列;将目标任职序列输入至岗位预测模型,获取由岗位预测模型输出的目标个体在每个预设岗位的任职概率;根据所有的任职概率,在所有的预设岗位中确定目标个体的推荐岗位;岗位预测模型是基于注意力机制构建的;岗位预测模型是基于样本任职序列,以及样本任职序列对应的样本预测岗位训练后得到的。本发明提供的基于注意力机制的岗位推荐方法及装置,利用带有注意力机制的岗位预测模型根据目标个体的任职序列,对目标个体下一次在每个预设岗位任职的概率进行预测,使得预测的岗位更加准确,与人员的符合度更高。
-
公开(公告)号:CN111666774A
公开(公告)日:2020-09-15
申请号:CN202010334379.5
申请日:2020-04-24
Applicant: 北京大学
IPC: G06F40/58 , G06F40/30 , G06F40/205
Abstract: 本发明实施例提供一种基于文档上下文的机器翻译方法及装置,方法包括:基于句子级Encoder获取当前句子的源端上下文表征、目标端上下文草稿表征和当前句子的草稿译文表征;基于文档级Encoder获取当前句子的源端句子表征,在源端句子表征中融合源端上下文表征,获取融合后的所述源端句子表征;基于文档级Decoder获取所述当前句子的目标端句子表征,在目标端句子表征中融合当前句子的草稿译文表征和目标端上下文草稿表征,根据融合后的目标端句子表征和融合后的源端句子表征,获取当前句子的最终翻译结果。本发明实施例引入文档级信息进行上下文知识推理,以此对句子级别的草稿译文进行修正,改善了翻译质量,得到更好的译文。
-
公开(公告)号:CN120032724A
公开(公告)日:2025-05-23
申请号:CN202510522095.1
申请日:2025-04-24
Applicant: 北京大学
Abstract: 本发明涉及数据管理与知识图谱领域,提供了一种基于大模型的民政数据血缘知识图谱的构造方法、装置,该方法包括:基于民政数据的元数据特征提取构建基础实体网络;基于基础实体网络,对数据表结构解析,生成数据表结构关系模型;解析复杂结构化查询语言语句,识别字段级血缘关联,生成初步的血缘关系图谱;然后遍历所有物理源表,消除虚拟表冗余和数据节点重复,生成优化后的血缘关系图谱;基于优化后的血缘关系图谱,识别公共数据节点并合并字段级数据血缘,生成最终的民政数据血缘关系图谱。本发明解决了现有技术中难以准确解析复杂SQL语句、处理虚拟表冗余和数据节点重复问题的问题,实现了高精度、自动化的民政数据血缘知识图谱构建。
-
公开(公告)号:CN119645662A
公开(公告)日:2025-03-18
申请号:CN202510154541.8
申请日:2025-02-12
Applicant: 北京大学
Abstract: 本发明提供一种复杂任务智能规划执行方法、装置、电子设备及存储介质,涉及人工智能技术领域,其中方法包括:获取待执行任务;基于提示词,引导大语言模型基于待执行任务的任务信息,在知识图谱中进行检索,并基于检索的关系信息以及实体信息,构建执行路径;基于执行路径执行待执行任务,确定执行结果。通过历史任务执行信息中提取的实体信息以及关系信息,构建知识图谱,并将大语言模型与知识图谱相结合,在大语言模型进行任务规划的过程中,参照知识图谱中检索的实体信息以及关系信息,自动构建待处理任务的执行路径,可以高效地处理各种复杂任务。不仅提高了任务执行的自动化程度,还增强了任务执行结果的准确性和可靠性。
-
公开(公告)号:CN114168819B
公开(公告)日:2022-07-12
申请号:CN202210131722.5
申请日:2022-02-14
Applicant: 北京大学
IPC: G06F16/9035 , G06N3/04 , G06N3/08 , G06Q10/10 , G06F16/901
Abstract: 本发明提供一种基于图神经网络的岗位匹配方法及装置,包括:获取目标履历对应的目标任职序列;将目标任职序列输入至岗位匹配模型,获取由岗位匹配模型输出的目标任职序列与多个预设岗位的匹配程度;根据匹配程度,在多个预设岗位中确定目标履历的匹配岗位;岗位匹配模型是基于图神经网络构建的;岗位匹配模型是基于样本任职序列,以及样本任职序列对应的样本匹配岗位训练后得到的。本发明提供的基于图神经网络的岗位匹配方法及装置,利用基于图神经网络构建的岗位匹配模型根据目标任职序列,对目标履历数据对应的个体在下一次任职与每个预设岗位任职的进行匹配,使得匹配的岗位更加合理,与人员的符合度更高。
-
公开(公告)号:CN114647738A
公开(公告)日:2022-06-21
申请号:CN202210116598.5
申请日:2022-02-07
Applicant: 北京大学 , 青岛国新健康产业科技有限公司
Abstract: 本发明提供一种用于医保数据的异常行为关联分析方法及系统,该方法包括:基于医保场景知识图谱,根据目标就诊路径,确定与目标医保节点之间存在关联的多个待分析医保节点,并获取各个待分析医保节点在医保场景知识图谱中的待分析就诊路径;根据就诊次数信息,分别对目标就诊路径和各个待分析就诊路径中的子路径进行加权处理,并计算加权处理后的目标就诊路径与各个加权处理后的待分析就诊路径之间的相似度值;选取相似度值TOP‑K的待分析医保节点作为目标分析医保节点,根据目标医保节点和目标分析医保节点之间的共现就诊路径,生成对应的医保数据关联分析结果。本发明提高了医保异常病历审核效率和异常行为分析结果准确性。
-
-
-
-
-
-
-
-
-