-
公开(公告)号:CN108563433B
公开(公告)日:2021-01-26
申请号:CN201810231329.7
申请日:2018-03-20
Applicant: 北京大学
Abstract: 本发明提供了一种基于LSTM自动补全代码的装置,包括:源代码处理单元,使用抽象语法树解析源代码;线下训练单元,使用LSTM模型训练语言模型;线上代码补全单元,根据训练过的语言模型补全代码。所述LSTM模型包括约束字符级LSTM和使用前上下文标识符编码器的标识符级LSTM。本发明实现了在编程过程中,任意地方输入任意字符都可以实现代码的自动补全,以及任意代码的推荐,并保证推荐过程的准确性。本发明的技术方案具有简单、快速的特点,能够较好地提高代码推荐的准确率和推荐效率。大量的代码可以自动生成或者仅需要少量的标识符提示即可生成,极大的提高了程序员的代码编写效率。
-
公开(公告)号:CN106447285B
公开(公告)日:2020-06-12
申请号:CN201610816684.1
申请日:2016-09-12
Applicant: 北京大学
IPC: G06F16/9535
Abstract: 本发明公布了一种基于多维度领域关键知识的招聘信息匹配方法,通过抽取关键词、简历关键词与职位之间进行直接匹配、简历与职位关键词之间进行相关匹配,实现多维度的简历与职位的精准匹配;包括:抽取职位信息与简历信息中的关键词,用向量表示职位信息与简历信息;直接匹配得到直接匹配所得文本相似度分值;相关匹配得到相关匹配所得文本相似度分值;获得预测差异性的衡量指标;通过加权计算得到最终简历和职位的文本相似度分值,作为信息匹配结果,完成招聘信息匹配。本发明方法能够全面体现关键词之间、关键词组合所表达的信息和知识;有效提高职位与简历的匹配精度,降低招聘中HR的人力成本。
-
公开(公告)号:CN108563433A
公开(公告)日:2018-09-21
申请号:CN201810231329.7
申请日:2018-03-20
Applicant: 北京大学
Abstract: 本发明提供了一种基于LSTM自动补全代码的装置,包括:源代码处理单元,使用抽象语法树解析源代码;线下训练单元,使用LSTM模型训练语言模型;线上代码补全单元,根据训练过的语言模型补全代码。所述LSTM模型包括约束字符级LSTM和使用前上下文标识符编码器的标识符级LSTM。本发明实现了在编程过程中,任意地方输入任意字符都可以实现代码的自动补全,以及任意代码的推荐,并保证推荐过程的准确性。本发明的技术方案具有简单、快速的特点,能够较好地提高代码推荐的准确率和推荐效率。大量的代码可以自动生成或者仅需要少量的标识符提示即可生成,极大的提高了程序员的代码编写效率。
-
公开(公告)号:CN103324692B
公开(公告)日:2016-05-18
申请号:CN201310219725.5
申请日:2013-06-04
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明提供一种分类知识获取方法和装置,通过获取原始种子术语的第一相关文本,从第一相关文本中获取第一关联词汇,对第一关联词汇进行搜索,获取第二相关文本,根据原始种子术语所属领域,对第二相关文本进行筛选,得到第二相关文本中匹配所述领域的第一子集,判断所述第一子集与所述原始种子术语的领域相关度是否达到预设值,相当于判断获取第二相关文本所用的第一关联词汇的领域相关性,基于判断结果获取原始种子术语的分类知识,从而保证了获取的分类知识的领域相关性,因此,解决了获取的分类知识领域偏离的问题,进而提高了获取的分类知识的有效率。
-
公开(公告)号:CN103324789B
公开(公告)日:2016-04-20
申请号:CN201310218408.1
申请日:2013-06-04
Applicant: 北京大学
IPC: G06F17/50
Abstract: 本发明提供一种应用建模工具展现本体的方法和装置,该方法包括:应用建模工具创建第一层本体,并在图形界面上进行展现;第一层本体包括第一层本体类元素和第一层本体关系元素;创建第二层本体,并代替第一层本体在图形界面上进行展现;第二层本体包括第二层本体类元素和第二层本体关系元素,第一层本体类元素为第二层本体类元素的上层概念,第二层本体关系元素为第一层本体关系元素的上层概念。本发明通过多层建模方式创建各层本体,使得用户可以直观查看本体概念的层次结构,且上层概念及概念间的关系对下层概念及概念间的关系产生约束,减少创建本体时产生冲突的可能性。
-
公开(公告)号:CN103324477A
公开(公告)日:2013-09-25
申请号:CN201310219421.9
申请日:2013-06-04
Applicant: 北京大学
IPC: G06F9/44
Abstract: 本发明实施例提供一种基于受力情况的元素排布方法,包括根据图中各元素当前的坐标以及具有连接关系的元素之间的距离,分别获得所述图中各元素当前的受力情况;根据所述图中各元素当前的受力情况,分别获得所述图中各元素当前的速度;根据所述图中各元素当前的速度以及当前的坐标,获得所述图中各元素更新的坐标;在排布关系中元素之间的边存在较多交叉的情况下,由于考虑到了元素之间的相互影响,能够通过元素的受力情况和速度,体现图中各元素的状态是否稳定,从而对较为不稳定的部分或全部元素的位置进行调整,能够有效地减少或避免交叉情况的出现,使得元素排布的结果更清晰和直观,提高元素排布的效果。
-
公开(公告)号:CN115048102B
公开(公告)日:2025-03-14
申请号:CN202210346225.7
申请日:2022-03-31
Applicant: 阿里巴巴(中国)有限公司 , 北京大学
IPC: G06F8/41 , G06N3/0455 , G06N3/084
Abstract: 本申请提供一种代码生成方法、装置、设备和存储介质,该方法包括:获取用于描述目标应用程序中目标代码的功能的第一自然语言描述信息,以及与目标应用程序对应的变量定义表,变量定义表中对应存储有变量名与变量含义的第二自然语言描述信息;根据第一自然语言描述信息与第二自然语言描述信息的匹配度,从变量定义表中确定与第一自然语言描述信息匹配的目标变量名;通过编码网络对第一自然语言描述信息进行编码以得到第一自然语言描述信息对应的语义编码矩阵;将语义编码矩阵和目标变量名对应的词向量输入到解码网络,以通过解码网络得到第一自然语言描述信息对应的目标代码,目标代码中包括目标变量名。用以提升生成代码的语义合法性和准确性。
-
公开(公告)号:CN112861870B
公开(公告)日:2023-10-24
申请号:CN202110144237.7
申请日:2021-02-02
Applicant: 北京大学
Abstract: 本申请提供了一种指针式仪表图像矫正方法、系统及存储介质,通过获取指针式仪表的图像,进行图像预处理,得到仪表的灰度图像;根据仪表的灰度图像,通过自适应边缘检测,获得仪表的边缘边界;根据仪表的边缘边界,通过椭圆检测,获得仪表的椭圆边界;仪表的椭圆边界包括椭圆圆心位置、椭圆长轴长度、椭圆短轴长度以及表盘旋转角度;根据仪表的椭圆边界,通过透视变换,将仪表的椭圆边界对应的仪表椭圆图像投影至正圆区域,得到矫正图像。本申请对指针式仪表图像对圆形仪表的非正视图像进行正圆形矫正,获得标准的正视图像,具有快捷、高效、鲁棒性强等特点,提高了后续仪表示数的识别准确性。
-
公开(公告)号:CN113724884A
公开(公告)日:2021-11-30
申请号:CN202111031558.2
申请日:2016-09-21
Applicant: 北京大学
IPC: G16H50/70 , G06F40/284 , G06F40/247 , G06F40/216
Abstract: 本发明涉及一种基于病例库的疾病症状及其权重知识的获取和处理方法,以互联网上的海量病例库作为信息源,通过对信息源原始数据进行处理,自动获取疾病症状及其权重知识;包括:采取正则表达式进行HTML标签匹配,通过网络爬虫策略获取疾病症状原始数据;进行词语相似度计算和同义词识别获取医学词语相似度表和医学词语同义词表;进行分类、TF‑IDF词频统计、无量纲化处理,获取疾病症状及其权重等多个参数,用于整体评价疾病与症状关系。采用本发明提供的技术方案,能够节省大量人力、财力和时间;得出的疾病症状及其权重结果更加合理;适用于导医系统和基于互联网的疾病自我预诊系统等场景。
-
公开(公告)号:CN109634578B
公开(公告)日:2021-04-02
申请号:CN201811220902.0
申请日:2018-10-19
Applicant: 北京大学
Abstract: 本发明提供了一种基于文本说明的程序生成方法,将所述文本说明输入特征编码器,提取所述文本说明的语义信息;所述特征编码器对所述语义信息进行编码,并将编码后的语义信息输入程序生成器中;将所述文本说明输入注意力层,所述注意力层控制所述文本说明到所述程序生成器的信息流;将所述信息流输入所述程序生成器;所述程序生成器根据所述语义信息和所述信息流,生成源代码片段。本发明的方案提高了程序代码生成的准确率和效率,生成的源代码质量高而且具有稳定性。
-
-
-
-
-
-
-
-
-