-
公开(公告)号:CN106202043A
公开(公告)日:2016-12-07
申请号:CN201610532187.9
申请日:2016-07-04
Applicant: 北京理工大学
CPC classification number: G06F17/2765 , G06N3/126
Abstract: 一种基于成词率适应度函数的新词识别免疫遗传方法,属于自然语言信息处理应用领域。本发明首先根据网络新词的特点,提取共同语素,将共同语素和独词作为免疫遗传方法中的示范性抗体,然后利用成词率设计合适的适应度函数,并在适应度函数中加入调节参数,以优化最终实验结果,最后对由免疫遗传方法识别出的候选词用新闻语料进行处理,得到最终的网络新词。对比现有技术,本发明针对网络新词的特点,设计适合网络新词识别的适应度函数,充分考虑网络新词长度,单字和字串所占比例等因素,并将字串的频数信息加入适应度函数的设计中,从而提高了网络新词发现的正确率、召回率和F值。
-
公开(公告)号:CN105931621A
公开(公告)日:2016-09-07
申请号:CN201610244257.0
申请日:2016-04-19
Applicant: 北京理工大学
Abstract: 一种由MIDI到盲文乐谱的翻译方法及系统包括一种由MIDI到盲文乐谱的翻译方法(简称“方法”)和一种由MIDI到盲文乐谱的翻译系统(简称“系统”)。系统的音轨选择模块与MIDI解析模块、五线谱绘制模块以及盲文转换模块相连,MIDI解析模块与五线谱绘制模块相连,五线谱绘制模块与盲文转换模块相连;方法包括1)将MIDI格式数据文件转换成格式化的乐谱数据;2)根据1)乐谱数据绘制五线谱;3)绘制五线谱并生成盲文乐谱。本发明基于MIDI文件获取乐谱数据,根据乐谱同时生成五线谱和盲文乐谱并对照展示;还能够实现根据MIDI数据自动识别调号、识别双附点音符时值、根据强度信息识别弱起小节以及根据速度输出曲风。
-
公开(公告)号:CN103942192B
公开(公告)日:2016-08-17
申请号:CN201310593728.5
申请日:2013-11-21
Applicant: 北京理工大学
Abstract: 本发明公开了一种双语最大名词组块分离?融合的翻译方法,属于计算机科学中的自然语言处理技术领域。在基于树的统计机器翻译模型的中引入了BMNCs分离?融合翻译的思想,把句子翻译转化为句子中所有双语最大名词组块的翻译和句子骨架的翻译。本方法降低了翻译难度和翻译时间,提升了翻译准确率,尤其适合在即时翻译中针对较长句子的翻译。
-
公开(公告)号:CN105488098A
公开(公告)日:2016-04-13
申请号:CN201510711219.7
申请日:2015-10-28
Applicant: 北京理工大学
CPC classification number: G06F17/30864 , G06F17/277
Abstract: 本发明涉及一种基于领域差异性的新词提取的方法,属于自然语言处理应用技术领域。本发明首先通过比较不同领域间字分布的差异性,获得差异字种子,然后通过n-gram方式拓展差异字种子,构建候选词集,接下来根据领域差异大小去除候选词集合中的重复词,最后对候选词集合中每一个词,分别以领域差异值、凝合度,以及成词率作为衡量标准,剔除领域差异较低的候选词得到新词。对比现有技术,本发明通过利用不同语料领域间差异信息,选取种子字,并通过n-gram拓展获得候选词集合;然后再次利用词本身以及领域间差异信息,自动地选择候选词中的新词,从而明显提高了新词发现的数目和准确度。
-
公开(公告)号:CN105426355A
公开(公告)日:2016-03-23
申请号:CN201510711234.1
申请日:2015-10-28
Applicant: 北京理工大学
IPC: G06F17/27
CPC classification number: G06F17/2765
Abstract: 本发明涉及一种音节粒度的藏语句法组块识别方法及装置,属于计算机应用技术中的机器翻译技术领域。本发明首先通过对原始藏语语料进行预处理,删除其中非藏语语言文本,然后利用预先训练好的句法标记识别模型M1进行识别得到句法标记类型,接下来对句法标记类型为黏着形式的文本进行还原得到不含黏着形式的标准语料;最后对标准语料采用预先训练好的句法组块识别模型M2直接对功能组块进行组块识别。对比现有技术,本发明能够不经过分词和词性标注直接对功能组块进行识别,减少了预处理所需的时间空间花费同时避免了因分词与词性标注的不准确而造成的对功能组块识别效果降低。
-
公开(公告)号:CN103744984A
公开(公告)日:2014-04-23
申请号:CN201410018112.X
申请日:2014-01-15
Applicant: 北京理工大学
Abstract: 本发明涉及一种利用语义信息检索文档的方法,属于计算机信息检索技术领域。通过采用基于关键词的用户检索方法,降低了用户使用难度;采用基于距离和稠密度的文档——本体映射方法,提高映射的准确率;采用基于语义的检索方法,利用多本体索引文档的方法,并且采用了一种结合本体的TF-IDF排序方法,提高了查准率;通过本体语义扩充,提高了系统容纳无效关键词能力,提高了查全率。本方法能够显著提高文档检索的准确率,并且没有带来糟糕的用户交互复杂性。
-
公开(公告)号:CN103744983A
公开(公告)日:2014-04-23
申请号:CN201410017927.6
申请日:2014-01-15
Applicant: 北京理工大学
IPC: G06F17/30
CPC classification number: G06F17/30011
Abstract: 本发明公开了一种电子文档的元信息提取方法,属于计算机应用技术领域。本方法采用模块化的理念将文档信息提取的过程分为三个部分:文档格式解析模块、文档信息优化模块和文档信息解析模块,然后使用一种统一的文档信息格式将三个模块联系起来。通过这样的设计使得添加一种格式支持以及增加信息提取类型变得简单方便,只需关注自身的实现却可以享受到已有其他模块带来的便利。与此同时不同的提取方法和格式支持可以快速自由地配置,这对于个性化系统定制和升级维护都有很大的帮助。
-
公开(公告)号:CN103744955A
公开(公告)日:2014-04-23
申请号:CN201410004084.6
申请日:2014-01-04
Applicant: 北京理工大学
IPC: G06F17/30
CPC classification number: G06F17/30985 , G06F17/30684
Abstract: 本发明公开了一种基于本体匹配的语义查询方法,属于计算机应用技术领域。本方法先计算本体资源的名称、注释与用户输入字符串的语义相似度,然后分别将本体类、本体个体、本体属性与用户输入字符串的语义相似度按从大到小排序,选出最符合用户查询要求的不超过λ*3个本体资源。本方法能够在语义层面进行检索,捕捉设计人员检索意图,提高系统检索效率。
-
公开(公告)号:CN103744679A
公开(公告)日:2014-04-23
申请号:CN201410018121.9
申请日:2014-01-15
Applicant: 北京理工大学
IPC: G06F9/44
Abstract: 本发明涉及一种基于案例的流程设计方法,属于计算机技术领域。本方法提供一个客户端用于流程设计,和一个服务器用于存储案例及案例检索;设计人员在需要参考案例时,在客户端提交案例查询条件,服务器返回案例列表,设计人员选中某案例后,可以参考该案例自行拖拽控件进行设计,也可以选中案例中的某部分直接引用到当前设计中去。本方法能高效而充分地利用案例,提高流程设计效率和可靠性,改善用户体验。
-
-
-
-
-
-
-
-