-
公开(公告)号:CN110765254A
公开(公告)日:2020-02-07
申请号:CN201911008817.2
申请日:2019-10-21
Applicant: 北京理工大学
IPC: G06F16/332 , G06F16/35
Abstract: 一种融合多视角答案重排序的多文档问答系统模型,属于计算机自然语言处理领域。具体操作步骤包含:①预处理文档数据并得出文档先验概率;②将问题文档对输入答案预测模型中得到候选答案及内在置信度;③训练分类器对候选答案计算外在置信度;④融合内在置信度、外在置信度以及文档先验概率三个视角对候选答案进行排序。本发明提出的融合多视角答案重排序的多文档问答系统模型与已有技术模型相比较,添加了从多视角进行答案重排序的模块,有效解决了传统管道式模型过度依赖文档检索从而容易产生错误累积的问题。实验表明,本发明提出的方法在文本召回率ROUGE-L和精确率BLEU-4的评测指标上有显著提升。
-
公开(公告)号:CN109460483A
公开(公告)日:2019-03-12
申请号:CN201811123947.6
申请日:2018-09-26
Applicant: 北京理工大学
IPC: G06F16/53 , G06F16/951 , G06K9/62 , G06N3/08
Abstract: 本发明涉及一种基于深度注意力机制的图片新闻封面自动选择方法,属于计算机应用技术领域。本方法通过对训练集中的图片进行特征提取,将输入的图片表示成向量,将其作为深度注意力模型的输入,输出为同一条新闻所有图片的注意力值的加权平均;用该加权平均的值和图片的向量表示作为输入,训练一个分类器,通过开发集调整模型的参数。与现有方法相比,本发明方法在不需要人工干预的情况下,可以为图片新闻自动选择封面,可以为工作人员节省很多时间和精力,也可以为传媒公司节约成本。此外,在训练集、开发集和测试集数据相同的情况下,本发明与基于随机算法的图片新闻封面选择方法和基于SVM的图片新闻封面选择方法相比,准确率评测指标有明显提升。
-
公开(公告)号:CN108664652A
公开(公告)日:2018-10-16
申请号:CN201810476981.5
申请日:2018-05-18
Applicant: 北京理工大学
IPC: G06F17/30
Abstract: 本发明涉及一种复杂网络下基于路径选择的表示学习方法,属于自然语言处理以及知识图谱技术领域。本发明通过在知识图谱上进行规定起始点的随机游走,得到实体间的路径信息,通过训练一个分类器来对高置信度的路径进行筛选。然后利用知识表示的方法将实体,关系和路径用低维向量方式进行表示。通过向量间的运算判断实体之间的关系。本发明提出的方法解决了传统路径推理中路径冗余导致的推理效率低下,是一种可以充分利用路径信息到表示学习中的结合方式。
-
公开(公告)号:CN107168956A
公开(公告)日:2017-09-15
申请号:CN201710385741.X
申请日:2017-05-26
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于管道的中文篇章结构分析方法及系统,属于自然语言处理应用技术领域;本发明根据中文篇章结构的特点,自下而上地处理句内和句间关系,使得预测句间或更高层次篇章关系时可以动态地利用已识别的句内关系,实现对动态特征的建模。本发明针对管道形式中存在的错误传递问题,将传统端到端模型中的显式篇章关系分析中的三个子任务整合为一个任务,转化为一个序列标注问题并加以实现;本发明利用排序学习的思想缓解了隐式篇章关系判别中存在的篇章关系分布不平衡的问题。
-
公开(公告)号:CN104820992B
公开(公告)日:2017-07-18
申请号:CN201510256069.5
申请日:2015-05-19
Applicant: 北京理工大学
IPC: G06T7/32
Abstract: 本发明涉及一种基于超图模型的遥感图像语义相似性度量方法,属于遥感图像处理技术领域;本发明利用超图模型对每个时相遥感图像进行建模,通过利用超图模型中顶点和超边实现遥感图像中每个像素点的语义表征,并结合超图匹配思想实现语义相似性度量,将多时相遥感图像语义相似性计算表示为多个超图模型中相同位置上顶点的相似性与顶点对应超边相似性的加权和。对比现有技术,本发明利用超图模型的高阶邻域表征能力提高复杂场景下多时相遥感图像语义相似性度量的准确性,降低了语义奇异性,以及配准误差、光照变化、季节差异等因素导致的噪声干扰;将多时相遥感图像语义相似性度量问题转化为一种超图模型匹配问题,通过最优化求解实现相似性度量。
-
公开(公告)号:CN104090918B
公开(公告)日:2017-02-22
申请号:CN201410268361.4
申请日:2014-06-16
Applicant: 北京理工大学
IPC: G06F17/30
Abstract: 本发明涉及一种基于信息量的句子相似度计算方法,包括以下步骤:首先,通过两个句子词语间具有最大的信息量的概念确定词语的词义;然后利用语义网的层次结构和语料库统计来计算词语的信息量和多词语间的公共信息量;接下来应用组合数学中容斥原理计算多个词语的总信息量,从而分别得到两个句子各自的信息量,以及两个句子总共的信息量;最后根据Jaccard相似度原理定义并计算出句子的相似度。本发明能逼真的模拟人类对句子相似程度的判断,并且不需要使用语料训练参数或使用经验参数、不依赖语料库的规模、无需词性标注等其他自然语言处理技术;时间性能优秀,对一般长度的句子对,在当前主流多核PC机上获得准实时计算效率。
-
公开(公告)号:CN103744984B
公开(公告)日:2017-01-25
申请号:CN201410018112.X
申请日:2014-01-15
Applicant: 北京理工大学
Abstract: 本发明涉及一种利用语义信息检索文档的方法,属于计算机信息检索技术领域。通过采用基于关键词的用户检索方法,降低了用户使用难度;采用基于距离和稠密度的文档——本体映射方法,提高映射的准确率;采用基于语义的检索方法,利用多本体索引文档的方法,并且采用了一种结合本体的TF-IDF排序方法,提高了查准率;通过本体语义扩充,提高了系统容纳无效关键词能力,提高了查全率。本方法能够显著提高文档检索的准确率,并且没有带来糟糕的用户交互复杂性。
-
公开(公告)号:CN103793474B
公开(公告)日:2017-01-11
申请号:CN201410003685.5
申请日:2014-01-04
Applicant: 北京理工大学
IPC: G06F17/30
Abstract: 本发明属于计算机应用技术领域,涉及应用于知识管理系统的一种自定义知识分类方法。本发明的目的是为了解决知识管理系统中,在缺乏标注文本集合的条件下,实现用户自定义分类管理知识的问题,提出了一种基于词匹配的用户自定义的知识分类方法。本方法绕过了训练文本集合标注的难题,通过用《同义词词林》扩展用户自定义关键词,利用Wu-Manber多模式匹配算法来快速匹配关键词,根据关键词在文档中的命中率来判断分类类别。本方法有适应缺乏标注文本的条件,且速度快的特点。
-
公开(公告)号:CN105844679A
公开(公告)日:2016-08-10
申请号:CN201610210110.X
申请日:2016-04-06
Applicant: 华建宇通科技(北京)有限责任公司 , 北京理工大学
CPC classification number: G06T11/203 , G06T9/00 , G06T11/60
Abstract: 本发明涉及一种复杂盲文点阵图形绘制和内嵌文字输入的方法及装置,属于基于计算机科学的图形处理与分析技术领域,本发明包括多阶贝塞尔曲线绘制、bmp图片到盲文点阵的转换、内嵌盲文字符输入的方法三项内容。对比现有技术,本发明有效的结合画图功能,将所画曲线图形、盲文字符以一种所见即所得的方式呈现给使用者,方便用户判断和观察图形走向;将bmp格式图形以提取特征点的方式呈现给使用者,解决目前盲文图形编辑排版中效率低、正确率低的问题。
-
公开(公告)号:CN103853710B
公开(公告)日:2016-06-08
申请号:CN201310593746.3
申请日:2013-11-21
Applicant: 北京理工大学
IPC: G06F17/28
Abstract: 本发明公开了一种基于双语协同训练的命名实体的识别方法,属于计算机科学中的自然语言处理技术领域。把平行的汉语句子和英语句子这两个数据集看作为一个数据集的两个不同的视图进行双语协同训练。在投射过程中使用一个对数线性模型修正投射标记,在利用模型对未见示例进行预测时引入命名实体双语对齐标注一致率作为标记置信度估计的衡量指标。本方法对比现有技术,降低了命名实体识别的领域依赖性,融合了双语识别的优势,解决了单语识别中的部分识别歧义问题,尤其适合用于大规模语料的双语命名实体同步识别。
-
-
-
-
-
-
-
-
-