-
公开(公告)号:CN116860992A
公开(公告)日:2023-10-10
申请号:CN202310773133.1
申请日:2023-06-27
Applicant: 北京理工大学
IPC: G06F16/36 , G06F40/295 , G06F40/194 , G06F40/30
Abstract: 本发明公开了一种基于元属性归约和属性嵌入的跨语言实体对齐方法,属于知识融合和人工智能技术领域。包括:首先,分别生成两个不同自然语言的知识图谱中实体的属性嵌入和关系嵌入,构建实体嵌入,计算这两个知识图谱之间的相似度;然后,采用基于多维度信息度量的方法计算这两个知识图谱之间的相似度;最后,融合相似度,输出实体对齐结果。本发明的跨语言实体对齐方法通过构建不同关联强度的属性对进行属性嵌入训练,捕获了属性之间的语义关系,实现实体的属性嵌入和关系嵌入的融合;通过引入属性三元组和关系三元组的语义量化信息和结构量化信息来对实体进行建模,捕获了知识图谱中实体的语义特征和结构特征,提高了跨语言实体对齐的性能。
-
公开(公告)号:CN116110588A
公开(公告)日:2023-05-12
申请号:CN202211452111.7
申请日:2022-11-21
Applicant: 北京理工大学
IPC: G16H50/50 , G06F18/214 , G06N3/0464
Abstract: 本发明涉及一种基于动态邻接矩阵和时空注意力的医学时间序列预测方法,属于大数据挖掘和医学人工智能数据预测技术领域。该方法对于疾病暴露人口数医学时间序列历史数据,构建静态空间邻接矩阵捕获空间外部数据,构建动态时间邻接矩阵挖掘疾病暴露人口数在时间维度上的关联特征,利用时空注意力机制融合静态空间邻接矩阵和动态时间邻接矩阵,采用图卷积神经网络和门控循环单元框架来预测未来时间步的疾病暴露人口数。本发明引入空间外部数据,学习动态时间邻接矩阵,引入时空注意力机制,能够捕获发病地区之间空间相关性,疾病暴露人口数在时间维度上的关联特征,实现时空信息相关性的融合,从提高医学时间序列预测方法的性能。
-
公开(公告)号:CN114139522A
公开(公告)日:2022-03-04
申请号:CN202111319941.8
申请日:2021-11-09
Applicant: 北京理工大学
IPC: G06F40/194 , G06F40/289 , G06K9/62 , G06N3/04 , G06V30/41 , G06V30/413 , G06F16/35
Abstract: 本发明涉及一种基于层级注意力和标签引导学习的关键信息识别方法,属于文本挖掘和信息处理技术领域。本发明采用基于层级注意力和标签引导学习融合的关键信息识别框架,将文本表示模型直接应用于文本挖掘的局限性,词编码层和句编码层能够充分捕捉文本组织结构,将重要单词聚合为句子向量,然后将重要句子向量聚合为文本向量;词注意力层和句注意力层将注意力机制分别用于单词和句子层面,使其能够在文本表示时区别关注更重要或者次重要的内容;采用标签引导学习层执行基于标签的注意力编码,将文本表示映射到标签空间,标签引导学习层可以直接与上下文编码一起联合学习。本发明在引文分析、信息检索和细粒度知识服务等领域,具有广阔的应用前景。
-
公开(公告)号:CN108108354A
公开(公告)日:2018-06-01
申请号:CN201711380014.0
申请日:2017-12-20
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于深度学习的微博用户性别预测方法,属于Web挖掘和智能信息处理领域。该预测方法包括:微博信息采集;微博文本预处理;构建微博文本词语的词向量;采用一种基于卷积神经网络的微博文本表示方法来构建微博文本句子的特征向量;采用一种基于长短期记忆网络模型的方法进行微博用户的性别预测或分类。基于卷积神经网络的微博文本表示方法不需要人工构建微博文本特征,能够实现对微博文本的语义建模。基于长短期记忆网络的微博用户性别预测方法能够提取微博文本中的语义序列依赖关系特征。本发明的微博用户性别预测方法准确地提取了微博文本特征,提高了微博用户性别的识别性能,在信息推荐、产品营销领域具有广阔的应用前景。
-
公开(公告)号:CN103778215B
公开(公告)日:2016-08-17
申请号:CN201410023154.2
申请日:2014-01-17
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于情感分析和隐马尔科夫模型融合的股市预测方法,包括以下步骤:信息采集:针对新浪网财经新闻网页,利用网络爬虫Heritrix采集财经新闻网页;信息预处理:对财经新闻网页进行正文抽取、分词、词性标注,以及停用词和标点符号过滤;语料构建:构建股票领域相关语料库;情感分析:对股票领域相关语料进行情感分析;股市技术分析:获取股市技术分析指标;采用基于情感分析和隐马尔科夫模型融合的预测方法预测股市走向。本发明通过利用财经新闻网页中的情感倾向性信息,提高了股市预测的准确性,在倾向性分析、主题检测、股市预测、网络内容监控等领域具有广阔的应用前景。
-
公开(公告)号:CN103440308B
公开(公告)日:2016-08-10
申请号:CN201310377050.7
申请日:2013-08-27
Applicant: 北京理工大学
IPC: G06F17/30
Abstract: 本发明涉及一种数字论文检索方法,特别涉及一种基于形式概念分析的数字论文检索方法,属于数据挖掘领域。本发明提出的论文检索方法,通过“排序隔选”的方式,缩减了构建和搜索概念格的规模和时间,然后将其他被缩减论文附属于被选论文,较大的消除了结果丢失的影响,同时通过概念格的粗糙近似检索机制,解决了论文检索时检索结果过于分散和庞大的问题,同时又能够保证检索结果的召回率和精确度。该方法针对大规模数据提出了一种可用的基于形式概念分析的检索模式。
-
公开(公告)号:CN101968809B
公开(公告)日:2012-06-06
申请号:CN201010520341.3
申请日:2010-10-27
Applicant: 北京理工大学
IPC: G06F17/30
Abstract: 本发明涉及一种基于MCMC的优化信息检索方法,包括以下步骤:一、设定初始并行链数目n,根据检索数据生成n条Markov链;设定总迭代次数s;二、根据对效率和结果准确率的要求,设定最小距离值;三、设定预迭代次数m,对步骤一中的n条Markov链进行分段预迭代,得到每两条链之间的距离值。四、进行判断,判断任意两条链之间的距离值是否小于或者等于所设定的最小距离值;五、假如结果是,就将进行比较的这两条链合并看作一条链;六、判断迭代次数是否小于s,如果是则继续进行迭代,并在迭代完成时回到步骤四;否则停止迭代,通过该迭代后的Markov链可以决定遍历检索数据的路径。本发明在兼顾全局搜索准确率的同时保证一定的搜索效率,减轻硬件的负担。
-
公开(公告)号:CN101499058A
公开(公告)日:2009-08-05
申请号:CN200910078879.0
申请日:2009-03-05
Applicant: 北京理工大学
IPC: G06F17/27
Abstract: 本发明涉及一种基于类型论的汉语分词方法,属于计算机应用技术领域。本发明吸收逻辑学中类型论的思想,并在此理论框架下,通过给出相关概念的定义、进行汉语全类型设计、构造词典、对输入的句子进行全切分、识别前后缀类型、未登录词、交叉歧义字段、组合歧义字段、执行合并算法、执行类型函数贴合算法、统计校正并输出结果这样的一个过程实现了基于类型论的汉语分词。本发明使未登陆词识别和交叉歧义、组合歧义消解这两大汉语分词的瓶颈问题在同一理论框架下得到一定解决,同时使句法层面的交叉歧义、组合歧义和语义层面的真歧义也在同一理论框架下得到一定解决,并大大提高了未登陆词识别和歧义字段识别的准确率。
-
公开(公告)号:CN116049349A
公开(公告)日:2023-05-02
申请号:CN202211452106.6
申请日:2022-11-21
Applicant: 北京理工大学
IPC: G06F16/33 , G06F16/332 , G06F40/216 , G06F40/211 , G06F40/30 , G06N3/0442
Abstract: 本发明涉及一种基于多层次注意力和层次类别特征的小样本意图识别方法,属于自然语言处理和问答系统技术领域。第一,引入词级、短语级、语义角色级别的三层注意力机制,从词频、反文档频率、类内分布均匀度、类间分布均匀度共四个角度融合层次类别特征,计算混合特征因子,充分挖掘不同层次、不同粒度、不同角度的文本特征,能够有效提升小样本意图识别的准确率。第二,不同于对样本表示取均值生成类别表示的方法,本发明基于胶囊网络中动态路由的思想,学习样本表示和类别表示之间的非线性映射关系,提高从样本中归纳学习类别表示的能力。
-
公开(公告)号:CN113255755B
公开(公告)日:2022-08-23
申请号:CN202110538947.8
申请日:2021-05-18
Applicant: 北京理工大学
Abstract: 本发明公开了一种基于异质融合网络的多模态情感分类方法,属于意见挖掘和情感分析技术领域。包括:1)视频数据预处理;2)构建文本特征向量和识别文本情感类别;3)构建图片特征向量和识别图片情感类别;4)构建音频特征向量和识别音频情感类别;5)构建多模态全局特征向量与识别多模态全局情感类别;6)构建多模态局部特征向量与识别多模态局部情感类别;7)采用投票策略获得最终的情感分类结果。异质融合网络采用了模态内融合和模态间融合两种融合形式,宏观和微观两种融合角度,以及特征层融合和决策层融合两种融合策略。所述方法能深度挖掘多模态数据之间隐含的关联信息,实现多模态数据之间的相互补充和融合,从而提高多模态情感分类的准确率。
-
-
-
-
-
-
-
-
-