-
公开(公告)号:CN114942977A
公开(公告)日:2022-08-26
申请号:CN202210599144.8
申请日:2022-05-30
Applicant: 北京邮电大学
IPC: G06F16/33 , G06F16/35 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明是一种基于支持句预测的多任务文档级关系抽取方法及装置,属于计算机自然语言处理中信息抽取技术领域。本发明装置包括文档预处理模块,预训练语言模型,图网络编码模块,图传播模块,支持句识别模块和关系分类模块。本发明方法包括:将文档分句、预处理;以句子为单位使用预训练语言模型进行编码;根据文档结构和预定规则构建图网络;对图网络进行卷积操作;寻找实体对的支持句,获取关系推理路径;对实体对进行关系分类;预先将寻找实体对的前馈神经网络与关系分类的全连接神经网络一起训练。本发明提高了对复杂语境下文档的实体关系的挖掘,及文档级关系的抽取效率,能进一步帮助实现信息抽取、自动问答等多种NLP任务的准确性。
-
公开(公告)号:CN106991141B
公开(公告)日:2020-12-11
申请号:CN201710170549.9
申请日:2017-03-21
Applicant: 北京邮电大学 , 首都信息发展股份有限公司
IPC: G06F16/2458
Abstract: 本发明是一种基于深度剪枝策略的关联规则挖掘方法,用于对大数据集进行关联规则挖掘。本方法借鉴了基于压缩矩阵的Apriori算法的思想,对1‑频繁项集并不按照支持度计数进行排序,而是直接按照值大小对布尔矩阵内的向量进行排序,以确定之后的频繁项集连接的相对顺序;对k‑频繁项集根据事务长度进行压缩,删掉长度小于k的事务;根据项跟位置关系对k‑频繁项集进行剪枝,对于首项为I的k‑频繁项集的前k‑1项,位置在i的项出现的次数必须大于等于k‑i。本发明相对于MTCA算法,处理时间要短很多,并且在支持度较低的情况下比Apriori标准方法节约大量的时间,从大数据集获取关联规则的效率更高。
-
公开(公告)号:CN104866596B
公开(公告)日:2018-09-14
申请号:CN201510290451.8
申请日:2015-05-29
Applicant: 北京邮电大学
Abstract: 本发明实施例提供了一种基于自动编码器的视频分类方法及装置。该方法中,获得具有三种模态数据的目标视频的每一种模态数据的低级表示内容;将每一种模态数据的低级表示内容分别输入至堆叠的自动编码器组处理,获得每一种模态数据的高级表示内容;将每两种模态数据的高级表示内容的组合结果分别输入至双模态融合器处理,获得相应两种模态数据的双模态公共表示内容;将双模态公共表示内容的组合结果输入至三模态融合器处理,获得三模态公共表示内容;将三模态公共表示内容输入至有监督分类模型处理,以获得各个视频类别的类别标签,并确定目标视频所对应的视频类别。可见,通过本方案可以结合目标视频的三种模态数据对目标视频进行分类。
-
公开(公告)号:CN106991141A
公开(公告)日:2017-07-28
申请号:CN201710170549.9
申请日:2017-03-21
Applicant: 北京邮电大学 , 首都信息发展股份有限公司
IPC: G06F17/30
CPC classification number: G06F16/2465
Abstract: 本发明是一种基于深度剪枝策略的关联规则挖掘方法,用于对大数据集进行关联规则挖掘。本方法借鉴了基于压缩矩阵的Apriori算法的思想,对1‑频繁项集并不按照支持度计数进行排序,而是直接按照值大小对布尔矩阵内的向量进行排序,以确定之后的频繁项集连接的相对顺序;对k‑频繁项集根据事务长度进行压缩,删掉长度小于k的事务;根据项跟位置关系对k‑频繁项集进行剪枝,对于首项为I的k‑频繁项集的前k‑1项,位置在i的项出现的次数必须大于等于k‑i。本发明相对于MTCA算法,处理时间要短很多,并且在支持度较低的情况下比Apriori标准方法节约大量的时间,从大数据集获取关联规则的效率更高。
-
公开(公告)号:CN104462485A
公开(公告)日:2015-03-25
申请号:CN201410797791.5
申请日:2014-12-18
Applicant: 北京邮电大学
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06F17/30023
Abstract: 本发明提出了一种基于对应的深层信念网络的跨模态检索方法,该方法包括:利用特征提取方法分别获得检索目标与检索库中每一个检索成员的初级向量;检索目标的初级向量分别与检索库中每一个检索成员的初级向量,通过对应的深层信念网络获得检索目标的高级向量和检索库中每一个检索成员的高级向量;利用检索目标的高级向量和检索库中每一个检索成员的高级向量计算检索目标与检索库中每一个检索成员的距离;将检索库中与检索目标距离最近的至少一个检索成员确定为与检索目标匹配的对象。
-
公开(公告)号:CN109191276B
公开(公告)日:2021-10-29
申请号:CN201810789859.3
申请日:2018-07-18
Applicant: 北京邮电大学
Abstract: 本发明提出一种基于强化学习的P2P网络借贷机构风险评估方法,属于网络大数据处理及电子信息技术领域。包括:首先,采集P2P网贷企业的公司简介文本信息,进行分词;然后,对所有文档的词,使用信息增益提取关键词;其次,使用Max‑min ACLA算法构造强化学习模型;在强化学习模型的训练过程中,采用动态改变权重的方法更新样本权重;最后,利用训练好的强化学习模型对待评估机构进行风险评估。本发明采用了强化学习模型来解决文本分类数据少且数据不平衡的问题,同时通过动态更新样本权重的方法加快模型训练的收敛速度,节省了大量时间,使其具有更强的实用性。本发明针对公司简介文本提取关键词特征,非常易于实现。
-
公开(公告)号:CN112860862A
公开(公告)日:2021-05-28
申请号:CN202110133448.0
申请日:2021-02-01
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F16/33 , G06F16/35
Abstract: 本申请公开了一种人机对话中智能体对话语句的生成方法和装置,其中方法包括:利用预先训练的自然语言理解模型,从当前人机对话的对话历史数据中,提取预设知识库中的属性值和场景类别;其中,所述知识库由知识三元组构成;基于所述属性值和所述场景类别,从所述知识库中筛选出相关的知识三元组,得到候选知识子集;基于所述对话历史数据和所述候选知识子集,利用预先训练的对话生成模型,为智能体生成当前的响应语句并输出。采用本发明,可以支持多任务场景的人机对话。
-
公开(公告)号:CN109472277A
公开(公告)日:2019-03-15
申请号:CN201710808021.X
申请日:2017-09-08
Abstract: 本公开涉及一种借贷方分类的方法、装置以及存储介质,包括:获取多个借贷方的数据样本对应多个预设类型在不同维度下的第一待确定向量,从多个数据样本对应的第一待确定向量中确定相同类型和相同维度的第二待确定向量,根据第二待确定向量训练预设分类模型得到第一分类结果、特征向量和特征向量对应的第一目标分类模型,且从第一分类结果中获取特征向量对应的第二分类结果,根据第二分类结果得到每个数据样本的目标分类集合,并通过每个目标分类集合训练预设分类模型得到第二目标分类模型,获取待分类借贷方的目标数据,将目标数据作为第一目标分类模型的输入得到待确定分类结果,并将待确定分类结果作为第二目标分类模型的输入得到目标分类结果。
-
公开(公告)号:CN108919218A
公开(公告)日:2018-11-30
申请号:CN201810579989.4
申请日:2018-06-07
Applicant: 北京邮电大学
IPC: G01S7/41
Abstract: 本发明提供一种非接触式车内人数及位置判断的方法及装置,用以判断车辆是否超载。其方法包括以下步骤:步骤1,使用安装在车内的脉冲超宽带雷达持续对车内乘坐者变化进行监测,并对获取到的雷达回波信号进行去除杂波预处理得到人体体动信号;步骤2,基于雷达矩阵的稳定性增强位置信息,并根据雷达与车内座位的位置距离以及人体反射面积分解不同检测区间,分区间提取信号特征;步骤3,分析雷达特征并结合机器学习算法进行车内人数及位置的判断,分析结果用以判断车辆是否超载。非接触式车内人数及位置判断的装置包括基于脉冲超宽带雷达的获取模块、处理模块和检测模块。本发明通过脉冲超宽带雷达能够无接触地获取车内人数以及位置信息,且对于小型及中型轿车只需要单个脉冲超宽带雷达即可实现。与现有技术相比,本发明具有低功耗、无接触、隐私性良好等优点。
-
公开(公告)号:CN104462489B
公开(公告)日:2018-02-23
申请号:CN201410800393.4
申请日:2014-12-18
Applicant: 北京邮电大学
Abstract: 本发明提出了一种基于深层模型的跨模态检索方法,该方法包括:利用特征提取方法分别获得目标检索模态与检索库中每一个被检索模态的低级表达向量;目标检索模态的低级表达向量分别与检索库中每一个被检索模态的低级表达向量,通过堆叠对应的受限波尔兹曼机Corr‑RBMs深层模型获得目标检索模态的高级表达向量和检索库中每一个被检索模态的高级表达向量;利用目标检索模态的高级表达向量和检索库中每一个被检索模态的高级表达向量计算目标检索模态与检索库中每一个被检索模态的距离;将检索库中与目标检索模态距离最近的至少一个被检索模态确定为与目标检索模态匹配的对象。
-
-
-
-
-
-
-
-
-