一种基于互信息的数据离散化与特征选择集成方法及装置

    公开(公告)号:CN106407304A

    公开(公告)日:2017-02-15

    申请号:CN201610772796.1

    申请日:2016-08-30

    CPC classification number: G06F16/2474 G06F16/2465

    Abstract: 本发明公开了一种基于互信息的数据离散化与特征选择集成方法。本方法为:1)通过对数据进行断点分析,生成合适的候选断点集;2)采用前向搜索在候选断点集上寻找最优断点子集,对断点子集的评价通过计算其对数据进行划分的结果和数据的原始标签分布之间的互信息实现;3)搜索停止条件为信息增益比小于预设阈值或所选断点总数超过预设阈值;4)使用最优断点子集对数据进行离散化和特征选择。本发明还公开了一种基于互信息的数据离散化与特征选择集成装置。本发明中基于互信息的数据离散化与特征选择集成方法及装置将数据离散化与特征选择两个过程有机地集成在一起,能够有效去除数据中的无关和冗余信息,提高后续学习算法的性能。

    针对Intel移动平台的实时AVS软编码方法

    公开(公告)号:CN104168481A

    公开(公告)日:2014-11-26

    申请号:CN201410355678.1

    申请日:2014-07-24

    Applicant: 北京大学

    Abstract: 本发明公开了一种针对Intel移动平台的实时AVS软编码方法。本方法为:1)AVS编码器检测当前待编码宏块的类型,调用相应的I帧编码单元或P帧编码单元进行编码;2)在进行I帧宏块编码时,通过利用预测模式的匹配代价均值作为阈值实现预测模式遍历的提前终止;3)在进行P帧宏块编码时,通过利用匹配代价的最小值来作为阈值实现参考帧和预测模式遍历的提前终止。在计算当前宏块和预测宏块之前的匹配代价(SAD值)时,采用Intel移动平台特有的SSE指令技术实现。本发明大大提高了处理器利用率,实现了每秒10帧的视频采集和编码。

    基于元路径去噪与胶囊网络建模的企业违约预测方法及系统

    公开(公告)号:CN120069518A

    公开(公告)日:2025-05-30

    申请号:CN202510009804.6

    申请日:2025-01-03

    Applicant: 北京大学

    Abstract: 本发明公开一种基于元路径去噪与胶囊网络建模的企业违约预测方法及系统,属于机器学习领域。所述方法包括:采集企业的内部指标信息与外部关联信息,并依据企业的外部关联信息构建企业的异质信息网络与元网络;构建能够平衡迁移性与噪声干扰,并且有效分离企业违约风险和守约无风险信息,提高违约识别准确性的企业违约评估模型;在构建的企业违约评估模型中,训练采集到的企业各种内部经营信息、构建的企业异质信息网络与元网络,得到训练好的模型权重;采集真实业务中的企业内部经营与外部关联信息,并输入构建的企业违约评估模型,使用训练好的模型权重,对真实业务中的企业违约可能性进行评估。本发明可以实现更加准确的企业违约风险识别。

    一种基于间隔优化的集成学习方法及装置

    公开(公告)号:CN108090510A

    公开(公告)日:2018-05-29

    申请号:CN201711345271.0

    申请日:2017-12-15

    CPC classification number: G06K9/6227 G06K9/6256

    Abstract: 本发明公开了一种基于间隔优化的集成学习方法及装置。其中,所述方法包括:1)得到一组训练好的基分类器;2)获取基分类器对所有训练样本的预测值;3)通过最优化集成模型间隔的分布来优化每个基分类器的权重;4)使用优化后的权重对样本的预测值进行加权平均,从而得到最终的预测值和标记。本发明还公开了一种基于间隔优化的集成学习装置。本发明中基于间隔优化的集成学习方法及装置不依赖于具体的基分类算法,可以针对分类误差或AUC进行优化,且整个模型易于求解,具有十分广泛的适用性。在优化权重时通过引入了间隔来平衡准确性和多样性,可以有效的避免过拟合问题,并提高最终集成模型的预测效果。

    一种基于人才流动分析的学校排名方法及装置

    公开(公告)号:CN106845865A

    公开(公告)日:2017-06-13

    申请号:CN201710104626.0

    申请日:2017-02-24

    CPC classification number: G06Q10/0639 G06Q50/205

    Abstract: 本发明公开了一种基于人才流动分析的学校排名方法。本方法为:对学历进行分类,统一分类为“本科”、“硕士”、“博士”和“其他”;提取每一段求学经历的开始时间和毕业时间,并与该经历对应的学历进行匹配;对学校按照985、211以及其他高校进行分类;统计升造跳转对应的学校跳转情况;根据跳转情况计算学校之间的支持度;根据学校分类初始化各学校得分;根据学校之间的人才流动网络图进行迭代分析以计算各学校得分;根据最终状态下各学校的得分对学校进行排名。本发明还公开了一种基于人才流动分析的学校排名装置。本发明中的学校排名方式,以学生实际的择校选择作为学校排名依据,通过迭代分析学校间不同学历状态的人才流动情况对学校进行排名。

    一种启发式的工作岗位分级方法及装置

    公开(公告)号:CN106447165A

    公开(公告)日:2017-02-22

    申请号:CN201610773434.4

    申请日:2016-08-30

    CPC classification number: G06Q10/063 G06Q10/10

    Abstract: 本发明公开了一种启发式的工作岗位分级方法。本方法为:确定岗位分级层数;获取每一级工作岗位的特征属性;通过训练集工作岗位特征生成分级规则;利用训练集生成的分级规则,对待分级的工作岗位进行分级处理。本发明还公开了一种启发式的工作岗位分级装置。本发明中启发式的工作岗位分级方法及装置通过将工作岗位进行关键词提取并与分级规则匹配,采取关键词的经验规则来判断工作岗位的级别,可以在保证工作岗位分级正确性的前提下提高分级的效率,解决了互联网这类新兴行业的工作岗位分级困难和效率低的问题。

    一种基于人才流动迭代模型的企业排名方法及装置

    公开(公告)号:CN106372790A

    公开(公告)日:2017-02-01

    申请号:CN201610769693.X

    申请日:2016-08-30

    CPC classification number: G06Q10/0637

    Abstract: 本发明公开了一种基于人才流动迭代模型的企业排名方法。本方法为:1)对工作岗位进行分级处理;2)对数据集中的企业名称进行统一映射处理;3)在此基础上,对不同企业、不同岗位级别之间的人员流动情况进行统计分析,建立人才流动统计表;4)根据人才流动统计表对人才流动迭代模型进行初始化;5)应用人才流动迭代模型迭代操作,包括:根据企业间的人才流动、市场人才的流失与补偿,通过网络迭代分析法计算各家企业的得分,直至网络达到稳定状态或者迭代次数达到设定阈值时停止迭代;6)根据最终状态下各企业的得分对企业进行排名。本发明还公开了一种基于人才流动迭代模型的企业排名装置。本发明中的企业排名方式,以市场上人才的流动行为作为企业排名的依据,通过迭代不同企业间不同工作级别的人才流动情况对企业进行排名。

    数据离散化的方法及装置
    18.
    发明公开

    公开(公告)号:CN106296245A

    公开(公告)日:2017-01-04

    申请号:CN201510271649.1

    申请日:2015-05-25

    Abstract: 本发明实施例公开了一种数据离散化方法,包括:接收输入的有序排列的样本集,获取预设的有序排列的初始离散格式;获取预设的类别集合,遍历所述获取到的类别集合中的类别值,获取所述样本集在遍历到的类别值下的在所述初始离散格式中的起始阈值到每个阈值的积分区间的第一样本数,生成积分矩阵;迭代获取所述初始离散格式中的阈值集合的子集,查找所述遍历到的子集中的两两相邻的阈值构成的取值区间,根据所述积分矩阵获取所述每个查找到的取值区间对应的在每个类别值下的第二样本数和在所有类别值下的第三样本数,根据积分矩阵、所述取值区间对应的第二样本数和第三样本数以及所述类别集合计算所述遍历到的子集对应的区分度;查找区分度最大的子集,将所述查找到的区分度最大的子集作为目标离散格式输出。本发明还公开了一种数据离散化装置。本发明中数据离散化方法及装置可以减少计算复杂度,提高执行效率。

    数据离散化的方法及装置
    19.
    发明公开

    公开(公告)号:CN106296244A

    公开(公告)日:2017-01-04

    申请号:CN201510271647.2

    申请日:2015-05-25

    Abstract: 本发明实施例公开了一种数据离散化方法,包括:接收输入的有序排列的样本集,获取预设的有序排列的初始离散格式;获取预设的类别集合,遍历所述获取到的类别集合中的类别值,获取所述样本集在遍历到的类别值下的在所述初始离散格式中的起始阈值到每个阈值的积分区间的第一样本数,生成积分矩阵;根据所述积分矩阵计算初始离散格式中各个阈值构成的取值区间的区分度;迭代查找区分度最大且不为预设的特征值的取值区间,将所述区分度最大的取值区间对应的阈值添加到目标离散格式中,并将所述区分度最大的取值区间中包含的各个子区间对应的区分度设为所述特征值,直至所有取值区间的区分度均为所述特征值,输出所述目标离散格式。本发明还公开了一种数据离散化装置。本发明中数据离散化方法及装置可以减少计算复杂度,提高执行效率。

    一种分水岭图象分割处理方法

    公开(公告)号:CN100505884C

    公开(公告)日:2009-06-24

    申请号:CN200710120550.7

    申请日:2007-08-21

    Abstract: 本发明公开了一种分水岭图像分割处理方法,其主要分三步完成,即分水岭算法的前处理过程,滤掉不必要的噪声点;分水岭处理过程,对象素点进行排序和标号扩展;分水岭后处理过程,来减小过渡分割的影响;该方法速度比VINCENT-SOILLE方法快2倍,分割效果与其相当,同时保留了大部分对图像分割有益的信息,因此在对分割时间有严格限制的场合中,尤其在实时视频对象提取中,会有较大的应用价值。

Patent Agency Ranking