一种基于主动学习的回归分析系统及方法

    公开(公告)号:CN103514369A

    公开(公告)日:2014-01-15

    申请号:CN201310430125.3

    申请日:2013-09-18

    Inventor: 蔡文彬 张娅

    Abstract: 本发明提供了一种基于主动学习的回归分析系统及方法,其中:数据采集模块收集回归学习所需的未标注数据,并进行预处理;训练集构建模块构建回归学习所需的训练数据,包括:初始阶段,从存储的未标注数据中随机挑选部分样本进行人工标注,构建初始训练集。迭代阶段,调用回归学习模块已经构建的回归模型,执行主动学习方法选择最有信息的样本进行标注,扩展已有的训练集;将标注后的数据存于存储模块;回归学习模块调用数据存储模块中的有标注的数,训练回归模型;上述训练集构建模块和回归学习模块,交互迭代进行;预测模块在主动学习迭代结束后,调用回归学习模块建立的回归模型,对因变量进行预测。本发明可以提高回归系统的数据分析的准确性。

    基于少量样本生成的任意风格和内容的迁移方法和系统

    公开(公告)号:CN107767328A

    公开(公告)日:2018-03-06

    申请号:CN201710957685.2

    申请日:2017-10-13

    CPC classification number: G06T3/0012 G06N3/0454 G06N3/08

    Abstract: 本发明提供一种基于少量样本生成的任意风格和内容的迁移方法和系统,包括:风格特征提取步骤:对风格参考图像,使用深度卷积神经网络提取图像的风格特征;内容特征提取步骤:对内容参考图像,使用深度卷积神经网络提取图像的内容特征;风格和内容特征结合步骤:将提取的风格特征和内容特征通过双线性模型相结合,得到目标图像的特征;目标图像生成步骤:对目标图像的特征经过反卷积神经网络生成目标图像。本发明将风格和内容分离开,实现任意目标风格任意目标内容的图像生成,能够迁移到没见过的风格和没见过的内容上,提取没见过的风格和内容的特征。本发明只需少量的参考图像,风格特征和内容特征可从少量数据中学得。

    一种基于机器学习的排序系统

    公开(公告)号:CN103530321B

    公开(公告)日:2016-09-07

    申请号:CN201310429873.X

    申请日:2013-09-18

    Inventor: 蔡文彬 张娅

    Abstract: 本发明提供了一种基于机器学习的排序系统,其中:数据收集和数据预处理模块收集所需排序学习的数据;训练集构建模块包括:初始阶段,从存储的海量未标注查询‑文本数据,随机挑选部分样本按照相关性人工标注,构建初始训练集;迭代阶段,调用排序学习模块并依据已构建的排序模型,执行选样算法,从未标注数据中选择最有信息的样本,进行相关性标注。将标注后的数据存于存储模块;排序学习模块构建排序模型;训练集构建模块和排序学习模块交互迭代进行;预测排序模块调用排序模型,对用户输入的查询,检索其相应的文本预测相关性,并按照相关性大小进行排序。本发明可以提高排序系统对检索结果的排序准确性,更好的展现检索结果,满足用户需求。

    一种基于机器学习的排序系统

    公开(公告)号:CN103530321A

    公开(公告)日:2014-01-22

    申请号:CN201310429873.X

    申请日:2013-09-18

    Inventor: 蔡文彬 张娅

    CPC classification number: G06F17/30705

    Abstract: 本发明提供了一种基于机器学习的排序系统,其中:数据收集和数据预处理模块收集所需排序学习的数据;训练集构建模块包括:初始阶段,从存储的海量未标注查询-文本数据,随机挑选部分样本按照相关性人工标注,构建初始训练集;迭代阶段,调用排序学习模块并依据已构建的排序模型,执行选样算法,从未标注数据中选择最有信息的样本,进行相关性标注。将标注后的数据存于存储模块;排序学习模块构建排序模型;训练集构建模块和排序学习模块交互迭代进行;预测排序模块调用排序模型,对用户输入的查询,检索其相应的文本预测相关性,并按照相关性大小进行排序。本发明可以提高排序系统对检索结果的排序准确性,更好的展现检索结果,满足用户需求。

    一种基于主动学习的回归分析系统及方法

    公开(公告)号:CN103514369B

    公开(公告)日:2016-07-06

    申请号:CN201310430125.3

    申请日:2013-09-18

    Inventor: 蔡文彬 张娅

    Abstract: 本发明提供了一种基于主动学习的回归分析系统及方法,其中:数据采集模块收集回归学习所需的未标注数据,并进行预处理;训练集构建模块构建回归学习所需的训练数据,包括:初始阶段,从存储的未标注数据中随机挑选部分样本进行人工标注,构建初始训练集。迭代阶段,调用回归学习模块已经构建的回归模型,执行主动学习方法选择最有信息的样本进行标注,扩展已有的训练集;将标注后的数据存于存储模块;回归学习模块调用数据存储模块中的有标注的数,训练回归模型;上述训练集构建模块和回归学习模块,交互迭代进行;预测模块在主动学习迭代结束后,调用回归学习模块建立的回归模型,对因变量进行预测。本发明可以提高回归系统的数据分析的准确性。

    面向搜索排序的基于噪声注入主动学习的样本选取方法

    公开(公告)号:CN102446223A

    公开(公告)日:2012-05-09

    申请号:CN201110448550.6

    申请日:2011-12-28

    Inventor: 蔡文彬 张娅

    Abstract: 本发明公开一种面向搜索排序的基于噪声注入主动学习的样本选取方法,对未标注样本采用噪声注入生成噪声样本,利用训练集训练出的排序模型对噪声样本进行预测,得到样本在当前排序模型下的分数分布,利用分数分布转换成排序分布,用DCG的方差度量排序分布表征不确定度,利用不确定度进行样本选样。本发明可在搜索排序问题中样本不足的条件下进行有效的选样,实现用更少的样本更有效的提升模型性能,从而达到减少样本标注代价的目的。

Patent Agency Ranking